• 대한전기학회
Mobile QR Code QR CODE : The Transactions of the Korean Institute of Electrical Engineers
  • COPE
  • kcse
  • 한국과학기술단체총연합회
  • 한국학술지인용색인
  • Scopus
  • crossref
  • orcid




Representative Solar Profile, Time Series Aggregation, Optimism Bias, Quantile-based Optimization, Power System Planning

1. 서 론

최근 전력 계통은 탄소중립 실현을 위한 재생에너지 확대 정책에 따라 태양광 발전(PV)의 비중이 비약적으로 증가하고 있다[1]. 하지만 태양광 발전은 기상 조건에 따른 변동성과 간헐성이 커, 계통의 안정적인 운영과 설비 계획 수립에 있어 불확실성을 가중시키는 주요 요인이 되고 있다. 특히 장기 전력 수급 계획이나 에너지저장장치(ESS)의 최적 용량 산정과 같은 거대 규모의 최적화 문제에서는 연산 효율성을 위해 전 기간(8,760시간)의 시계열 데이터 대신, 해당 지역의 발전 특성을 함축한 대표일을 선정하여 활용하는 것이 필수적이다[2-4].

기존의 대표일 선정 연구들은 주로 K-means 등의 군집화 알고리즘이나 산술 평균을 통해 전체적인 형태 유사성을 확보하는 데 집중해 왔다. 그러나 이러한 통계적 중심치 기반의 방법론은 태양광 출력의 국부적 변동성을 평활화함으로써, 일부 시간대에서 반복적으로 실제 발전 가능량을 초과하는 대표값을 형성하게 되며, 이는 장기 수급 계획이나 설비 용량 산정 시 계통의 예비력 확보를 낙관적으로 판단하게 만드는 요인이 된다[5]. 최근 연구에서는 대표 period의 선택과 가중치를 최적화 기반으로 결정하는 방법[6], deep generative model을 활용하여 재생에너지 연계 계통의 대표 period를 도출하는 접근[7], 그리고 generation expansion planning 결과를 다시 representative day selection에 반영하는 closed-loop framework[8] 등 다양한 확장 연구가 제안되고 있다. 또한 대표일 선정이 실제 계통 운영 조건을 충분히 반영하지 못할 수 있다는 문제를 지적하고 planning-aware representative day selection을 수행하는 연구도 보고되고 있다[9]. 그럼에도 불구하고 이러한 연구들은 대부분 전체 시계열의 통계적 대표성이나 계획 오차 감소에 초점을 두고 있어, 대표 프로파일이 실제 발전 가능량을 반복적으로 초과하는 낙관적 추정의 발생 빈도 자체를 직접적으로 제어하는 메커니즘은 충분히 고려되지 못하였다.

국내 연구에서도 태양광 발전 패턴을 확률론적으로 구축하여 변동성을 반영하거나[10], 이를 바탕으로 특정 설비의 경제성을 분석하는 연구가 진행되어 왔다 [11]. 하지만 이러한 선행 연구들은 주로 평균적 혹은 확률적 분포의 재현에 초점을 맞추고 있어, 대표 프로파일이 실제보다 높게 산정될 경우 발생하는 계통의 신뢰도 저하와 예비력 부족 등 보수적 설계 관점에서의 엄격한 페널티 메커니즘은 충분히 다뤄지지 않았다.

이러한 비대칭적 불확실성을 제어하기 위해 통계학 일반 분야에서는 분위수 회귀(Quantile Regression)나 적정 점수화 규칙(Proper Scoring Rules)과 같이 특정 방향의 오차에 비대칭적 페널티를 부여하는 이론적 기법들이 제안된 바 있다[12-13]. 비록 이러한 통계 기법들이 불확실성 정량화의 수리적 토대를 제공하지만, 이를 전력 계통의 대표일 선정에 직접 적용하기에는 두 가지 한계가 존재한다. 첫째, [12-13]에서 다루는 손실함수는 주로 독립적인 개별 시점의 수치적 정확도에 치중되어 있어, 계통 해석에서 필수적인 24시간 시계열의 물리적 형태 유지를 보장하지 못한다. 둘째, 단순한 분위수 적용만으로는 계통 신뢰도 지표와 직결되는 장기적 관점의 과대산정 발생 빈도를 구조적으로 억제하기 어렵다.

본 연구는 이러한 통계적 원리를 계통 도메인에 특화하여, 다년도 시계열 가중 라이브러리와 낙관 빈도 페널티를 결합한 대표 프로파일 생성 기법을 제안한다. 본 논문에서의 보수성은 곡선의 절대 출력 수준을 일률적으로 하향하는 개념이 아니라, 시간대별 형상의 대표성을 유지한 상태에서 실제 관측치를 초과하는 낙관적 추정이 반복적으로 발생하는 빈도를 억제하는 의미로 정의된다. 즉, 제안 방법론은 분위수 개념을 도입하되, 대표곡선이 실제 관측치를 초과하는 오차의 크기뿐만 아니라 초과 빈도에 대해서도 가중 페널티를 부여하는 최적화 프레임워크를 구축하였다. 또한, 단일 연도 데이터의 특이성을 배제하기 위해 다년도 데이터를 가중 결합한 라이브러리를 활용하여 통계적 신뢰성을 확보하였다. 최종적으로, 제안 기법으로 도출된 보수적 대표곡선을 기존 모델과 비교하여 계통 설계 데이터로서의 적합성을 확인한다.

특히 본 연구의 핵심 기여는 기존 비대칭 손실함수가 오차의 크기(magnitude)에 대한 페널티를 중심으로 구성되는 것과 달리, 본 연구에서 제안하는 손실함수는 대표 프로파일이 실제 관측치를 초과하는 사건의 발생 빈도(frequency of optimistic overestimation)를 명시적으로 제어하도록 설계되었다는 점이다. 기존의 분위수 회귀 또는 비대칭 손실함수는 특정 시점에서의 오차 크기를 기준으로 보수성을 유도한다. 예를 들어, 낮은 분위수를 선택하는 경우 전체 분포의 하한을 추정하게 되지만, 이는 개별 시점의 값이 낮아지는 효과를 가져올 뿐, 특정 시간대에서 반복적으로 과대추정이 발생하는 구조적 패턴을 제어하지는 못한다.

반면, 본 연구에서 제안하는 손실함수는 오차의 크기뿐 아니라, 대표 프로파일이 실제 관측치를 초과하는 사건의 발생 빈도를 명시적으로 패널티로 반영한다. 이로 인해 최적화 과정은 단순히 값을 낮추는 방향이 아니라, “과대추정이 반복되는 시간대를 회피하는 방향”으로 작동하게 된다. 즉, 기존 방법이 개별 시점의 오차 분포를 조정하는 접근이라면, 본 연구는 시계열 전반에서의 구조적 과대추정 패턴을 제어한다는 점에서 근본적인 차이를 가진다. 이는 값의 위치(location)를 조정하는 접근에서 패턴의 빈도(frequency)를 제어하는 접근으로 확장되었다는 점에서 차별성을 갖는다.

2. 본 론

2.1 다년도 시계열 가중 라이브러리 구축

본 연구는 [10]의 공공데이터를 활용하여 전라남도 영암군 및 경기도 안산시 소재 태양광 발전소의 2017년부터 2022년까지의 운영 실적을 분석하였다. 발전량 데이터는 1시간 단위 시계열로 구성되며, 산출된 대표 프로파일의 통계적 안정성과 재현성을 검증하기 위해 2017년부터 2021년까지의 5년 치 데이터를 학습 구간(Training set)으로, 2022년 데이터를 검증 구간(Test set)으로 설정하였다.

수집된 원시 데이터에는 계측기 오류나 단위 기입 실수로 인한 이상치가 포함될 수 있으며, 이는 대표일 선정 과정에서 치명적인 왜곡을 유발한다. 따라서 본 연구에서는 설비 용량 대비 일일 최대 발전량 비율을 모니터링하여 데이터 품질을 확보하였다. 구체적으로 해당 비율이 임계치(3%) 미만인 상태가 30일 이상 지속될 경우 이를 단위 오기입으로 간주하여 스케일링 팩터로 보정하였으며, 야간 시간대의 미소한 노이즈 데이터는 0으로 처리하여 분석의 정확도를 제고하였다. 아울러, 본 연구에서 사용한 임계치(정격용량 대비 3%)와 지속 기간(30일)은, 단기 기상 변동이나 일시적 설비 이상에 따른 저출력 구간을 배제하고, 계절적·구조적 출력 저하만을 보정 대상으로 한 보수적 기준이다. 3% 임계치는 국내 태양광 발전 데이터에서 계측 잡음 및 일시적 출력 변동이 주로 분포하는 하한 영역을 기준으로 설명적으로 설정되었으며, 30일 지속 조건은 월 단위 발전 패턴 분석과의 일관성을 유지하기 위한 최소 기간으로 설정하였다. 본 전처리는 모델 성능 최적화를 위한 파라미터 조정이 아니라, 장기 저출력 상태로 인한 대표곡선 왜곡을 방지하기 위한 사전 보정 절차임을 강조한다.

전처리가 완료된 데이터는 설비 용량 및 계절적 일사량 차이에 의한 절대적 크기 편차를 내포하고 있다. 본 연구의 목적은 발전량의 절대량이 아닌 시간대별 변동 형태의 보수성을 평가하는 데 있으므로, 각 일일 발전 곡선을 해당 일의 총 발전량으로 나누는 에너지 정규화를 수행하였다. 특정일 $d$의 시간 $h$에서의 발전량을 $x_{d,h}$라고 할 때, 정규화된 발전량 $\bar{x}_{d,h}$는 (1)과 같이 정의된다. 이 과정을 통해 모든 일일 프로파일은 총량이 1인 확률 밀도 함수와 유사한 형태를 갖게 되며, 이를 통해 서로 다른 시점의 패턴을 동일한 척도에서 비교할 수 있다.

(1)
$\bar{x}_{d,h} = \frac{x_{d,h}}{\sum_{h=1}^{24} x_{d,h}}$

마지막으로, 단일 연도 데이터 사용 시 발생할 수 있는 기상이변(태풍, 장마 등)에 의한 편향을 완화하고 설비 노후화 및 최신 기상 경향을 반영하기 위해 다년도 가중 라이브러리를 구축하였다. 2017년부터 2021년까지의 데이터를 월별로 그룹화하되, 최근 연도 데이터에 더 높은 중요도를 부여하는 선형 가중 결합(Linear Weighting Scheme)을 적용하였다. 연도 집합 $Y=\{y_1, y_2, \dots, y_N\}$에 대하여, 각 연도 $y_i$에 부여되는 가중치 $\omega_{y_i}$는 (2)와 같이 산정된다.

(2)
$\omega_{y_i} = \frac{rank(y_i)}{\sum_{k=1}^{N} rank(y_k)}$

여기서, $rank(y_i)$는 해당 연도의 시간적 순위를 나타내며, 가장 오래된 2017년은 1, 가장 최근인 2021년은 5로 설정된다. 이러한 가중 라이브러리 구축을 통해 과거의 통계적 특성을 잃지 않으면서도 최신 운영 환경에 부합하는 대표 프로파일을 산출할 수 있는 기반을 마련하였다. 이는 개별 시점 예측 오차를 줄이는 일반적 회귀 문제와 달리, 대표 프로파일 산출에서는 24시간 형상 보존과 반복적 과대추정 억제가 동시에 요구되기 때문이다.

2.2 낙관 빈도 페널티 기반의 보수적 대표 프로파일 생성 기법

일반적으로 사용되는 평균(Mean)이나 중앙값(Median) 기반의 대표값 산출 방식은 오차의 총합을 0으로 수렴시키려는 통계적 특성을 갖는다. 이는 태양광 발전 특유의 급격한 출력 저하나 간헐적 변동성을 평활화하여, 결과적으로 대표 프로파일이 실제 발전 가능량을 과대평가하는 낙관적 편향(Optimism Bias)을 초래한다[5]. 계통 운영 관점에서 발전량의 과대평가는 예비력 확보 실패로 이어질 수 있는 위험 요소이므로, 본 연구에서는 오차의 크기뿐만 아니라 과대평가 발생 빈도를 동시에 억제하는 비대칭 손실함수를 제안한다.

먼저, 24시간 시계열 데이터에 대하여 대표 프로파일 벡터를 $R=[r_1, r_2, \dots, r_{24}]$, 실제 관측된 프로파일 벡터를 $X=[x_1, x_2, \dots, x_{24}]$라고 정의한다. 이 때 본 연구에서 제안하는 손실함수 $L(R, X)$는 (3)과 같이 과대 추정 오차($E_{over}$), 과소 추정 오차($E_{under}$), 그리고 과대 추정 빈도($P_{freq}$)의 가중 합으로 구성된다.

(3)
$L(R, X) = \lambda_{over} E_{over} + \lambda_{under} E_{under} + \gamma P_{freq}$

여기서 $E_{over}$, $E_{under}$, $P_{freq}$는 (4)~(6)과 같이 정의된다.

(4)
$E_{over} = \frac{1}{24} \sum_{h=1}^{24} \max(r_h - x_h, 0)$
(5)
$E_{under} = \frac{1}{24} \sum_{h=1}^{24} \max(x_h - r_h, 0)$
(6)
$P_{freq} = \frac{1}{24} \sum_{h=1}^{24} 1(r_h > x_h)$

(6)의 과대추정 빈도 패널티는 단일 시점의 오차 크기보다, 특정 시간대에서 과대추정이 구조적으로 반복되는 패턴을 억제함으로써, 대표 프로파일이 실제 발전 가능성을 지속적으로 초과하는 현상을 방지하는 역할을 한다. 본 연구에서는 해당 효과를 별도의 지표로 분리하여 제시하기보다는, 월별 손실지표와 빈도 패널티를 동시에 비교함으로써, 빈도 기반 제약이 전체 손실 감소로 연결되는지를 종합적으로 평가하였다. 본 연구에서는 계통 운영 관점에서 발전량의 과대평가가 과소평가보다 더 큰 위험을 초래할 수 있다는 점을 고려하여, 과대평가에 대한 페널티 가중치 $\lambda_{over}$를 과소평가 가중치 $\lambda_{under}$보다 크게 설정하여 대표 프로파일이 실제값을 초과하는 경향을 억제하도록 구성하였다($\lambda_{over}=5$, $\lambda_{under}=1$). 특히 기존 연구들과 달리 오차의 단순 크기뿐만 아니라 빈도항 $P_{freq}$에 추가적인 가중치 $\gamma=1$를 부여함으로써, 대표곡선의 보수성을 절대 출력 하향으로 정의하지 않고, 시간대별 과대추정 발생 빈도를 억제하는 의미로 정의하였다.

본 연구에서 사용한 $\lambda_{over}=5$, $\lambda_{under}=1$, $\gamma=1$은 특정 데이터셋에 대한 성능 최적화를 통해 도출된 값이라기보다, 과대추정 억제를 우선하되 과소추정 오차 역시 일정 수준 고려하도록 하는 보수적 설계 원칙을 반영하여 설정한 기준값이다. 즉, $\lambda_{over} > \lambda_{under}$의 비대칭 구조를 통해 과대추정 억제를 우선하도록 하고, $\gamma$는 오차의 크기뿐 아니라 과대추정 발생 빈도 역시 함께 고려하기 위한 항으로 도입하였다. 이러한 설정은 특정 파라미터 조합의 수치적 최적성을 주장하기보다는, 제안된 손실함수의 구조적 동작 특성을 확인하기 위한 기준 파라미터로서 사용되었다. 아울러, 가중치 변화에 따른 영향은 본 연구에서 제한된 범위의 민감도 분석을 통해 확인하였으나, 보다 체계적인 최적 파라미터 도출 및 광범위한 민감도 분석은 향후 연구에서 다룰 예정이다.

다음으로, 인위적인 곡선 합성으로 인한 물리적 특성 왜곡을 방지하기 위해, 실제 관측된 일일 발전량 분포를 기반으로 대표일 후보를 탐색하는 최적화 과정을 수행한다. 특정 월의 학습 데이터 집합 $D_{train}$에 대하여, 일일 총 발전량 기준 하위 $p$분위수($p \in P_{candidates}$)에 해당하는 날짜의 정규화된 프로파일을 후보군 $r_p$로 선정한다. 본 연구에서는 극단적인 저출력 일자에 의해 대표곡선이 과도하게 왜곡되는 것을 방지하고, 동시에 평균 및 중앙값 기반 접근과의 중복을 피하기 위해, 일일 발전량 기준 하위 5%에서 45% 사이의 분위수 구간을 후보 집합으로 설정하였으며, 이를 토대로 (3)의 손실을 최소화하는 최적 분위수 $p^*$를 (7)과 같이 도출한다. 다만, 본 연구는 $p$를 연속변수로 미분 최적화하지 않고, 후보 집합 $P_{candidates}$에 대해 완전탐색으로 $p^*$를 선택한다.

(7)
$p^* = \arg\min_{p \in P_{candidates}} \sum_{d \in D_{train}} L(r_p, x_d)$

최종적인 월별 대표 프로파일은 각 연도별로 독립적으로 도출된 최적 분위수 $p^*$에 해당하는 프로파일들을 앞서 2.1절에서 산출한 연도별 가중치 $\omega_y$로 결합하여 생성된다. 이러한 과정은 수학적 최적화를 통해 얼마나 보수적으로 설정해야 낙관적 편향을 최소화할 수 있는가를 데이터 기반으로 결정하게 하며, 결과적으로 계통 신뢰도를 담보할 수 있는 현실적인 대표 곡선을 제공한다.

2.3 사례 연구 및 결과 분석

본 절에서는 제안된 낙관 빈도 페널티 기반의 보수적 대표 프로파일 생성 기법의 유효성을 검증하기 위해, 2017년부터 2021년까지의 데이터를 학습 구간으로 사용하고 2022년 데이터를 검증 구간으로 사용하였다. 비교 방법으로는 기존의 평균(Mean) 및 중앙값(Median) 기반 대표 프로파일뿐만 아니라, 대표일 선정 문제에서 널리 사용되는 군집화 기반 접근의 대표적 예로서 K-means 기반 대표 프로파일을 추가하였다. 이는 본 연구의 목적이 최신 기법과의 단순 성능 비교보다는, 손실함수 구조에 따른 대표 프로파일의 특성 변화를 분석하는 데에 있기 때문이다. 아울러, 최근 제안된 최적화 기반 또는 딥러닝 기반 대표일 선정 기법들은 주로 전체 시계열의 통계적 재현성 또는 계획 오차 최소화를 목표로 설계되어 있어, 과대추정 발생 빈도를 직접적으로 제어하는 본 연구의 목적과는 차이가 있다.

따라서 본 연구의 결과는 이러한 최신 기법 대비 절대적 성능 우위를 주장하기보다는, “낙관적 과대추정 억제”라는 특정 목적 하에서의 방법론적 유효성을 검증한 것으로 해석되어야 한다. 또한, 제안 방법은 대표 프로파일의 보수적 설계가 요구되는 장기 수급 계획, ESS 용량 산정 등과 같은 planning-oriented 문제에 적합하며, 단기 예측 또는 확률적 분포 재현을 목적으로 하는 문제에는 직접 적용하기 어려울 수 있다. 즉, 본 연구의 적용 범위는 보수적 대표 프로파일 생성 문제로 한정되며, 일반적인 시계열 예측 또는 확률 모델링 문제와는 구분된다.

분석은 두 가지 관점에서 수행되었다. 첫째, 출력 변동성이 크게 나타나는 대표 월에 대해 학습 데이터 분포와 검증 데이터 분포 상에서 각 방법이 도출한 대표 프로파일의 형상 차이를 시각적으로 비교하였다. 둘째, 2022년 월별 검증 데이터 전체에 대해 손실지표와 낙관 빈도 패널티를 정량적으로 비교함으로써, 제안 기법의 성능을 평균, 중앙값, 그리고 K-means 기반 방법과 비교·평가하였다.

1) 계절별 대표 월에 대한 시각적 비교 분석

태양광 발전은 계절에 따라 상이한 변동 특성을 보이며, 특히 봄철과 여름철에는 출력의 간헐성 및 기상 영향이 두드러지게 나타난다. 본 연구에서는 이러한 특성이 대표 프로파일의 형상에 어떻게 반영되는지를 확인하기 위해, 출력 변동이 큰 봄철 4월의 영암 사이트와 여름철 기상 변동성이 큰 8월의 안산 사이트를 대표 사례로 선정하였다. 각 사례에 대해 학습 구간(2017~2021년)의 일별 정규화 발전 패턴 분포와 검증 구간(2022년)의 실측 분포를 함께 제시하고, 제안 방법, 평균, 중앙값, K-means 기반 대표 프로파일의 형상 차이를 비교하였다.

다만, 정량 비교 결과에서는 평균과 중앙값 기반 결과가 거의 유사한 경향을 보여 중복 지표를 최소화하기 위해 표 1에서는 평균 기반 결과만을 제시하고, 추가적인 군집 기반 방법인 K-means와의 비교를 수행하였다.

그림 1. 높은 간헐성 기간의 태양광 발전 대표 패턴 비교결과 (영암, 2022년 4월)

Fig. 1. Comparison of Representative Profiles under High Intermittency (Yeongam Solar, Apr. 2022)

../../Resources/kiee/KIEE.2026.75.6.1246/fig1.png

봄철 4월은 맑은 날과 흐린 날이 반복적으로 교차하여 일별 발전 형상의 변동성이 크게 나타나는 시기이다. 그림 1은 영암 사이트 4월에 대한 학습 데이터 분포와 검증 데이터 분포를 함께 제시한 결과이다. 그림 1(a)의 학습 구간(2017–2021년)에서는 정오 전후 시간대에서 일별 정규화 프로파일의 분산이 크게 나타나며, 평균 및 중앙값 기반 곡선은 이러한 변동성을 상대적으로 평활화한 완만한 형상을 보인다. K-means 기반 대표 프로파일 역시 전체 데이터의 중심적 형상을 반영하는 경향을 보이나, 제안 방법은 12–14시 부근에서 국부적인 피크를 보다 뚜렷하게 유지하는 형상을 나타낸다. 이는 제안 방법이 단순 평균적 중심치를 따르기보다, 다년도 학습 데이터에서 선택된 보수적 대표일 형상을 가중 결합함으로써 시간대별 형상 특성을 유지하고 있음을 보여준다.

그림 1(b)의 2022년 검증 데이터에서도 제안 방법은 평균, 중앙값, K-means 기반 대표 프로파일에 비해 정오부의 형상 특성을 보다 선명하게 반영하는 것으로 나타난다. 반면 평균 및 중앙값 기반 방법은 상대적으로 매끈한 종형(bell-shaped) 곡선에 가까운 형태를 보이며, K-means 역시 중심적 군집의 형상을 대표하기 때문에 국부적인 피크 구조를 상대적으로 약하게 반영한다. 이러한 결과는 제안 방법이 단순한 중심 경향의 재현을 넘어, 월별 발전 패턴 내에서 반복적으로 나타나는 특징적 형상을 유지하면서도 낙관적 과대추정의 빈도를 제어하는 방향으로 대표 프로파일을 형성함을 시사한다.

그림 2. 여름철 기후조건의 태양광 발전 대표 패턴 비교결과 (안산, 2022년 8월)

Fig. 2. Comparison of Representative Profiles under Severe Weather Conditions (Ansan Yeongseong Solar, Aug. 2022)

../../Resources/kiee/KIEE.2026.75.6.1246/fig2.png

여름철 8월은 태양광 발전 잠재량이 큰 시기인 동시에, 구름, 강수, 수증기 증가 등 기상 조건의 영향으로 시간대별 형상 왜곡이 크게 나타나는 기간이다. 그림 2는 안산 사이트 8월에 대한 학습 구간과 검증 구간의 결과를 보여준다. 그림 2(a)의 학습 데이터 분포를 보면, 정오 전후에서 발전 프로파일의 분산이 크게 확대되며, 평균과 중앙값 기반 방법은 이러한 분산을 반영하기보다 전체적으로 평활화된 곡선을 형성한다. K-means 기반 대표 프로파일 역시 대표 군집의 중심 형상을 제공하지만, 제안 방법에 비해서는 정오부의 뚜렷한 피크 구조가 완화되어 나타난다. 반면 제안 방법은 12–13시 부근에서 상대적으로 높은 출력 비중을 유지하면서, 급격한 형상 변화를 포함한 여름철 특유의 패턴을 보다 직접적으로 반영한다.

그림 2(b)의 2022년 검증 데이터에서도 이러한 차이는 유사하게 확인된다. 평균, 중앙값, K-means 기반 곡선은 비교적 완만하고 대칭적인 형태를 보이는 반면, 제안 방법은 정오부 피크가 보다 강조된 비평활적 형상을 유지한다. 이는 제안 방법이 단지 월별 평균적 형상을 재현하는 것이 아니라, 실제 발전 패턴에서 관측되는 시간대별 특이 구조를 보존하는 방향으로 대표 프로파일을 구성하고 있음을 보여준다. 특히 제안 방법은 여름철과 같이 변동성이 큰 조건에서도 학습 구간에서 나타난 핵심 형상 특성을 검증 구간에서도 유지함으로써, 단순 중심치 기반 방법이나 단일 군집 중심 기반 방법과 구별되는 형상 재현 특성을 나타낸다.

아울러 그림 1그림 2에서 확인되듯이, 제안 방법은 일부 시간대, 특히 정오 부근에서 평균, 중앙값, K-means 기반 방법보다 상대적으로 높은 출력 비중을 형성할 수 있다. 그러나 이는 대표곡선의 보수성을 전체 출력 수준의 일률적 하향으로 정의하지 않았기 때문이며, 본 연구에서의 보수성은 일일 발전량 정규화 이후 시간대별 형상 대표성을 유지하면서도 실제 관측치를 지속적으로 초과하는 낙관적 추정의 빈도를 억제하는 데 초점을 둔다. 즉, 제안 방법은 중심적 형상을 단순 평활화하는 방식이 아니라, 시간대별 형상 특성을 보존하면서 과대추정의 크기와 빈도를 동시에 제어하는 방향의 보수성을 구현한다는 점에서 기존 평균, 중앙값, K-means 기반 접근과 차별된다.

2) 월별 정량 지표 기반 성능 비교 분석

앞선 절에서는 계절별 대표 사례를 통해 제안된 방법이 출력 변동성이 큰 환경에서도 평균, 중앙값, K-means 기반 방법과 구별되는 시간대별 형상 특성을 유지함을 시각적으로 확인하였다. 본 절에서는 이러한 특성이 특정 사례에 국한되지 않고, 2022년 전체 기간에 걸쳐 정량적으로도 일관되게 유지되는지를 검증하기 위해 식 (3)에서 정의한 월별 손실지표와 낙관 빈도 패널티를 기반으로 추가 분석을 수행하였다.

표 1은 제안 방법과 평균, K-means 기반 방법에 대해 2022년 월별 손실지표와 낙관 빈도 패널티를 비교한 결과를 나타낸다. 전체적으로 제안 방법은 영암과 안산 두 사이트 모두에서 대부분의 월에 대해 평균 기반 방법보다 낮은 손실지표를 보였으며, K-means 기반 방법과 비교하더라도 대체로 우수하거나 경쟁적인 성능을 나타냈다. 특히 낙관 빈도 패널티 측면에서 제안 방법은 다수의 월에서 비교 방법들보다 낮은 값을 보여, 단순히 평균적 오차를 줄이는 수준을 넘어 실제 발전량을 반복적으로 초과하는 시간대의 비율을 효과적으로 억제함을 확인할 수 있다. 이는 손실함수에 포함된 비대칭 오차 항과 빈도 기반 패널티 항이 실제 검증 결과에 반영된 것으로 해석된다.

영암 사이트의 경우, 제안 방법은 연중 대부분의 월에서 가장 낮은 손실 또는 이에 근접한 값을 기록하였으며, K-means 기반 방법 역시 평균값보다 개선된 경우가 일부 존재하나 전반적으로 제안 방법의 성능을 일관되게 상회하지는 못하였다. 이는 군집 중심 기반 대표 프로파일이 월별 데이터의 중심 형상을 잘 반영할 수는 있으나, 낙관적 과대추정의 빈도까지 직접 제어하지는 못하기 때문으로 볼 수 있다.

안산 사이트의 경우에는 전체 손실 수준이 영암보다 전반적으로 크게 나타났으며, 이는 소규모 도심형 설비 특성과 기상 변동성의 영향이 복합적으로 반영된 결과로 해석된다. 그럼에도 불구하고 제안 방법은 다수의 월에서 평균값, K-means 기반 방법 대비 낮은 손실과 낮은 낙관 빈도 패널티를 유지하였다. 다만, 8월과 같이 변동성이 큰 일부 월에서는 제안 방법의 손실지표가 평균 또는 K-means 기반 방법보다 다소 높게 나타나는 경우가 확인되었다. 이는 제안된 손실함수가 과대추정의 크기뿐만 아니라 발생 빈도에 대해서도 페널티를 부여하는 비대칭 구조를 가지므로, 일부 시간대에서 과대추정을 억제하는 과정에서 상대적으로 과소추정이 증가한 데에서 기인한다. 이러한 결과는 손실지표 관점에서는 중심 통계량 또는 군집 기반 방법이 상대적으로 낮은 값을 나타낼 수 있음을 보여주지만, 동시에 과대추정 억제를 고려한 제안 방법의 설계 목적이 반영된 결과로 해석될 수 있다.

표 1. 각 방법별 월별 손실지표 및 낙관 빈도 패널티 비교 결과

Table 1. Comparison of Monthly Loss Indices and Optimism Frequency Penalties by Method

기간 장소 월별 손실지표 낙관빈도 패널티
제안 평균 kmeans 제안 평균 kmeans
22년 1월 영암 에프원 0.207 0.244 0.260 0.176 0.224 0.237
안산연성 정수장 0.199 0.294 0.289 0.166 0.270 0.264
22년 2월 영암 에프원 0.210 0.276 0.288 0.174 0.251 0.261
안산연성 정수장 0.232 0.311 0.312 0.209 0.290 0.290
22년 3월 영암 에프원 0.250 0.313 0.308 0.216 0.287 0.282
안산연성 정수장 0.280 0.352 0.337 0.239 0.318 0.305
22년 4월 영암 에프원 0.258 0.328 0.337 0.230 0.311 0.319
안산연성 정수장 0.274 0.369 0.379 0.244 0.347 0.358
22년 5월 영암 에프원 0.259 0.320 0.287 0.235 0.305 0.271
안산연성 정수장 0.249 0.390 0.350 0.213 0.369 0.334
22년 6월 영암 에프원 0.285 0.355 0.354 0.247 0.327 0.326
안산연성 정수장 0.339 0.393 0.376 0.291 0.348 0.333
22년 7월 영암 에프원 0.282 0.349 0.359 0.244 0.319 0.329
안산연성 정수장 0.313 0.392 0.361 0.276 0.361 0.330
22년 8월 영암 에프원 0.270 0.324 0.320 0.235 0.294 0.290
안산연성 정수장 0.378 0.366 0.369 0.326 0.329 0.329
22년 9월 영암 에프원 0.277 0.293 0.287 0.244 0.266 0.259
안산연성 정수장 0.293 0.340 0.332 0.25 0.301 0.294
22년 10월 영암 에프원 0.235 0.308 0.319 0.208 0.293 0.303
안산연성 정수장 0.278 0.340 0.347 0.254 0.319 0.329
22년 11월 영암 에프원 0.182 0.245 0.256 0.137 0.226 0.237
안산연성 정수장 0.221 0.294 0.285 0.184 0.268 0.259
22년 12월 영암 에프원 0.222 0.281 0.282 0.169 0.240 0.241
안산연성 정수장 0.244 0.297 0.306 0.202 0.266 0.272

표 1의 결과를 종합하면, 제안 방법은 모든 월에서 일률적으로 최적임을 보장하지는 않지만, 평균값 기반 방법뿐 아니라 대표적인 군집화 기반 방법인 K-means와 비교하더라도 전반적으로 우수한 손실 특성과 낮은 낙관 빈도 패널티를 나타낸다. 특히 봄철과 여름철처럼 출력 변동성이 큰 구간에서 그 경향이 비교적 뚜렷하게 확인되며, 이는 제안 방법이 대표 프로파일의 형상 보존과 낙관적 과대추정 억제를 동시에 고려하는 방식으로 설계되었기 때문으로 해석된다.

아울러, 파라미터 설정에 따른 월별 손실지표 및 낙관빈도 페널티의 변화를 분석하기 위해 민감도 분석을 추가로 수행하였다. 본 연구에서는 손실함수의 가중치 중 과소예측 오차에 대한 가중치 $\lambda_{under}$를 1로 고정하고, 과대예측 오차에 대한 가중치 $\lambda_{over}$와 낙관빈도 패널티 계수 $\gamma$를 각각 3, 5, 7 및 0, 1, 2의 범위에서 변화시키며 분석을 수행하였다. 이는 특정 파라미터 조합의 최적값을 도출하기보다는, 손실함수의 가중치 변화에 따라 예측의 보수성과 정확도가 어떻게 달라지는지를 전반적으로 확인하기 위한 설정이다.

민감도 분석 결과, 표 2에 명시된 것처럼 $\gamma$의 증가는 단순히 낙관 빈도를 감소시키는 효과를 넘어, 대표 프로파일이 실제 관측치를 초과하는 사건을 구조적으로 회피하도록 최적화 방향을 변화시키는 역할을 한다. 이는 손실함수 내 빈도 항이 단일 시점 오차보다 반복적 패턴에 더 큰 영향을 미치기 때문이다. 반면, $\lambda_{over}$의 증가는 과대추정 자체를 강하게 억제하는 방향으로 작용하지만, 그 과정에서 일부 시간대에서 과소추정이 증가하게 되어 전체 손실값이 증가하는 경향을 보인다. 이는 제안된 손실함수가 정확도와 보수성 간의 trade-off 관계를 내재하고 있음을 의미한다.

따라서, 본 손실함수의 가중치는 특정 최적값을 갖기보다는, 적용 목적에 따라 선택되는 설계 파라미터로 해석될 수 있다. 예를 들어, 계통 운영에서 예비력 부족 리스크를 최소화해야 하는 경우에는 높은 $\lambda_{over}$ 및 $\gamma$ 설정이 적절하며, 반대로 평균적 정확도를 중시하는 경우에는 상대적으로 낮은 값을 선택하는 것이 바람직하다. 즉, 본 연구에서의 가중치 설정은 성능 최적화 결과라기보다, 계통 운영 목적에 따른 보수성 수준을 조정하기 위한 설계 변수로 해석되어야 한다.

표 2. 손실함수 가중치에 따른 월별 손실지표 및 낙관 빈도 패널티 비교 결과

Table 2. Effect of Parameters ($\lambda_{over}$, $\gamma$) on Monthly Loss and Optimism Frequency

$\lambda_{over}$ $\gamma$ 사이트명 월별 손실지표 낙관빈도 패널티
3 0 안산연성정수장 0.021 0.301
영암에프원 0.018 0.287
1 안산연성정수장 0.260 0.234
영암에프원 0.234 0.209
2 안산연성정수장 0.492 0.636
영암에프원 0.449 0.213
5 0 안산연성정수장 0.031 0.029
영암에프원 0.027 0.287
1 안산연성정수장 0.275 0.337
영암에프원 0.245 0.210
2 안산연성정수장 0.506 0.646
영암에프원 0.459 0.212
7 0 안산연성정수장 0.042 0.038
영암에프원 0.036 0.287
1 안산연성정수장 0.285 0.347
영암에프원 0.257 0.210
2 안산연성정수장 0.521 0.567
영암에프원 0.468 0.209

3. 결 론

본 연구에서는 재생에너지 확대에 따라 전력 계통 계획 수립 시 필수적인 요소가 된 태양광 발전 대표 프로파일의 신뢰성을 제고하기 위해, 다년도 시계열 가중 라이브러리와 낙관 빈도 제어 기법을 결합한 새로운 대표곡선 산출 방법론을 제안하였다.

기존의 산술 평균이나 중앙값 기반 방식은 태양광 발전 특유의 간헐성을 통계적으로 평활화하는 과정에서 실제 발전 패턴의 시간대별 변동 특성을 충분히 반영하지 못할 수 있으며, 일부 조건에서는 실제 발전 가능량을 초과하는 낙관적 편향을 유발할 가능성이 있다. 이를 해결하기 위해 본 연구는 최신 기상 경향을 반영하는 다년도 가중 라이브러리를 구축하고, 과대 추정 오차의 크기뿐 아니라 발생 빈도를 직접 제어하는 비대칭 손실함수를 도입하였다. 사례 연구 결과, 제안 기법은 봄철의 급격한 출력 변동성과 여름철의 기상 영향으로 인한 저출력 조건에서도 실측 발전 패턴의 분포 특성을 안정적으로 반영하는 경향을 확인하였다. 또한 평균, 중앙값 및 군집 기반 대표 프로파일과 비교할 때 과대 추정이 발생하는 시간대의 빈도를 유의미하게 감소시키는 경향도 확인할 수 있었다.

특히 다년도 가중 라이브러리는 단일 연도의 기상학적 특이성을 완화하고 최신 경향을 반영함으로써 대표 프로파일의 통계적 안정성과 시계열 일관성을 동시에 확보하였다. 이러한 특성은 제안된 방법론이 대표 프로파일이 실제 발전 가능량을 반복적으로 초과하는 현상을 줄임으로써, 장기 전력수급 계획에서는 재생에너지 이용 가능량의 낙관적 가정을 완화하고, 에너지저장장치 용량 산정이나 예비력 확보 측면에서는 과소 설계 위험을 줄이는 방향으로 활용될 가능성을 시사한다.

다만 본 연구는 제한된 지역 데이터를 기반으로 검증이 수행되었다는 점에서 향후 다양한 기후 및 입지 조건(산악, 해안, 도심 등)에 대한 확장 검증이 필요하다. 또한 낙관 빈도 제어를 위한 손실함수 가중치가 제한적으로 분석된 점을 고려할 때, 향후 연구에서는 $\lambda_{over}$, $\lambda_{under}$, $\gamma$의 변화에 따른 보다 체계적인 민감도 분석과 함께 발전소별 특성과 계통 운영자의 리스크 회피 성향을 반영할 수 있는 적응형 파라미터 최적화 연구가 필요하다.

그럼에도 불구하고 본 연구는 대표 프로파일 산출을 단순한 통계적 대푯값 추출의 영역에서 계통 운영 안정성을 고려한 리스크 관리 기반 접근으로 확장하였다는 점에서 중요한 학술적 및 실무적 의의를 갖는다.

아울러, 본 연구에서 제안한 대표 프로파일 산출 구조는 태양광 발전에 한정된 것이 아니라, 시간대별 형상과 과대추정 위험 관리가 중요한 풍력 발전 프로파일이나 부하 프로파일의 대표곡선 산출 문제에도 확장 적용될 수 있다. 다만 각 자원의 변동 특성과 운영 목적이 상이하므로, 손실함수 구성과 가중치 설정에 대해서는 대상 자원별 추가 검증이 필요하다는 점은 유의하여야 한다.

Acknowledgements

본 연구는 한경대학교 2025년도 학술연구조성비의 지원에 의한 것임(This work was supported by a research grant from Hankyong National University in the year of 2025.)

References

1 
Ministry of Trade, Industry and Energy (MOTIE), "The 10th Basic Plan for Electricity Supply and Demand (2022–2036)," Republic of Korea, 2023. Google Search
2 
L. Kotzur, P. Markewitz, M. Robinius, D. Stolten, "Time series aggregation for energy system design: Modeling seasonal storage," Applied Energy, vol. 213, pp. 123-135, 2018. DOI
3 
M. Hoffmann, L. Kotzur, D. Stolten, "A Review on Time Series Aggregation Methods for Energy System Models," Energies, vol. 13, no. 3, pp. 641, 2020. DOI
4 
K. Poncelet, H. Höschle, E. Delarue, A. Virag, W. D’haeseleer, "Selecting Representative Days for Capturing the Implications of Integrating Intermittent Renewables in Generation Expansion Planning Problems," IEEE Trans. on Power Systems, vol. 32, no. 3, pp. 1936-1948, 2017. DOI
5 
E. S. Pinto Maquilón, "Evaluation of methods to select representative days for the optimization of polygeneration systems," Renewable Energy, vol. 151, pp. 488-502, 2020. DOI
6 
P. Brown, W. Cole, T. Mai, "An Interregional Optimization Approach for Time Series Aggregation in Continent-Scale Electricity System Models," Energy, vol. 324, 2025. DOI
7 
R. Rastgoo, N. Amjady, H. Zareipour, 112107, "A Deep Generative Model for Selecting Representative Periods in Renewable Energy-Integrated Power Systems," Applied Soft Computing, vol. 165, 2024. DOI
8 
H. Liu, "A Closed-Loop Representative Day Selection Framework for Generation and Transmission Expansion Planning with Demand Response," Energy Conversion and Economics, vol. 5, no. 2, pp. 93-109, 2024. DOI
9 
H. Liu, "A Representative Day Selection Method Based on Forward-Backward Sweep in Generation Expansion Planning," Energy Reports, 2023. DOI
10 
H. C. Cho, Y. J. Jung, "Probabilistic Modeling of Photovoltaic Power Systems with Big Learning Data Sets," Journal of Korean Institute of Intelligent Systems, vol. 23, no. 5, pp. 412-417, 2013. DOI
11 
Y. G. Kwak, B. H. Lee, F. S. Kang, "Economic Efficiency Analysis Based on Benefit-Cost Ratio of Floating Photovoltaic Power Generation System," The Transactions of the Korean Institute of Electrical Engineers, vol. 71, no. 8, pp. 1117-1125, 2022. DOI
12 
R. Koenker, G. Bassett, "Regression Quantiles," Econometrica, vol. 46, no. 1, pp. 33-50, 1978. DOI
13 
T. Gneiting, A. E. Raftery, "Strictly Proper Scoring Rules, Prediction, and Estimation," Journal of the American Statistical Association, vol. 102, no. 477, pp. 359-378, 2007. DOI
14 
Korea Public Data Portal, Available: https://www.data.go.kr/data/15025486/fileData.do, "Korea Western Power Co., Ltd._Solar Power Generation Status," Republic of Korea Google Search

저자소개

김준혁 (Jun-Hyeok Kim)
../../Resources/kiee/KIEE.2026.75.6.1246/au1.png

He received his B.S., M.S., and Ph.D. degrees from Sungkyunkwan University in 2012, 2014, and 2022, respectively. In 2016, he worked at the Korea Electronics Technology Institute (KETI). From 2017 to 2024, he was with the Korea Electric Power Corporation Research Institute(KEPRI). He joined the Department of Electrical and Electronic Engineering at Hankyong National University in 2024 and has been serving as a professor since then. His research interests include applying artificial intelligence to power systems and electrical equipment for condition inference, estimation, and asset management analysis, as well as distribution system operator (DSO) operation and optimal control.