2022_太陽光発電出力予測における学習データの欠損値補完

2K Views

March 30, 22

スライド概要

profile-image

小平大輔 - 筑波大学エネルギー・環境系助教。現在の研究テーマは、電気自動車の充電スケジューリング、エネルギー取引のためのブロックチェーン、太陽光発電とエネルギー需要の予測など。スライドの内容についてはお気軽にご相談ください:kodaira.daisuke.gf[at]u.tsukuba.ac.jp

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

太陽光発電出力予測における 学習データの欠損値補完 2022/ 1/ 14 1

2.

目次 1.研究背景・研究目的 2.研究内容 3.欠損値の補完手法 4.予測条件 5.予測精度の評価法 6.結果 7.結論 2

3.

1.研究背景・研究目的 太陽光発電の発電出力を予測するには 様々な特徴量の測定データが必要 センサーや測定機器の不備で 欠損値が生じてしまう問題がある 予測モデルの学習に使う学習データのうち 発電出力データの一部が欠損したと想定 学習データ 気温データ 降水量データ 湿度データ など(欠損無し) 発電出力データ (一部欠損) 図1:学習データの欠損のイメージ 欠損値を補完したときどの程度予測精度の悪化 を抑えられるのか各手法を比較した 3

4.

2.研究内容 ①欠損がない学習データから発電出力データのみ𝑥%を欠損させ、その欠損値を補完する (𝑥=20,40,60,80) 表1:欠損がない学習データ 時刻 湿度 風速 温度 雲量 降水量 発電出力 発電出力 発電出力 7 79 1.2 27.7 4 0 0.450118 0.450118 0.450118 7.5 79 1.2 27.7 4 0 0.786283 0.786283 0.786283 8 73 1.5 28.8 4 0 1.236600 欠損 1.342511 8.5 73 1.5 28.8 4 0 1.658280 1.658280 1.658280 9 65 1.9 30.5 0 0 1.866541 𝑥%欠損 1.866541 補完 1.866541 … … … … … … … … … … … … … … … … … … … … … … … … … … … 16 56 4.7 30.2 6 0 0.796653 0.796653 0.796653 16.5 56 4.7 30.2 6 0 0.450048 欠損 0.352251 17 57 5.2 29.8 6 0 0.330459 0.330459 0.330459 17.5 57 5.2 29.8 6 0 0.209920 欠損 0.240966 18 66 4.2 28.9 3 0 0.117585 0.117585 0.117585 4

5.

②補完した学習データを使って予測モデル作成&予測を実行 表2:欠損を補完した学習データ 時刻 湿度 風速 温度 雲量 降水量 発電出力 7 79 1.2 27.7 4 0 0.450118 7.5 79 1.2 27.7 4 0 0.786283 8 73 1.5 28.8 4 0 1.342511 8.5 73 1.5 28.8 4 0 1.658280 9 65 1.9 30.5 0 0 1.866541 … … … … … … … … … … … … … … … … … … … … … 16 56 4.7 30.2 6 0 0.796653 16.5 56 4.7 30.2 6 0 0.352251 17 57 5.2 29.8 6 0 0.330459 17.5 57 5.2 29.8 6 0 0.240966 18 66 4.2 28.9 3 0 0.117585 予測モデル作成&予測 機械学習法 NN K-means法 LSTM 5

6.

全学習期間の同時刻の発電出力を取り出す 3.欠損値の補完手法 平均値補完の補完手法 欠損していない発電出力データの平均値を求め、 全ての欠損値に補完 表3:同時刻を抽出した発電量データ 年 日付 時刻 発電出力[kW] 年 日付 時刻 発電出力[kW] 2013 8月15日 12:00 11.33 2013 8月15日 12:00 11.33 2013 8月16日 12:00 10.65 2013 8月16日 12:00 10.65 2013 8月17日 12:00 欠損 2013 8月17日 12:00 10.55 2013 8月18日 12:00 2013 8月18日 12:00 11.09 … … … 11.09 … … 2014 5月26日 12:00 11.94 2014 5月27日 12:00 欠損 2014 5月28日 12:00 12.02 2014 5月29日 12:00 12.55 平均値10.55kW を補完 … … … 2014 5月26日 12:00 11.94 2014 5月27日 12:00 10.55 2014 5月28日 12:00 12.02 2014 5月29日 12:00 12.55 別の日 同時刻 6

7.

発電出力(欠損) KNN(K-Nearest Neighbor)法の補完手法 発電出力(非欠損) 例:特徴量2個を用いてKNN法を実行するとき (気温、雲量) Step1. 気温・雲量でそれぞれ最小値を0、 最大値を1となるようにデータを正規化し、 図2のように配置する 1.0 雲量 0 気温 1.0 図2:KNN法 7

8.

KNN法の補完手法(続き) 発電出力(欠損) 発電出力(非欠損) Step2. 欠損しているデータからのユー クリッド距離dが小さいK個のデータを 集める 1.0 K=5 雲量 𝑑 Step3. 集めたK個の発電出力データ の平均を求め、補完値とする 0 気温 1.0 図3:KNN法 8

9.

3. 予測条件 学習データ期間 ・計測地点:東京都北東部 ・学習・テスト・予測に用いるデータ: 時刻、湿度、風速、気温、雲量、降水量 ・PVシステムの定格出力:14.3kW 2013年8月15日~ 2014年5月29日 (288日) テストデータ期間 2014年5月30日~6月29日 (30日) 予測日 2014年7月2日(1日) 9

10.

4.予測精度の評価法 予測区間幅の範囲内に真の発電量 が含まれている割合→理想:95% 各時刻における真の発 電量と予測発電量の差 の二乗平均平方根 (Root Mean Square Error) 95%の確率で真の発電量が含ま れると本手法が予測した区間 10

11.

RMSE[kW] 5.結果 ①真値を欠損がない発電量データとしたときの欠損率ごとの学習データのRMSE 3.0 2.0 1.0 平均値補完 KNN法 0.0 0 20 40 60 欠損率[%] 80 100 図4:各補完手法における欠損率ごとの学習データのRMSE 11

12.

②欠損率20%,40%,60%,80%における2手法の補完&予測精度結果 100 6.0 約0.2kW 5.0 カバー率[%] 平均予測区間幅[kW] 7.0 4.0 3.0 2.0 KNN法 1.0 80 60 約35% 40 KNN法 20 平均値補完 平均値補完 0 0.0 0 20 40 60 欠損率[%] 80 100 図6:2014年7月2日の平均予測区間幅 0 20 40 60 欠損率[%] 80 100 図7:2014年7月2日のカバー率 12

13.

②欠損率20%,40%,60%,80%における3手法の補完&予測結果 4.0 RMSE[kW] 3.0 約1.2kW 2.0 KNN法 1.0 平均値補完 0.0 0 20 40 60 欠損率[%] 80 100 図8:2014年7月2日のRMSE 13

14.

6.結論 平均値補完 vs. KNN 太陽光発電の出力予測に用いる 学習データが測定段階で欠損して いることがある 学習データのうち発電出力データが 欠損しているとき欠損値の補完手法 による予測精度の悪化を調査 平均予測区間幅:大きな差なし カバー率:KNN法 > 平均値補完 RMSE: KNN法 < 平均値補完 KNN法の方が有効 平均値補完 KNN法 14

15.

予備スライド

16.

予測精度の評価法 Loss[kW]…平均予測区間幅とカバー率の統合指標 𝑛 𝐿𝑜𝑠𝑠 = 平均予測区間幅 + 𝜆 max(0, 1 − 𝛼 − カバー率 ) 𝛼(1 − 𝛼) 𝜆:平均予測区間幅とカバー率の重要度を調整する変数 1 − 𝛼: カバー率の目標値(95%) 𝑛:1日のデータ数 欠損なしの学習データによる発電安定な日(7月2日)の予測精度の平均予測区間幅とCover Rate のLossが等しくなるように𝜆を設定 16

17.

発電出力予測の意義 ・電力を安定供給するため 電力の需給バランスの崩壊→周波数変動→発電機の動作が不安定 太陽光発電は出力が天候に左右されやすい 補完・・・出力予測の精度の向上 17

18.

300 Loss[kW] KNN法 200 平均値補完 100 0 0 20 40 60 80 欠損率[%] 図9:2014年7月2日のLoss 18

19.

②発電出力が不安定な日(6月30日)の発電出力予測 図9:2014年6月30日の発電出力予測 19

20.

100 6.0 約0.2kW 5.0 4.0 3.0 KNN法 2.0 80 60 約35% KNN法 40 20 平均値補完 1.0 Cover Rate[%] 平均予測区間幅 [kW] 7.0 平均値補完 0 0.0 0 20 40 60 80 欠損率[%] 図10:2014年6月30日の平均予測区間幅 0 20 40 60 80 欠損率[%] 図11:2014年6月30日の平均予測区間幅 20

21.

3.5 150 KNN法 平均値補完 2.5 2.0 約0.3kW Loss[kW] RMSE[kW] 3.0 KNN法 100 平均値補完 50 1.5 1.0 0 0 20 40 60 欠損率[%] 図12:2014年6月30日のRMSE 80 0 20 40 60 80 欠損率[%] 図13:2014年6月30日のLoss 21

22.

先行研究 (1)Taeyoung Kim, Woong Ko , and Jinho Kim “Analysis and Impact Evaluation of Missing Data Imputation in Day-ahead PV Generation Forecasting” , applied sciences, 2018 欠損 時刻・温度・湿度・風速・風向・日射量・降水量・雲量 ←発電出力なし 補完手法 Linear Interpolation・Mode Imputation・KNN 予測手法 Support Vector Regression 22

23.

(2)W. Liu, C. Ren and Y. Xu, “PV Generation Forecasting With Missing Input Data: A Super-Resolution Perception Approach,” In IEEE Transactions on Sustainable Energy, vol. 12, no. 2, pp. 1493-1496, April 2021 欠損 学習データ(明記無し) 補完手法 Super-Resolution Perception Convolutional Neural Network 予測手法 Stochastic Configuration Network 欠損していない 学習データセット が必要 23

24.

(3)W. Zhang, Y. Luo, Y. Zhang and D. Srinivasan, "SolarGAN: Multivariate Solar Data Imputation Using Generative Adversarial Network," in IEEE Transactions on Sustainable Energy, vol. 12, no. 1, pp. 743-746, Jan. 2021 欠損 日射量、気温、風速、風向、湿度、発電出力 補完手法 Solar Generative Adversarial network(solarGAN) 予測手法 予測なし 24

25.

予測区間幅の求め方 Step1.テストデータ30日分の各時刻における予測発電出力と真の発電出力の差から予測誤 差を求める Step2.予測誤差を並び替えたとき 2番目に大きい予測誤差(上位3.3%)→ 予測誤差の最大値𝜎𝑚𝑎𝑥 2番目に小さい予測誤差(上位96.7%) →予測誤差の最小値𝜎𝑚𝑖𝑛 各時刻のprediction Intervalを求める。 (Prediction Interval)= 𝜎𝑚𝑎𝑥 − 𝜎𝑚𝑖𝑛 (1) Step3. 平均予測区間幅を用いて評価するため、(2)式のようにして求める 平均𝑃𝐼 = 1 𝑁 σ 𝑃𝐼 𝑁 𝑖=1 𝟏 𝑵 = σ𝑵 𝒊=𝟏(𝜎𝑚𝑎𝑥 − 𝜎𝑚𝑖𝑛 ) (2) 25

26.

今後の課題 ・発電出力を予測できたのが2日のみ →長期間の予測を行う ・KNN法のK値(5)を別の値で試す ・KNN法で用いた特徴量は(時刻、湿度、風速、気温、雲量、降水量) →使う特徴量が適切か?ノイズになっている特徴量がないか? 26

27.

KNN法 例:時刻、雲量を用いてKNN法を実行するとき (特徴量2個) 特徴量Y (例:雲量) Step1.2つの特徴量を縦軸・横軸にとり、発 電量が未知のデータからのユークリッド距 離dが小さいK個のデータを集める 発電量欠損データ 発電量非欠損データ 𝑞2 𝑑= 𝑝2 − 𝑝1 2 + 𝑞2 − 𝑞1 2 𝑑 𝑞1 Step2.集めたK個の発電量データの平均 を求め、補完値とする K=5 𝐾 1 補完値 = ෍ 𝑔𝑖 𝐾 𝑝1 𝑝2 図2:KNN法 𝑖=1 特徴量X (例:気温) 27

28.

KNN法 本研究では 使う特徴量:時刻、雲量、風速、気温、湿度、降水量 Kの値:5 発電量欠損のデータの(時刻、雲量、風速、気温、湿度、降水量) 発電量非欠損のデータの(時刻、雲量、風速、気温、湿度、降水量) (𝒑𝟏, 𝒒𝟏 , 𝒓𝟏 ,𝒔𝟏, 𝒕𝟏 , 𝒖𝟏 ) (𝒑𝟐, 𝒒𝟐 , 𝒓𝟐 ,𝒔𝟐, 𝒕𝟐 , 𝒖𝟐 ) と置くと 𝑑= 𝑝2 − 𝑝1 2 + 𝑞2 − 𝑞1 2 + 𝑟2 − 𝑟1 2 + 𝑠2 − 𝑠1 2 + 𝑡2 − 𝑡1 2 + 𝑢2 − 𝑢1 28 2