270 Views
August 12, 24
スライド概要
2024年8月10日に実施した、KaiRA×スクラムサイン共催の「AAAI論文読みLT会」の発表資料
AI・機械学習を勉強したい学生たちが集まる、京都大学の自主ゼミサークルです。私たちのサークルに興味のある方はX(Twitter)をご覧ください!
AAAI論文読みLT会 2024/08/10 NSVM による株価の変動値予測 京都大学 工学部 情報学科 数理工学コース B2 稲葉 陽孔 1
自己紹介 • 所属大学 京都大学工学部情報学科 数理工学コースB2 • 興味分野,インターンとか インターン:エムニ(AI系)で働いています! 興味分野:色々勉強したいので、未定です • 個人的な趣味とか Atcoder・ハッカソン・自転車旅 いなば ようこう 稲葉 陽孔 2
今回の論文 • NSVMによって株価の変動率に関する確率モデルを予測 • A Neural Stochastic Volatility Model | Proceedings of the AAAI Conference on Artificial Intelligence 3
アジェンダ NSVMとは 先行研究との比較 手法の説明 実験 まとめ 4
アジェンダ NSVMとは 先行研究との比較 手法の説明 実験 まとめ 5
NSVMとは • NSVMはRNN+統計的手法で、株価の変動値の確率分布を予測 • 資産のリスク評価や金融政策・投資に用いられる 6
アジェンダ NSVMとは 先行研究との比較 手法の説明 実験(株価予測) まとめ 7
先行研究との比較 株価の変動率予測に、以下の手法が使われていた ASISによる予測 ARCHモデル等による予測 ・変動値の確率分布を予測 ・変動値の確率分布を予測 ・統計学的に予測(×機械学習) ・統計学的に予測(×機械学習) ・現在でも重宝されている ・変動率の確率分布における尤度を RNNによる予測 もとにパラメーターを更新する ・時系列に基づいて変動値を予測 ・パラメーターの更新回数が多く、 ・変動率の確率分布を求めれない 予測に時間がかかる 8
先行研究との比較 NSVMの利点 • RNNなどを変分推論によって確率的にモデリングすることで、変動値の確率分布を予測 • ASISほどパラメーターの更新を行わないでよく、計算量も少ない • ARCHモデル等と比べ、予測精度が高い(実験で説明する) →予測に時間がかかることと値動きの確率分布を求められないことを克服し、 ARCHモデル等よりも精度が高い 9
アジェンダ NSVMとは 先行研究との比較 手法の説明 実験 まとめ 10
手法の説明
NSVMのベース
Input(x:時系列データ,z:潜在変数,h:RNNの潜在状態)
(1).RNN+MLP+での確率分布を生成
;Φ)->
(;Φ )->{}
(1),(2)
𝑧 2
𝑧 𝑡 N (𝑢𝑡𝑧 ,( σ 𝐺
) )
(3).RNN+MLP+ + での確率分布を
生成
;Φ)->
(;Φ )->{}
𝑥 2
𝑥𝑡 N (𝑢𝑡𝑥 ,( σ 𝐺
) )
.
.
.
Output(x,z,h)
(2).(1)で作った確率分布を元にを生成
(3),(4)
(4).(3)で作った確率分布を元にを生成
※ N(a,b):平均a,分散bの正規分布
, :時刻tにおけるAの変動率に関す
る確率モデルの平均と分散
Φ:RNNとMLPの重み
11
手法の説明
NSVM単体では精度が悪いので、時系列的に1つ先のデータを以下のように予測する
:株価をとした時
;Φ)->
;Φ)->
(;(;Φ
Ψ )->{}
)->{}
(;(;Φ
Ψ )->{}
)->{}
𝑧𝑧
𝑧𝑧 2
𝑧1𝑡
N
(𝑢
,(
σ
N (𝑢𝑡𝑡 ,( σ𝐺𝐺 )2 )
𝑡
;Φ)->
;Φ)->
𝑧𝑧
𝑧
𝑧 )22 )
𝑧
N
(𝑢
,(
σ
.......... 𝑡𝑠𝑡 N ( 𝑢𝑡𝑡 ,(σ𝐺
𝐺
;Φ)->
;Φ)->
(;(;Φ
Ψ )->{}
)->{
(;(;Φ
Ψ )->{}
)->{
確率)を取得
確率)を取得
𝑥𝑡
1
∑ N ¿¿
𝑆 𝑘=1 , …, 𝑆
s個のNSVMを使い、 に関する確
率分布をs個求める
サンプルから得られたs個の
確率分布をもとにを予測
12
手法の説明
詳しいモデルの説明
;Φ)->
;Φ)->
(;(;Φ
Ψ )->{}
)->{}
(;(;Φ
Ψ )->{}
)->{}
𝑧𝑧
𝑧𝑧 2
𝑧1𝑡
N
(𝑢
,(
σ
N (𝑢𝑡𝑡 ,( σ𝐺𝐺 )2 )
𝑡
;Φ)->
;Φ)->
𝑧𝑧
𝑡𝑡
𝑧𝑧 2
2
𝐺
𝐺
.......... 𝑧 𝑡𝑆𝑡 N
N(𝑢
(𝑢 ,(
,(σ
σ
;Φ)->
;Φ)->
(;(;Φ
Ψ )->{}
)->{
RNN:1層のGRUで、Dropoutを含む
(;(;Φ
Ψ )->{}
)->{
) )
MLP:2層の順伝播型全層結合
ネットワークで、
正則化のためにL2ノルムを使用
最適化モデル:Adam
損失関数:NLL
𝑥𝑡
1
∑ N ¿¿
𝑆 𝑘=1 , …, 𝑆
※GRU:簡易版LSTM
13
アジェンダ NSVMとは 先行研究との比較 手法の説明 実験 まとめ 14
実験(結果) 従来手法(ARCHモデル等)と比べて評価(評価指標:NLLによる株価のロス) ARCHモデル等: 株価の変動率を平均0、 分散の正規分布として考 えるモデル (触れない) • NSVMとの比較対象は統計的に値動きのダイナミクスを考察するモデルしかなかったが、他の モデルと比べ、基本的に全ての銘柄において精度が高い ※China A-Sharesから162社の株価(各日の終値)を取得 15
アジェンダ NSVMの概要 先行研究との比較 NSVMのモデル解説 実験 まとめ 16
まとめ • NSVMは、RNN+MLP+確率的な潜在変数zによって時系列データ xに関する確率分布を予測するモデル • NSVMから得られたS個の確率分布によって株価の変動率を予測 • NSVMによる変動率の確率分布は、ARCHモデル等のものと比べ、 精度が高かった 17