636 Views
June 10, 22
スライド概要
2022/06/03
Deep Learning JP:
http://deeplearning.jp/seminar-2/
DL輪読会資料
DEEP LEARNING JP [DL Papers] FactorVAE: A Probabilistic Dynamic Factor Model Based on Variational Autoencoder for Predicting Cross-sectional Stock Returns Jun Hozumi, Izumi Lab http://deeplearning.jp/ 1
書誌情報 • Title: FactorVAE: A Probabilistic Dynamic Factor Model Based on Variational Autoencoder for Predicting Cross-sectional Stock Returns • Author: Yitong Duan, Lei Wang, Qizhong Zhang, Jian Li • Tsinghua University • Conf.: AAAI 2022 • 概要を、前提知識含めて、ザッと説明します • 細かい数式等々は割愛しますので • 詳細は元論文読んでください 2
背景(1/3) • ファクターモデルは、経済学やファイナンスの分野で広く採用されているクロスセク ション分析手法として、学界や産業界に非常に大きな影響を与えている https://glossary.mizuho-sc.com/faq/show/1143?site_domain=default 3
背景(2/3) • ファクターモデルでは、株式リターンはファクターとそれに対応するファクターへのエ クスポージャ(ファクターが株式に与える影響)によって記述され、ファクターの線形 結合によって計算される • エクスポージャの時間変化の有無によってファクターモデルは静的モデルと動的モデル に分類されるが、最近の研究では動的モデルの方が優れたパフォーマンスを達成するこ とが示されており、動的モデルの人気が高まっている • しかし、従来の動的モデルは、実務経験によって設計されたファクター(ex. モメンタム など)を採用しており、事前知識と実際の市場との不整合により、モデルバイアスが生 じる可能性がある 4
背景(3/3) • 近年の機械学習の進歩は、動的ファクターモデルに新たなデータ主導の視点を与えてい るが、既存の機械学習手法は、株式データの低いS/N比という重大な問題に悩まされてい る可能性がある • そこで、ノイズの多いデータと有効なファクターの間のギャップを埋めるために、変分 オ ート エ ン コ ー ダ (VAE )に 基 づ く 新 しい 確 率 的 ダイ ナ ミ ッ ク ファ ク タ ー モデ ル (FactorVAE)を提案する 5
前提知識 • (以降、小文字はベクトル、大文字はスカラー) • Dynamic Factor Model(DFM) • アルファはその株式の特異的リターンのベクトル、ベータはエクスポージャ行列、zはK ファクターのベクトル • 今回のタスクは、過去データから将来のクロスセクションリターンを予測するための、 パラメータΘを持つ動的ファクターモデルを学習すること 6
提案手法の概要 • VAEのエンコーダ・デコーダのアーキテクチャを踏襲し、複数のファクターによってク ロスセクションの株式リターンをうまく再構成できる最適ファクターモデルを学習する • エンコーダは将来の株式リターンにアクセスできるオラクルとして 、将来のデータから 最適なファクター(事後ファクター)を抽出し、デコーダは事後ファクターによって将 来の株式リターンを再構築する • 本モデルにおけるファクターは、VAEにおける潜在変数とみなされ、ノイズの多いデー タをモデル化する能力を持つ 7
Encoder-Decoder Architecture • 特徴抽出器: 時系列であるxの時間依存性を捉えるために、GRUを採用する • • 最後の時間ステップTにおけるGRUの隠れ状態を潜在的特徴eとして用いる ファクターエンコーダ・デコーダ • VAEがベース 8
Prior-Posterior Learning(事前事後学習) • 過去の観測データのみを用いてファクター予測器を訓練し、事前ファクターに近づける ようにファクターを予測し、ファクターデコーダを用いて、将来のデータリーケージを 伴わない事前ファクターによる株式リターンを、モデルの予測リターンとして計算する • 市場の2種類のグローバル表現を並行して統合し、そこから市場の多様なリスクプレミア ムを表すファクターを抽出するMulti-head global attentionを設計する 9
目的関数など • 本手法の目的は、最適な事後ファクターモデルを学習することと 、事後ファクターに よってファクター予測器の傾きを効果的に誘導すること (再構成誤差) (事前ファクター分布と 事後ファクター分布のKLD) • 予測段階では、予測器とデコーダのみによって株式リターンを予測する • エンコーダを使うとリーケージになる 10
実験(1/3) • ランク情報係数(Rank IC)による評価と、その平均を標準偏差で割ったもの(ICIR)で評価 • • FactorVAE-priorはPrior-Posterior Learningを用いないFactorVAE FactorVAEは比較されたすべての手法の中で最も高いパフォーマンスを示し、提案手法の 有効性を示している 11
実験(2/3) • 訓練データセットから無作為にm個の株式を取り除き、Rank ICなどを評価 • • FactorVAE-portはポートフォリオレイヤーをConditional Autoencoderで学習させたFactorVAE FactorVAEは頑健性もあり、動的な再重量化ポートフォリオの構築の有効性も示された 12
実験(3/3) • • モデルの事前予測に基づいてCSI300のポートフォリオを構築し、バックテストによりそ のパフォーマンスを比較する • Top-K Drop Strategy: 上位50銘柄を保有し、毎日最大5銘柄を入れ替え • (Tdrisk)は(単純リターンではなく)リスク調整後リターンで銘柄を選択 FactorVAEによるポートフォリオは、比較対象のすべてのポートフォリオをアウトパ フォームした (シャープレシオ) (年率収益) (最大ドローダウン) 13
結論 • 本研究では、クロスセクションの株式リターンを予測するための効果的なファクターモ デルの学習方法を示した • 具体的には、株式データのS/N比の低さを考慮した、変分オートエンコーダ(VAE)に基 づく確率的な動的ファクターモデルを提案した • また、ノイズの多い市場データから有効なファクターを抽出するために、事前事後学習 法を提案し、モデルの学習を効果的に誘導した • 実際の株式市場データを用いた実験により、本モデルの有効性が実証された 14