2.3K Views
October 29, 20
スライド概要
2020/10/29 Ltech#11 不動産領域のAI活用最前線 〜初完全リモート開催〜
AI戦略室データサイエンスグループ 谷山徹
LIFULL HOME'Sを運営する株式会社LIFULLのアカウントです。 LIFULLが主催するエンジニア向けイベント「Ltech」等で公開されたスライド等をこちらで共有しております。
Portfolio Simulator Web広告予算決定にあたって、意思決定を促す広宣費シミュレーションツール その予測ロジックの話 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL PFS 自己紹介 谷山徹 2018年LIFULL入社 機械学習やらで解決できる問題を 実装に落とし込む仕事をしています。 必要なら、できるだけなんでもやりたい。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
1.問題 何が問題で、そのためにどんなことが必要で、最終的にどんな状態を目指すのか。 2.データ 使えるデータとその加工。 目次 3.モデル ガウス過程回帰と利点。 4.ポートフォリオ最適化 複数の投資対象に対し決められた条件のもとで、最適に予算を投資する。 戦略に合わせた最適な結果を計算。 5.まとめ 流れを振り返る。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL 問題 リターン 作りたいもの 月のWeb広告予算に対してリターンがいくら 程度を見込めるのか、それが知りたい。 つまりはこの関数の形が知りたい。 予算 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL 問題 Web 広 告 ここで対象とするWeb広告はリスティング広 告やディスプレイ広告などWebの他媒体に出 稿する広告を指します。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL 問題 問題 マ ー ケ ッ ト ( 賃 貸 ・ 売 買 な ど) ご と に 投 下 す る We b広 告 予 算 を 決 定 し た い 。 いくら投資すれば、いくらのリターンが得られるのか。 ※ 全体の広宣費の予算の話であって細かい媒体ごとの予算決定の話ではない。 ※ どのような内容を広告として出すのかという話でもない。 正確に予測することはできない 時 期 に よ っ て 投 資 に 対 する リ ター ン が変 動 する 予 算 が 決 ま っ て も そ こ から の 投資 先 でま た 変わ る サ ー ビ ス の 質 に よ っ て も変 わ る Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL 問題 リターン 効率の減退 Upper bound ? 広宣は投資すればするほど、 予算に対するリターンの比率が下がっていく。 上限がどこかにあり、そこに漸近していくと ? 考えられる。 間でどんな形になるのかはわからない。 予算 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL データ データ 日毎の売り上げとそこに投資したコストのデータ。 ※ 広告が貢献した売り上げは社内の独自のDDA モデルで算出しています。 入り口/出口 弊 社 特 有 の 問 題 と し て 、中 古 マン シ ョン 向 け広 告 で流 入 した ユ ーザ ー が新 築 マン シ ョン で コ ン バ ー ジ ョ ン す る な ど入 り 口( 流 入) と 出口 ( 反響 ) がマ ー ケッ ト をク ロ スす る こと が ある 。 そ の た め 、 一 つ の コ ス トに 対 して マ ーケ ッ トの 数 だけ 売 り上 げ デー タ が紐 づ く形 と なる 。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL データ 日付特徴 特別つけられる特徴量も特にないので、日付 ◼ 年 データをできるだけ細かく、付与する ◼ 月 ◼ 日 ◼ 基準日からの経過日数 ◼ 曜日 ◼ 祝日か否か … Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL データ データ 入力データ コスト, 日付 出力データ 売り上げ( マーケットごと) X = [(コスト, 年, 月, 日, …),…] Y = [(マーケット1の売上, マーケット2の売上, …),…] Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL モデル モデル いわゆる時系列予測のタスクを解くことになるのだが、今回はガウス過程を使った回帰手法を選択した。 選定理由 ◼ド メ イ ン 知 識 を 入 れ 込 みや す い☆ ◼予 測 が 分 布 で 得 ら れ る ので 不 確実 性 がわ か る ◼過学習しない Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL モデル 回帰 データをより説明する関数を決定する。 𝑦 = 𝑓(𝑥) Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL モデル ガウス分布 ガウス分布からのサンプリング 𝑥~𝒩(𝜇, 𝜎2) 𝜇 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL モデル 𝒩 μ= ガウス分布 相関のあるガウス分布からのサンプリング 画像の例では Yが- 4 の時に、Xが- 2~0 の範囲で出やすいのよ うに偏りがある。 つまり、分布の設定次第では、XとYが同じよ うな値が出やすいようにということも可能。 Copy rig ht© LIF ULL All R ig hts R es erv ed. 1 3/5 0 ,Σ = 3/5 2 0
LIFULL モデル ガウス過程 𝑥1 誤解を恐れずにいうと、無限次元のガウス分 布のサンプルを関数とみなしたもの。 y~𝒩(𝟎, K) 𝑘 𝑖 , 𝑗 = 𝑘 ( x 𝑖 , x𝑗 ) Copy rig ht© LIF ULL All R ig hts R es erv ed. 𝑥2 𝑥3
LIFULL モデル リターン 予算-リターン モデル 𝑎 先に述べた、広宣費の効率減退をモデル化す る。0 を通り漸近線がある単純な関数を選択。 現実は必ずしもこのような綺麗な形になるこ とはないが、次の最適化のことも考えてこの 関数を選択した理由もある。 予算 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL モデル カーネル設計 ガウス過程で重要になるのがカーネル。 直感的にはデータ同士の類似度のようなものを記述する。 近いと思う組み合わせではは大きく、 遠いと思う組み合わせでは小さくなるように設計する。 入力の特徴量ごとに コ ス ト : R B F カ ーネ ル に入 れ る前 に 、予 算 -リ タ ーン モ デル の 変換 を かけ た もの + 線 形 カ ー ネ ル こ れ に よ り 、 低 額 と 低額 の 類似 度 が小 さ く、 高 額と 高 額の 類 似度 が 大き く なる 。 年 月 な ど 周 期 的 な も の :周 期 カー ネ ル 経 過 日 な ど 単 調 に 増 え てい く もの :RB Fカ ーネ ル Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL モデル 学習結果 カーネルのパラメータを学習用の過去データ から決定する。 青 点 線 よ り 左 が 学 習 デ ータ 、 右が 未 知の 範 囲で の 予測 。 灰 色 の 範 囲 は 不 確 実 性 をプ ロ ット し てい る 。 右 に 行 く ほ ど 灰 色 の 範 囲が 広 がっ て いる こ とが わ かる 。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL モデル 日毎の 予算-リターン モデルの設計がイマイチなためほぼ平行移動 しただけになっているが、狙い通り放物線っ ぽい感じに予測できている。 先 の 学 習 済 み モ デ ル か ら日 毎 に横 軸 がコ ス ト、 縦 軸が 売 り上 げ でプ ロ ット したもの。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL モデル 近似 このままでは次のステップで扱いづらいため 思い切って先の予算- リターンモデルに近似す る。 ガ ウ ス 過 程 回 帰 の モ デ ルの 予 測の 赤 線を 簡 易な 予 算- リタ ー ンモ デ ルで 近 似する。 青線は緑の漸近線。 黒点線はy=x。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL ポートフォリオ最適化 ポートフォリオ最適化 予算を投資する対象( 日付) を最適化する。 例えば、1 0 月に使える予算が決まっているもとで、何日にいくら投資すればいいかを決めたい。 ※ 前日の投資による次の日の影響などは考慮しない ※ 投資対象は日付以外のマーケットなど別のセグメントに適用することもできる。 わかっていること 日 毎 の 予 算 に 対 す る リ ター ン の関 数 。 日 毎 に 関 数 が 少 し ず つ 違う 。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL ポートフォリオ最適化 合成 同じ日に投資すればするほど効率が悪くなる という特性上、最も効率がいい日に全額投資 すればよいというものではない。 例として、三日分の日毎のモデルを最適に投 資した時の合成した関数を考える。 1 0 0 円投資するときに、最も効率の良い緑の モデルを使い続けた場合だとリターンは1 0 0 円だが、三つのモデルをうまく組み合わせる と同じ1 0 0 円投資で1 37 円のリターンを得ら れる。 モ デ ル を簡 単 な関 数 にし た こと に より こ の合 成 した 関 数が 陽 に計 算 でき る 。 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL ポートフォリオ最適化 戦略に合わせて予算を決定する その時の状況により、予算が変わる。 1 予算-リターン ポートフォリオに対して最適に投資した時の予 算( コスト) に対するリターン(売上) 2 最適分配 上記の時の投資対象ごとの予算分配 Copy rig ht© LIF ULL All R ig hts R es erv ed.
LIFULL ポートフォリオ最適化 3 損益分岐点 予算とリターンが逆転する予算を求める。 つまり、これ以上投資すると赤字になる。 4 利益最大/ROAS最適 リターン: 文字通り、リターンやROAS( リターン÷予算) が最大になる予算を計算する。 5 売上目標達成 目標売上が決まっているもとで必要な予算を計 算する。 Copy rig ht© LIF ULL All R ig hts R es erv ed. ROAS r:
LIFULL まとめ まとめ ガウス過程回帰の予測から別の簡易なモデルに近似し、予算最適化を陽に解けるように設計する流れを紹介 しました。 来月の予算を見積もるまでの手順 1 . 今 月 ま で の デ ー タ を 学 習で き るよ う に加 工 2 . ガ ウ ス 過 程 回 帰 モ デ ル を学 習 3 . 日 毎 の 予 測 を 予 算- リ ター ン モデ ル に近 似 4 . 目 標 に 合 わ せ て 、 月 の 日数 分 のポ ー トフ ォ リオ を 最適 化 し予 算 を決 定 する Copy rig ht© LIF ULL All R ig hts R es erv ed.