243 Views
July 03, 18
スライド概要
2018/07/02(月)開催
Ltech#1 LIFULL HOME'S 機械学習Night講演スライド
登壇者:株式会社LIFULL データサイエンティスト 椎橋怜史
機械学習を用いた事例についてお話します。
・広告費予算の最適化(広告マーケティングチーム)
・画像種類の判別モデル(App, 流通チーム)
LIFULL HOME'Sを運営する株式会社LIFULLのアカウントです。 LIFULLが主催するエンジニア向けイベント「Ltech」等で公開されたスライド等をこちらで共有しております。
LIFULL HOME’Sでの機械学習活用 (広告費最適化・画像判別) 株式会社LIFULL LIFULL HOME‘S事業本部 新UX開発部 AI推進ユニット 椎橋怜史 2018/07/02
自己紹介 • 椎橋 怜史 • 2016年4月 LIFULL 新卒入社 • データサイエンティスト Qiita: @shiibass Twitter: @shiibass 興味ある分野 • 量子計算 • 数理最適化 • 強化学習 • ゲーム理論 • データ分析系の仕事を担当 © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
AI推進ユニット 「+AI」の方針で既存サービスにAI機能を追加、新規AIサービスの開発 AI技術に限らずテクノロジーで想像を超えるようなサービスを目指す 他部署と協力・分担してAIサービスをリリース イメージ 流通事業部 チーム LIFULL HOME’S APPチーム AI推進U 広告マーケ ティング チーム 営業チーム © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
自分が意識していること シンプルさ(説明力) 線形回帰とか • 計算精度の高さ、シンプルさは トレードオフのケースがある • 精度が高いからプロジェクトが うまくいくというわけではない • 案件ごとに必要なもの・求められる ものは異なるからヒアリングして推 ディープラーニングとか 察、アルゴリズム選定 計算精度 • © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
今までやってきたこと ()は協力した他チーム • 広告費予算の最適化(広告マーケティングチーム) • Androidアプリの物件レコメンド(App開発チーム) • 物件問い合わせ予測(営業チーム) • 画像種類の判別モデル(App, 流通チーム) • その他いくつか © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
今までやってきたこと ()は協力した他チーム • 広告費予算の最適化(広告マーケティングチーム) • Androidアプリの物件レコメンド(App開発チーム) • 物件問い合わせ予測(営業チーム) • 画像種類の判別モデル(App, 流通チーム) • その他いくつか © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
広告費予算の最適化 © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
広告費予算の最適化 • 数十の広告媒体にいくら予算を投下するのが最適かを計算する • 各媒体に広告グループが設けられていて、最小粒度にすると数百万ある (数百万のポートフォリオ最適化問題) • 検索広告やディスプレイ広告など広告媒体ごとの特徴 • 自動化したい • 売上上げたい ↓検索キーワードに対して広告を設定可能 © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
可視化できるようなシンプルな予測モデル 各広告媒体に対して予算を追加すべきか削減すべきか可視化 現在の予算 最適値 効果値 抑制 強化 抑制 コスト 運用者の予算配分の考え方を踏襲しつつ、 徐々に理論的なアルゴリズムに変更 ↓ 最終的には完全自動化を目指す © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
最適化アルゴリズム アルゴリズム • シンプルな凸最適化 • 予算運用者が解釈可能(可視化可能)なように • データが増えても計算量増えすぎないように • 一意な結果を返すように アルゴリズムイメージ 効果 効率いい広告を探して予算追加 していく 𝑑: small budget while 𝑏𝑢𝑑𝑔𝑒𝑡𝑠𝑢𝑚 > 0 calc 𝑓𝑖 ′(𝑏𝑢𝑑𝑔𝑒𝑡𝑖 ) for any 𝑎𝑑𝑖 calc 𝑎𝑟𝑔𝑚𝑎𝑥𝑖 𝑓′(𝑏𝑢𝑑𝑔𝑒𝑡𝑖 ) 𝑏𝑢𝑑𝑔𝑒𝑡𝑖 += 𝑑 return array 𝑏𝑢𝑑𝑔𝑒𝑡𝑖 微分f_i’(x_i) 微分 コスト © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
画像種類の判別モデル © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
画像種別を自動で判別してタグ付け • 情報精度向上 • 入稿処理自動化 © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
ディープラーニングで画像の特徴を学習 ・・・ 巨大&複雑 tf.nn.softmax (tf.nn.fully_connected tf.nn.dropout) * 2 Inception v3(学習済みモデル) 自前実装 画像判別モデル • 学習済みモデルを活用することで計算量を抑えられ、 用意できないデータに対しても間接的に学習したことになる © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
実行環境はクラウドに任せて、精度向上に集中した開発 • • • • GCP cloud machine learning engine上で学習・デプロイ 教師データはCloud Storageに保管 モデルのネットワークやパラメータの設定に注力できる 実用可能な精度のデプロイまで3日で開発 参照 (教師データ) 画像データ © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
その他 © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。
その他施策いろいろやってます レコメンド Amazon D yn amoDB AWS D ata P ip eline 物件の問い合わせ予測 入力:物件情報 出力:問い合わせ発生確率 AWS Lambda Amazon API Gat eway* Amazon CloudWatch Amazon S3 Amazon At h ena © LIFULL Co.,Ltd. AWS Data P ip eline AWS Elastic Beanstalk 本書の無断転載、複製を固く禁じます。
最後に • 社内データすべてがサイエンスの対象 (広告データ、ユーザーログ、物件データ、画像など) • クラウドサービスを利用したスピーディーな開発 • やろうと思えばいろいろできる環境 • 仲間募集してます • なにかあったらtwitter(@shiibass)とかで © LIFULL Co.,Ltd. 本書の無断転載、複製を固く禁じます。