Pythonで機械学習を自動化 auto sklearn

193 Views

October 24, 15

スライド概要

LT about AutoML at PyLadies Tokyo 1st Anniversary party (2015.10.24)

profile-image

池上有希乃です・・・†

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

Pythonで機械学習を自動化 auto-sklearn 2015/10/24 PyLadies Tokyo 1st Anniversary Party Yukino Ikegami @_yukinoi

2.

自己紹介 • 名前: 池上 ゆきの • やってること: 自然言語処理・データマイニング • Python歴≒プログラミング歴 • ブログ – はてな: http://yukinoi.hatenablog.com/ – Qiita: http://qiita.com/yukinoi

3.

機械学習には…

4.

いろんなアルゴリズムがある

5.

α β γ いろんなハイパーパラメーターがある η λ C

6.

α β γ いろんな組み合わせがある η λ C

7.

一番いいのを頼む!

8.

そこで Auto ML

9.

auto-sklearn 与えられたデータをもとに scikit-learn の中から • よさげな前処理選んで • よさげな学習アルゴリズム選んで • よさげなハイパーパラメーター選んで それらをアンサンブル

10.

どんな風にやるの? From Feurer et al. 2015 1. Meta learning で初期値を得る 2. よさげな前処理/アルゴリズム/パラメーターを 探索 3. よさげなものを束ねる (アンサンブル)

11.

Meta Learning • どの手法がどういうデータに向いているかを モデル化 – データ数、素性の数、データ数と素性数の比率、 – クラス数、欠損値の数、歪度、エントロピー, など OpenMLの140データセットから学習

12.

よさげな組み合わせを見つける solverで探索 • 前処理/アルゴリズム/ハイパーパラメーター – SMAC • アンサンブル – runsolver

13.

実際に試してみた • 10分間探索 – https://github.com/ikegamiyukino/misc/blob/master/machinelearning/autosklearn/Example.ipynb – 学習用と検証用でデータを9 : 1に分割 • Accuracy – Iris: 1.0 – digits: 0.975

14.

Vagrantで試せるようにしたよ! • https://github.com/ikegamiyukino/misc/tree/master/machinelearning/au to-sklearn

15.

結び • AutoMLの一手法としてauto-sklearnを紹介 • 伸びしろがある感じだけど未来っぽくてよい

16.

くわしくはこちら • AutoML – http://www.automl.org/ • auto-sklearn – https://github.com/automl/auto-sklearn – http://aad.informatik.uni-freiburg.de/papers/15-AUTOML-AutoML.pdf • scikit-learn – http://scikit-learn.org/ • OpenML – http://www.openml.org/ • SMAC – http://www.cs.ubc.ca/labs/beta/Projects/SMAC/ – http://www.cs.ubc.ca/labs/beta/Projects/SMAC/papers/10-LION-TBSPO.pdf • runsolver – http://jsat.ewi.tudelft.nl/content/volume7/JSAT7_12_Roussel.pdf