>100 Views
February 12, 19
スライド概要
2019/02/08
Deep Learning JP:
http://deeplearning.jp/seminar-2/
DL輪読会資料
DEEP LEARNING JP [DL Papers] “Deep Learning for Anomaly Detection: A Survey” http://deeplearning.jp/ 1
• ��D – ���������������������� • ���������������������������������������������������������������������������� – ������������� • ����������������������������������������������� • ������� – �������������������������������R��������� �����Rha 2
Agenda ,$'" ) % &#+ !*( & 3
• T4
– DJ1A+(-C7N@XOZ$B
#= "
EK)(&R\
• ZQ
– L5QV2Q +(-C7N@XG^
– [;3_.R\>` /M$ "
• %*',Y@XIP!HC-C9W
]S!80!6<U:F$P?
4
深層学習異常検知に関わる多くの研 究まとめ論文があるが、1つのドメ イン/領域に絞った上でのレビューが 多い。 数多くの深層学習異常検知手法が提 案されている。 この論文では広い産業適用での活用 状況をレビューと 手法の分類方法にサブカテゴリー (ハイブリッド異常検知と1クラス ニューラルネットワーク)を追加し、 手法を整理している。 5
6
異常とは? 普通とは違う、逸脱した値、外れ値。N1, N2は大多 数の観測値の集合であり、正常と考えられる。O1, O2, O3は少ない集合であり、大部分と乖離している。 異常値と考えられる。 新規性とは? 新しい傾向や今まで観測していないパターン。 7
単一異常 文脈/条件異常 集団/グループ異常 多くの場合これに当てはまる。ラン ダムに発生し、特段理由もない場合 もある。 正常状態の文脈と行動・パターンを 考慮した上で、乖離が見られる場合。 正常の集団から乖離した単体の異常 集合 クレジットカード取引の例: 他に比べて大きな乖離 温度の例: 時系列的な観点でパターンがあるよ うに見える。その上で、6月付近でパ ターンを無視した乖離 不正クレジットカード利用の例 MISCの異常が1件だけであれば異常と はみなされないが、連続的に$75の取 引があり、異常の候補となる 8
• &;$9 5,=7# !-
5
• .<'"&;$9 5
• (+%$9!-1 840<%
3*: $240<)6/
9
10
• 教師あり 深層異常検知 半教師あり 深層異常検知 教師情報の有無に よる分類 教師なし 深層異常検知 ハイブリッド 深層異常検知 One Class ニュー ラルネットワーク 訓練目的による 分類 11
• 7b
– ;BZ #*(
:5O$8G 8G -*0)'+*($N
J3J\e"
– ;BK^$<g"9`V;B YMX d
– 3J>T('&3J*( FW! %"
;B!3J>T!ca #`h]H@
1,.SI6
• PU
– ;B F_ *(=?4E2Q"S ;B!;BZ
#*(2Q"
– [LNJ&/'$DR&/'3J>TCfQA
12
• .R
– N39&OU*<8H7V"
Q1
– ?<=Q)2,@/:
– FE>&;D *<
&39=
• AJ
– MTLIS604RBK &%'
– ?<-G5P LI$!#(+C/:
13
• �� – ������������������� ��� – ������������������������ ������������������������� �������������� – ������������������� ���������������� • �� – ������������������� ������������������� ������������������� ��� – ���������������������� ������������������� 14
One-Class (OC-NN) • ������������������������������������������������� – ������������������������a��� – ����������������a������������������������ ��a��������a��� – ��������������������������a�������������� ��������������a������������������������� ��a��� – ����������������������������������� ������������ • ������������������������������������������������ – ���������������a������������������������� ������������������������������ – �������������a��������������������� �a����������� 15
• �� – �������������������C������������C�� �� – ���������������C�������� – �����I������C���������I��������������������C ���������������������� • �� – ��������������������C����������� – ������������ – �������������I��C������������������ ������������ 16
/ メリット 教師あり深層異常検知 • • 半教師あり深層異常検知 • • ハイブリッド深層異常検知 • • 半教師ありや教師なしに比べ性能が良い 傾向がある テスト予測の処理が早い(訓練済みのモ デルに対して比較するだけ) • GANがかなり少ないデータでも半教師あ りで成果を上げている 教師情報を利用することで教師なしに比 べ性能がかなり向上する • 過学習となりやすい 高次元のデータを扱う際に、”次元の呪 い”に陥るリスクを削減できる 従来モデルは次元削減後のデータを扱う ので、スケールしやすく、計算的効率も 良い • 異常検知のために特徴量抽出した情報で はなく、一般的な特徴量表現情報を用い るので最初の選択肢とはなりにくい • 高次元データでは訓練時間が長くなる • 複雑で高次元の場合、特徴量を学習する のが難しい場合がある Autoencoderなど次元圧縮系の手法は良い 結果を得るためにチューニングが必要 ノイズに弱い 教師ありや半教師ありに比べて精度が下 がる 1クラスニューラルネットワーク異常検知 教師無し深層異常検知 • デメリット アノテートがいらないので、コストがか からない • • • • 分類するクラスの正確な教師情報が必要 (異常検知では手に入りにくい) 特徴量があまりに高次元で、非線形の場 合は正確に分類できない場合がある 17
%/ • – %)",. • ) – *' % %)", ' - )", • &+*' - – !2$10 -(# &+*' -(# (# )", 18
19
• $F"
–
–
–
–
–
–
–
–
–
–
/*DB6)
7>,<
?8,<
,4
!E+ 5,<
5,<
5,<
.* 5,<
2+G 5,<
#9'1
• $=
-(
– A;&C
–
5,< : %;
– 0B 3@
5,<
20
• a
– =>CP-+Z[+2x+i
– xi=>CP
• N>EM>
– ]+N>E<YJR@&W:t+
+fv0i!2
/
• GBEX9M>
– GBEX9I;BE0` ETK7B94is!2
– D@,&{}
– iq
• =:GAQM>
– kh'l032I@Y4yej)(&fm #=:F
AQoz =:FAQ*c$%kh4
– +kh*~^&)
• 6HOUM>
• _
– yu)g4br %LWK58V4n1"+LWK58V*c
$%\u)w4i
– xp,d|+i?UR=SY42#.kh4
%2
21
• M
– qJ|#`^xCo]O\D
– XS\9=.+'
• d
– S\
• *>-12)3]OF~60A
• T_kQ%V<,8?7&(=!G{%W
– ;5(=
• Ynj%Hr]OR%P#:1/• y412@*v
• fcmI ]Oc
– X]O
#
• fc #pL%i #E
• ?5.2}%b#tK #csU
• ]Oaw h $$Z"[#
luNec B$#
zxg#
22
• /R
– %)&!73D
– :S8M %)3D?
"#(* C.L
8MJFUE;LW'
• -B
– $#NA
– %)42HQKV5 4263DO5I1<T
Q
– PB@, =>098MG+
23
• ;R
– 6S9G:F2$,(
• 8I
3#OK!DJQP?S!
– %3+03'* ( 5C* (B
– <7:@EA>"
-0)&.)&'MNH
:@E=/*1L4"!
24
• 4L
– ,.&!%/'*-@EJFA0#0":5
(-$)I>
– ,.+$=M<K1?8D H
96
B
• 3C
– J72GE$
@;
25
• ;W
– 5!-4"$)/2QTYSC ) $+N
– ,&6.('6!>EAXV G<0(%#>
O
=P
– DJ?@ 71*4I9F
• :M
– 5!-.(+LUBK8
– 34&/>ORWH
26
IoT
• 3V
– (+# ?7W$1!(%
– *&)0 PEO=6O9M
• 2L
– JU(+# *&)0 8 "
#'-FK Q>:D
•
I
– 5B;CG4A@T
/,.XR SNH<
27
• <m
–
–
–
–
jq-14fdQJ7(03)+,.2a\H$
DKb>c"!L:gib![A5UF`Mp !Pm
YhISfX #VR
OnB;=Nol%$*,$ !
IS[AF`W8'T$
• 9_
– ^Ck
E@G6?&$mZ]
/-#eb$
28
• �� – ����������������������� – ������������������������������� ����IL�� • �� – �������������� – ���������������������� – ����������������IL�������� ��������� • � – ����������������������� • ����V������������������������� �������� – ������������������������������������������������� ���������������������������������������� ����������� • ��������������������������� ������L������������������ • ������������������L�� 29
• 4P
– 5>(+</
• 1G
0E"),$6J3D
– 8=CNK2%#FQ
– O?I.BH7
A:'$
• L
K;</A@
.BH7M
*-!&9
30
31
• ������������� – ����������������������������������������� ������ – ����������������������������������� �� – ���������������������������������������������������� • �����������L��������������������������������� ����������������������LOC • �������������� – ������������������������������������� – ����������������������������������������������������������������������� ���� ������������������������������ • ����������������������������������������������� ������������L�����C 32
• mNTcJCMfZj
– mNTc3:./YyGE4w"\;>//8]R@e%=&1"0#=
–
•
9 4GEDFH@MfZjECB1(/L./mNTc4]R@Sn
• WPTcJC4MfZj
– ^`[GEXU4p_2h=o@Tc*=,74rs1(/kt'>/
=
– Mf3V*=gq5;!)7Q8u +qd@l(/Mf3V?=ja@
na(/$
– i(xO0<bvP6056-AKFI"=
33
• TWDP@SIZXH[`E[=5:
• TWDP@SIZOb$Ug(1*<cVS@SJ a
9<0329<03$##feB]2.-03
"
• KFhAY"TWDP@SIZ@SIZOb$
• ##hA "\#Y"&7>/$RC
• "hA2. d
#M)'4;'?fe
• 8+^_G
=6%=?,!NQ[L
34
35