ルールと機械学習を融合させた不正決済検知システム #yjtc / YJTC21 A-2

4.3K Views

January 12, 21

#yjtc

スライド概要

クレジットカードの不正利用額は年々増えており、オンライン決済での不正決済への対策は必要なものになっています。
このセッションでは、ヤフオク!やYahoo!ショッピングでの不正決済検知の仕組みについて、検知システムの概要と、機械学習の適用方法を中心に紹介します。

Yahoo! JAPAN Tech Conference 2021 は2021年1月22日に開催しました。
https://techconference.yahoo.co.jp/2021/

Yahoo!デベロッパーネットワーク

@ydnjp

スライド一覧

2023年10月からSpeaker Deckに移行しました。最新情報はこちらをご覧ください。 https://speakerdeck.com/lycorptech_jp

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで

Yahoo!デベロッパーネットワーク 195.5K

ゼロから始める転移学習

Yahoo!デベロッパーネットワーク 92.5K

ヤフーにおける WebAuthn と Passkey の UX の紹介と考察 #idcon #fidcon

idcon fidcon

Yahoo!デベロッパーネットワーク 83.5K

OpenID Connectとネイティブアプリを取り巻く仕様と動向 Yahoo! JAPANの取り組み #openid #openid_tokyo

openid openid_tokyo

Yahoo!デベロッパーネットワーク 65.8K

運用業務とスクラムは本当に組み合わせにくいのか︖運用業務が大半を占めるプロダクト開発での試行錯誤

devsumi

Yahoo!デベロッパーネットワーク 44K

ZAP - ZCPをベースとしたマルチK8sのアプリケーション実行基盤 #YJTC / YJTC21 B-3

yjtc

Yahoo!デベロッパーネットワーク 34.4K

各ページのテキスト

1.不正決済とは不正決済の被害額推移不正被害額は年々増加傾向にあるため対策は必須日本におけるクレジットカード不正利用被害額 (番号盗用被害) 単位:億円 250 200 150 100 50 0 2014年 2015年 2016年 2017年 2018年 2019年日本クレジット協会「日本のクレジット統計 2019年版」 https://www.j-credit.or.jp/information/statistics/download/statistics_domestic_2019.pdf ©2021 Yahoo Japan Corporation All rights reserved.

10.

11.

12.

13.

2.検知システムの概要システム概要審査チームエスカレーション Client 判定リクエスト /結果判定API ルール参照ルール (Cassandra) Webツールルール管理ルール管理者結果分析判定ログ feedback loop Feedback 審査結果ログ DWH (Teradata) データ参照レポート (Tableau) ©2021 Yahoo Japan Corporation All rights reserved.

14.

15.

16.

17.

18.

19.

20.

21.

4.機械学習の適用方法方法①：機械学習の判定スコアをルールに組み込む 1. 判定モデルを作成 2. モデルの推論APIを用意 3. モデルのスコアを条件にしたルールを登録 4. スコア取得&ルール参照スコア取得推論API 【条件】 param [=| <| >|in|not in] value 判定API ルール参照スコアしきい値 ©2021 Yahoo Japan Corporation All rights reserved.

22.

23.

24.

4.機械学習の適用方法モデルのスコア補正 (キャリブレーション) について補正が必要なケース (1) モデル学習時にアンダーサンプリングを行った場合 p = βps βps - ps + 1 論文「Calibrating Probability with Undersampling for Unbalanced Classification」 https://www3.nd.edu/~dial/publications/dalpozzolo2015calibrating.pdf p : 補正後の確率 ps : 不均衡モデルの予測確率 β : ダウンサンプリング率補正前補正後 ©2021 Yahoo Japan Corporation All rights reserved.

25.

4.機械学習の適用方法モデルのスコア補正 (キャリブレーション) について補正が必要なケース (2) 「スコア ≠ 確率」なアルゴリズムを使う場合 Calibration plots (reliability curve) 1.0 0.8 0.6 0.4 0.2 0.0 0.0 0.2 0.4 0.6 0.8 1.0 Perfectly calibrated Logistic (0.099) SVC (0.163) SVC + Isotonic (0.100) SVC + Sigmoid (0.099) https://scikit- learn.org/stable/auto_examples/calibration/plot_calibration_curve. html#sphx-glr-auto-examples-calibration-plot-calibration-curve-py ©2021 Yahoo Japan Corporation All rights reserved.

26.

4.機械学習の適用方法方法②：ルール自体を機械学習で自動生成する 1. 決定木モデル作成 2. 適合率の高いノードを選定 3. 選定したノードまでの分岐情報を抽出 4. ルールに変換&登録する【凡例】オレンジ: 判定クラス0 (通常) ブルー: 判定クラス1 (不正) ルール (Cassandra) ルール登録 DWH (Teradata) データ抽出ルール生成 AND 条件A 条件B 条件C ©2021 Yahoo Japan Corporation All rights reserved.

27.

28.

29.

4.機械学習の適用方法システム概要 (機械学習適用後) 審査チームスコア取得推論API エスカレーション Client 判定リクエスト /結果判定API ルール参照ルール (Cassandra) Webツールルール管理ルール管理者結果分析判定ログ審査結果ログ DWH (Teradata) データ参照ルール登録データ抽出ルール生成レポート (Tableau) ©2021 Yahoo Japan Corporation All rights reserved.

30.

31.

32.

33.

安全な決済で日本をもっと便利に Photo by Paul Felberbauer on Unsplash

34.