データサイエンティスト養成講座(全7日間)_説明会

176 Views

September 27, 24

スライド概要

データサイエンティスト養成講座の説明会資料です。
(10/18現在)開講日が2025年1月に変更になったため、日程のページを差し替えました。

profile-image

ワークシフト研究所セミナーに関する資料です

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
2.

2025年1月開講 データサイエンティスト養成講座スケジュール ◇開催方式:オンライン開催(Zoom) ※オンライン開催ですので、全国どこからでもご受講可能です。 ◇開催日程:2025年1月~2025年3月(7日間・短期集中カリキュラム) 2025年:1/18 (土)、1/25(土) 2/1 (土)、2/15(土)、 2/22 (土) 3/1 (土)、3/15(土) ※各日とも講義・演習時間: 9:30~17:00 、昼食休憩:12:00~13:00を予定しております。 ◇「データサイエンティスト養成講座」詳細説明・お申込みページ ⇒https://wsi.eventos.tokyo/web/portal/837/event/9216/module/booth/259038/246524 ◇講義動画:講義内容・演習内容はすべて録画しており、開催期間終了後も180日間録画の視聴が可能です。 ◇欠席時の対応・フォローアップ日(全7回) ※機械学習ソフトの操作方法や講義内容について、個別にQ&Aにお答えするフォローアップ日を別途準備しております。 講座日とは別に全7回を予定。講座当日に欠席・一部欠席された方などご活用ください(フォローアップ日の利用は任意です)。 ※メールによるQ&Aはいつでも受付します。手厚くフォローしますので欠席の際もご安心ください。 ※その他、開催期間終了後も180日間メールにて録画視聴・Q&Aフォロー対応を致します。 2

3.

講師・教材コンテンツ開発 高木 宏明 Hiroaki Takagi うどんの国(香川県)出身 データ分析コンサルタント ワークシフト研究所講師・研究員 フレイ・アンド・テクノロジーズ株式会社 代表 慶應義塾大学大学院 経営管理研究科(ビジネススクール・MBA)修了 国立 高松高専専攻科 機械電気システム工学専攻 修了 ビジネス理論から機械学習アルゴリズムまでわかりやすく解説することが得意です 楽しく機械学習・データサイエンスを学びましょう! (大学講師歴) 慶應義塾大学大学院 経営管理研究科 非常勤講師 「データサイエンス」(2019年度1学期~2023年1学期) 青山学院大学 社会情報学部 非常勤講師 「データマイニング」「データマイニング演習」(2018,2020,2021年度) 3

4.

職業のデジタル化 コンサルタント テクノロジーコンサルタント -DX改革、AI導入、ロボットによる自動化 etc マーケッター デジタルマーケッター -購買予測モデル、レコメンデーション、導線分析 デジタル広告入札自動化、画像検知 etc 経営企画 AI/DX推進担当・新規事業担当 -社内DX変革の推進リーダー -テクノロジーを活用した新ビジネス企画 -テクノロジースタートアップとの協業、M&A etc 4

5.

職業のデジタル化例:営業DX (マーケティング~カスタマーサクセスまで、一気通貫のデータ連携) インサイド セールス マーケティング アカウント セールス カスタマー サクセス 80 70 『データにもとづく顧客マネジメント』 60 ◇顧客A社: ⇒利用方法の教育・現状課題ヒアリング (将来の契約打切り防止) 50 40 30 20 ◇顧客B社: ⇒アップセル・クロスセルの提案 (ヘビーユーザー・売り上げUP) 10 0 顧客A 顧客B 顧客C 顧客D 製品導入後の利用回数 5

6.

目指す人材像 データ分析能力を駆使し、ビジネス課題解決・デジタル変革で活躍する人材を育成 課題背景を理解した上でビジネス課題を整理し、 解決する力(≒ビジネスコンサルタント) ビジネス力 (Business Problem Solving) 情報処理、人工知能、統計学などの 情報科学系の知恵を理解し、使う力 (≒データサイエンティスト) データ サイエンス力 (Data Science) データ エンジニア リング力 (Data Engineering) データサイエンスを意味ある形に使え るようにし、実装、運用できるように する力(≒ITエンジニア) ※一般社団法人データサイエンティスト協会「スキルシート」資料を一部改変 6

7.

三種類のアナリティクス職 ✓ データ分析案件の特性と個人の資質・能力に応じてアサイン 特に求められる能力 キーワード 役職名称 ビジネスアナリティクス・ BIコンサルタント リサーチャー・ 先端技術開発 機械学習エンジニア・ データエンジニア • クロス集計・KPI設計・可視化(BI) • 記述統計・A/Bテスト設計・因果推論 • 説明性・解釈性の高い機械学習アルゴリズム • 画像処理・自然言語処理・時系列解析 • 線形計画・数理最適化 • Deep Learning・強化学習 • ビッグデータ処理・高速化 • データ連携・データ加工処理(前処理)のパイプライン • 予測精度モニタリング・予測モデルの自動更新 ※データ分析に必要な力:一般社団法人データサイエンティスト協会資料を参考に作成 7

8.

講座の特徴 ✓ 専門的な機械学習・データ分析テクニックを習得する短期集中カリキュラム ✓ DXに必要なビジネス理論解説(経営戦略・マーケティング・組織論)&ケース教育も 実践的なカリキュラム で短期間で成長できる ✓ 演習時間多め、最終課題は実践的な予測モデル精度向上・データ分析課題にチャレンジ ✓ テキストは図解で解説、書籍では分かり辛いポイントも丁寧に解説 ✓ 講師はMBA(経営学修士)も保有し、ビジネスでのデータ活用事例も解説 ✓ 学生・ビジネス職の方へ1000名以上の講義経験(わかりやすいと評判) 初心者でも分かり易い 事前スキル不要・ ビジネスパーソン でも参加しやすい ✓ 無料の機械学習ソフトを利用、プログラミングのスキル不要で学べる ✓ 土曜日オンライン開催、欠席時も動画視聴とフォローアップ日の活用でカバー 8

9.

カリキュラム概要 1日目:イントロダクション / クラス分類入門 2日目:回帰入門 • AI基礎とキーテクノロジー進歩 • 教師あり学習:回帰 • イントロダクション:機械学習の全体像 • • 機械学習ソフト紹介、データ可視化、教師あり学習:クラス分類 予測モデル精度向上テクニック解説・演習 (変数選択・ハイパーパラメータ最適化) 3日目:前処理・特徴量設計入門 4日目:マーケティング理論・ケースメソッド • 前処理・特徴量設計入門 • マーケティング理論入門 • Deep Learningによる画像分類入門(MNIST) • 消費者行動論・組織的購買 • グループ課題 解説・演習 • ケースメソッド演習・グループ課題 5日目:経営戦略論 ・組織論・データ分析演習 6日目:IT基礎など・データ分析演習 • 経営戦略論入門 • ITソリューション企画、情報基礎理論・マルチメディア入門 • 組織論入門 • データベース入門 • マーケティング・データ分析演習 • グループ課題演習 最終日(7日目):グループ課題発表・総まとめ ✓ 専門的なスキルを身につける機械学習・データ分析短期集中コース(全7日間) • グループ課題演習・プレゼンテーション ✓ データ分析の実践的な演習と課題に重点 • 総まとめ講義:データ分析プロセス(CRISP-DM) ✓ 戦略・組織・マーケティングなどDXに関連するビジネス理論も学ぶ 9

10.

他社研修講座との違い 他社講座 ✓ 講座費用:70万円~80万円 データサイエンティスト養成講座 ✓ 講座費用:35.9万円(約半額) ✓ 期間:約半年~(全36回開催)など ✓ 期間:全7日間の短期集中カリキュラム ✓ 受講に際して前提知識が必要 ✓ 受講に際して前提知識が不要 (高校レベル数学・プログラミングスキル要) ✓ エンジニア出身の講師が多い (教材開発者と別人) (数学・プログラミングスキルが不要) ✓ データ分析とビジネスの両方に強い講師 (教材開発者がそのまま講師担当) 10

11.

教材サンプル① 機械学習アルゴリズムも図解を多用して解説 11

12.

教材サンプル② 書籍では手薄な実務的課題・注意点も解説 12

13.

教材サンプル③ ビジネス理論解説(経営戦略論・組織論・マーケティング) 現実のビジネス課題を模した ケースメソッドによるディスカッション ビジネス理論・ケースメソッド 13

14.

ノーコード機械学習ソフト(AI Studio):画面サンプル① 「ノーコード機械学習ソフト(AI Studio)」 プログラミング未経験者でも簡単に予測モデルがつくれる (Pythonだとコード記述に1時間かかるデータ分析プロセスがわずか5分で構築可能) 14

15.

ノーコード機械学習ソフト(AI Studio):画面サンプル② 豊富なデータ可視化機能でデータ内容を理解しやすい 15

16.

ノーコード機械学習ソフト(AI Studio):画面サンプル③ 高度な処理も簡単にできる: (例)パイパーパラメータ最適化(グリッドサーチ) 最新のアルゴリズムも簡単に試せる 『クラス分類アルゴリズムの例』 ✓ k-NN / k近傍法 ✓ Logistic Regression /ロジスティクス回帰 ✓ Decision Tree / 決定木 ✓ Random Forest / ランダムフォレスト ✓ Gradient Boosted Trees / 勾配ブースティング決定木 ✓ Support Vector Machine / サポートベクターマシーン ✓ Naive Bayes / ナイーブベイズ ✓ Neural Net / ニューラルネットワーク、Deep Learning / ディープラーニング ✓ Ensembles / アンサンブル学習 (Vote/ボート、Bagging /バギング、Boosting / ブースティング、Stacking / スタッキング) 16

17.

(機械学習・データサイエンス講座)受講者の声・感想① ※速修2日間講座の感想含む 文系でもわかりやすく教えて頂いてとても良かったです。機械学習とは何かを教えて頂いたこと、演習が多い点が学びになりました。 またフォローアップ日に詳細な質問をすることでさらに学びが深まりました。 (女性参加者) 全体的に講義の説明やペースがちょうどよくでわかりやすかったです。 機械学習の実際の活用の仕方のところが大変参考になりました。 また、回帰編では変数選択のところが特に参考になると感じました。(購買部門・男性参加者) 興味ある分野だったのでこれまで独学で勉強もしていましたが、勘違いしていた点など改めて勉強になりました。 独学である程度勉強されている方にもおススメできる講座だと思います。(ITエンジニア・男性参加者) 教師あり、教師なしアルゴリズムの違いやデータ分析の目的、予測精度向上テクニックなど多くの点を学べました。 私は文系卒ということもありPythonで独学しようとしてプログラミングで挫折していましたが、今回はバッチリついて行けました。(女性参加者) 入門書や雑誌の特集を読んでなんとなく理解していたことが、ノーコードツールを使って自分でできたことが面白かったです。 機械学習アルゴリズムの具体的な利用イメージがつくようになりました。(DX企画・男性参加者) 以前から学びたいという気持ちはあったものの内容が難しく初心者にはハードルが高かったのですが、 初心者にもわかるように教えていただき最後までなんとかついていくことができました。 この分野の学習の敷居が少し下がったことが、参加して一番の収穫でした。 分類や回帰など、データサイエンスにおける基本的な考え方を体系的に学ぶことができた点が良かったです。(人事部門・女性参加者) 17

18.

(機械学習・データサイエンス講座)受講者の声・感想② ※速修2日間講座の感想含む ・データサイエンスを学んだ事がなかったため新鮮で楽しく受講できました。 講師の方のレクチャーは初心者でもわかりやすいように簡潔かつ丁寧でとてもよかったです。 講義の中で演習が多くあり、演習を通してデータの分析方法を肌で感じることができたことが特に良かったです。(製品開発・女性参加者) ・わずか2日間という短い期間の中で機械学習のエッセンスが積み込まれた内容はすばらしいと感じました。 プログラムなどの経験が無い者に対してR・Pythonなどを使用しないで、 (機械学習ソフト)ラピットマイナーを用いたことで大幅な作業・気持ち的な負担感が軽減できたと感じています。 ・テキスト/資料や講義での説明はポイントを絞った簡潔で、例えも交えた説明をして頂けたのでイメージができ、 難しい機械学習の書籍を複数読むよりは、短時間で各段に理解が進んだと思います。 ・また、別途フォローアップの場とセミナー録画で復習ができることは大変ありがたかったです。ありがとうございました。 (人事部門・男性参加者) ・大変有意義な二日間でした。自分の業務への活用の仕方をイメージしながら受講出来た点がとてもよかったです。 おそらく専門書から入ったら、実務との接点をつかめないまま門前払いになっていたと思います。データ可視化はすぐに実務で実践したいと思いました。 ・また、予測精度や異常値の扱いなど機械学習の注意点やその影響範囲、データを眺めることの重要性など、 機械学習を取り入れるにあたっての重要な前提を、実例をもとに学べた点がとてもよかったです。 ・文系出身者にはなかなかイメージを持ちづらい部分をクリアにすることが出来ました。 (経営企画部・女性参加者) 受講前はかなり構えていましたが、(機械学習アルゴリズムとは?)に関する例え話の解説を聞いてから、肩の力を抜いて参加できました。 機械学習で出来るところ、人間が指定するところ、人間が考えるべきところなどの区分けを随所で説明くださったのが理解に繋がりました。 演習の途中、操作に迷った際も取りこぼされることなく繰り返し説明してもらえて、とても嬉しかったです。 (法人営業・女性参加者) 18

19.

受講環境・想定参加者・トレーニング修了証 ◇ツール・受講環境 ✓ PC(Windows or Macどちらでも可、メモリは8G以上を強く推奨) ✓ ノーコード機械学習ソフトウェア:RapidMiner(Free版) ※インストール方法など受講生へ別途ご案内致します ✓ 通信環境(オンライン講義いたします・Zoom) ✓ その他、ハンズオン演習の際は”デュアルディスプレイ視聴(2画面モニター)”もしくは”タブレッドでの同時視聴”を推奨です ◇想定参加者 ✓ 経営企画・営業・経理・オペレーションなどビジネス職の方、社内SE・エンジニアなど技術者の方 ✓ ITエンジニア・コンサルタントなど顧客に提案するベンダ担当の方 ✓ その他、学生・社会人など事前の知識・前提条件はありません、どなたでも受講可能です ◇トレーニング修了書の発行 ✓ 講座への80%以上の出席(動画視聴参加含む)・最終課題:データ分析レポートの提出者には、 「データサイエンティスト養成講座」修了証を発行いたします 19

20.

ご受講に際してのQ&A (前提知識・スキルについて) ・バックグラウンドが文系です。数学・プログラミングは苦手なのですが受講可能でしょうか? ・以前、機械学習の書籍を購入し、独学で勉強しようとして挫折したことがありますが大丈夫でしょうか? ⇒はい、なるべく数式を用いずに図解で講義し、演習は機械学習ソフトを利用しますので問題ありません(前提知識・スキルなどは不要 ) 講師は文系学生・ビジネス職の方への講義も多数経験がありますのでご安心ください。 ⇒エンジニア・研究職の方が多かったのですが近年は、学生・営業・人事・経営企画・製造など幅広い職種の方にご受講頂いております。 また、受講者の男女比率は半々、年代は10代~50代の幅広い層の方にご受講頂いております。 (欠席・一部欠席について) ・業務都合・家庭の都合で講座に参加できない日程がありますが問題無いでしょうか? ⇒講義・演習はすべて録画しており、視聴URLを参加者全員へ共有いたします。 また、Q&Aフォローアップ日やメールによる質問へも対応しておりますのでご安心ください。 (フォローアップ日について) ・フォローアップ日も参加が必要でしょうか? ⇒フォローアップは参加必須ではありません。ご質問・ご相談がある方のみご参加ください。フォローアップの時間帯は常にZoomをオープンにしております(予約不要・途中入退出自由) 尚、講座日もQ&Aの時間を十分に設けております。 (講座の中止の場合について) ・講師がコロナに罹患するなど講座の中止などはありえますでしょうか? ⇒過去開催時の動画など、バックアップやフォローアップなど手厚く対応致しますのでご安心ください。 (受講環境について) ・パソコンがMacですが参加可能ですか? ⇒はい、可能です。機械学習ソフト(Free版)はWindows / Mac両方へ対応しております。受講環境については前ページのスライドをご参照ください。 (領収書・法人名義支払について) ・領収書の発行は可能でしょうか? ⇒はい、可能です。個人名義・法人名義どちらでも対応しております。ワークシフト研究所 事務局([email protected])までご連絡下さい。 ・所属企業・団体から研修費としてお支払したいのですか可能でしょうか? ⇒はい、可能です。法人様向け銀行振込(請求書払い)へ対応しております。ワークシフト研究所 事務局([email protected])までご連絡下さい。 (修了証の発行について) ・トレーニング受講後、修了証は発行されますか? ⇒はい、講座への80%以上の出席(動画視聴参加含む)、最終課題:データ分析レポートの提出者には、「データサイエンティスト養成講座」修了証を発行いたします。 20

21.

詳細カリキュラム 1日目:イントロダクション / クラス分類入門 2日目:回帰入門 ◇AI基礎とキーテクノジー進歩 ◇教師あり学習:回帰 ✓ 弱い AI・強い AI、探索・推論・知識表現 ✓ 線形回帰アルゴリズム解説 ✓ Deep Learningを中心としたAIの発展概況 ✓ 回帰評価指標:MSE・RMSE・R2 ✓ 生成系AIとホワイトカラー・クリエイティブ職への影響 ✓ ハンズオン演習① テスト点数予測 ✓ 強化学習とオペレーション職の協働 ✓ ハンズオン演習② 住宅価格予測 ✓ データの非線形性とノンパラメトリック回帰 ◇イントロダクション:機械学習の全体像 ✓ クラス分類アルゴリズムの回帰への適用 ✓ データ分析者に求められるスキルセット ✓ 回帰における重要注意点 ✓ 教師あり学習・教師なし学習・強化学習 -予測範囲:内挿・外挿 ✓ 機械学習の目的・メリット、説明性・解釈性と予測精度 -多重共線性の影響と確認手法 -外れ値・異常値が予測モデルをどう歪めるのか? ◇機械学習とRapidMiner入門、教師あり学習:クラス分類 ✓ データ型、目的変数と説明変数、可視化 ◇予測モデル精度向上テクニック解説・演習 ✓ アルゴリズム解説:決定木・K-NN・SVM・Naive Bayesなど ✓ アンサンブルモデル:Random Forest、Gradient Boosted Trees ✓ ハンズオン演習①:アヤメの花の分類 ✓ ハイパーパラメータ最適化:グリッドサーチ ✓ ハンズオン演習②:予測モデルの学習と適用 ✓ ステップワイズ法、Tree分割基準 ✓ ハンズオン演習③:センサーデータによる分類 ✓ 変数選択・変数除去の考え方(ID・疑似相関・リーク情報) ✓ 予測精度検証:クロスバリデーション ✓ クラス分類評価指標:Accuracy・Recall・Precision ✓ オーバーフィッティングとアンダーフィッティング 21

22.

詳細カリキュラム 3日目:前処理・特徴量設計入門 4日目:マーケティング理論・ケースメソッド ◇前処理・特徴量設計入門 ◇マーケティング理論入門 ✓ 2値分類アルゴリズムによる多値分類(One vs ALL) ✓ マーケティングプロセス ✓ 連続データの離散化とカテゴリ変数の数値化 ✓ セグメンテーション/ターゲティング/ポジショニング ✓ 欠損値(MCAR・MAR・MNAR)・外れ値・異常値対応 ✓ マーケティング・ミックス(4P/4C) ✓ データスケール標準化(レンジ・Z変換・対数変換) -製品・サービス戦略(Product) ✓ 不均衡データ対応 -販売・流通チャネル戦略(Place) -プロモーション戦略(Promotion) -アップサンプリング・ダウンサンプリング・SMOTE -Threshold(閾値)による予測結果の補正 ✓ -価格戦略(Price) 市場ライフサイクル(導入期/成長期/成熟期/衰退期) -ダウンサンプリング+バギング ✓ データのスパース性と次元圧縮 ◇消費者行動論・組織的購買 ✓ 探索的データ分析と特徴量設計 ✓ 消費者購買プロセスの5段階モデル ✓ 関与/知識、口コミ/準拠集団 ◇Deep Learningによる画像分類入門(MNIST) ✓ BtoBとBtoCの違い、購買決定関与者(DMU) ✓ パーセプトロン、重み学習イメージ、活性化関数 ✓ イノベーター理論による顧客分類 ✓ フォワードプロパゲーション・バックプロパゲーション ✓ ハンズオン演習:手書き文字分類(MNIST) ◇ケースメソッド演習・グループ課題演習 ✓ ケース①「三木坂珈琲店」 ◇グループ課題A・B解説・演習 ✓ ケース②「データ分析ツール導入狂騒曲」 ✓ 課題データ、ヘルストラックアプリ解説 ✓ グループ課題B:ケース③「靴屋のデジタル・トランスフォーメーション」 ✓ グループ演習A:顧客離脱予測モデルの構築 22

23.

詳細カリキュラム 5日目:経営戦略論 ・組織論 ◇経営戦略論入門 ◇組織論入門 ✓ ✓ イントロダクション:戦略策定プロセス解説 -外部環境分析・内部環境分析と事業ドメイン ✓ ✓ ✓ -分業による生産性向上 ✓ 外部環境分析 -アダムスミスの功罪:製造工程と労働の規格化 組織論入門 -マクロ環境分析:PEST -業界構造分析:5フォース -組織デザインの基本形 -ミクロ環境分析:3C -参入障壁の築き方 -ピラミッド型組織のメリット・デメリット 内部環境分析 -企業活動の価値連鎖:バリューチェーン分析 ✓ -事業戦略と全社戦略 イントロダクション:分業による飛躍的な生産性向上 -ネットワーク型組織のメリット・デメリット -良いチームをつくるために必要なこと -垂直統合と水平分業 ✓ なぜDXプロジェクトは失敗するのか? (組織論の観点からの考察) -企業の内部資源分析:VRIO分析(リーソス・ベースド・ビュー)、模倣困難性 -新規事業に必要な組織土台 事業戦略 -組織土台の不整合(組織形態・組織文化・意思決定プロセス・インセンティブ) -規模の経済 / 経験効果 / 範囲の経済 / 密度の経済 / ネットワーク外部性 -プリンシパル・エージェント問題 -コストリーダーシップ戦略・差別化戦略・集中戦略 -高度人材の定着、両利きの経営 -コスト優位ドライバー -既存事業組織と新規事業組織とのハレーション 不確実性への対応 -多角化・事業ポートフォリオ / 創発戦略 / タイムベース競争 / リアル オプション / オープンイノベーション / リーンスタートアップ ✓ テクノロジーによる業界構造変化(レイヤー・ドメイン領域) ✓ テクノロジーによる競争優位と戦略論の陳腐化 ◇マーケティング・データ分析演習 ✓ 機械学習のマーケティング適用事例紹介 ✓ ディスカッション:ロジカルシンキングによる売上向上策の検討 ✓ ハンズオン演習①:クラスタリング ✓ ハンズオン演習②:アソシエーション分析(併売分析) ✓ ハンズオン演習②:売上予測モデル ✓ ハンズオン演習③:広告の効果測定 23

24.

詳細カリキュラム 6日目:IT基礎など 最終日(7日目):グループ課題発表・総まとめ ◇ITソリューション企画(解説のみ) ◇グループ課題演習・プレゼンテーション ✓ エンタープライズアーキテクチャ ✓ グループ課題演習A・B、分析・提言プレゼン準備 ✓ 要件定義書 ✓ 各グループ発表・フィードバック ◇情報基礎理論・マルチメディア入門(解説のみ) ◇総まとめ講義:データ分析プロセス(CRISP-DM) ✓ デジタル・アナログ変換、情報源符号化 ✓ 課題内容の振り返り・解説 ✓ データ量の増大:分散・並列コンピューティング重要性 ✓ データ分析プロセス(CRISP-DM)毎の注意点 ✓ データ構造・テキスト処理・音声処理・画像処理 ✓ よい予測モデルとは?:予測精度、説明性・解釈性、 ロバスト性、計算量、課題解決など ✓ システム実装:計算量問題、KPIモニタリングと改善 ◇データベース入門(解説のみ) ✓ データベースとは? ✓ データ分析コンペサイトの紹介、Kaggleの多重投稿対策 ✓ ビッグデータ処理3VとNoSQL ✓ おすすめ書籍の紹介 ✓ ER図、マスタテーブルとトランザクションテーブル ✓ データベース操作言語SQL ✓ SQLによるデータ分析実践のための注意点 ✓ メタデータ、データマネジメント ◇グループ課題演習 ✓ グループ課題演習A・B、分析・提言プレゼン準備 24