Python_ML_beginner_shinjin_rose_20260615.pptx

>100 Views

June 15, 26

スライド概要

profile-image

何卒よろしくお願い申し上げます。 一流のIT研修講師を目指し、日々研鑽を続けております。 本資料は外部公開用としてご提供するものです。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

うさうさ研修工房 🐰 FOR NEW GRADUATES | 受講生・新人向け ハンズオン Python基礎 → データ分析 → 機械学習 「手を動かして最初の予測モデルを作る」までを最短ルートで。 🌱 新人・受講生/実習つき 面白きこともなき世を面白く(高杉晋作) | 2026-06-15

2.

WHY 今日のゴール 結論 完璧な理解より「動かして直す」を回す。終わりには iris データで分類モデルを1つ完成させます。 Pythonの基本文法に触れる pandasで表データを読む scikit-learnでモデルを学習 学習と評価を“分ける”意味を知る うさうさ研修工房 🐰 面白きこともなき世を面白く 1 / 10

3.

WHAT 覚える道具は 4つだけ(まずは) NumPy pandas 数値計算の土台。配列を高速に扱う。 表データ(DataFrame)の主役。読込・集計。 査読: Harris+ 2020 (Nature) 査読: McKinney 2010 matplotlib scikit-learn 可視化=見える化。グラフを描く。 機械学習の定番。fit/predictで統一。 査読: Hunter 2007 査読: Pedregosa+ 2011 (JMLR) うさうさ研修工房 🐰 面白きこともなき世を面白く 2 / 10

4.

HOW · 1 Python基礎:これだけ読めれば OK # 変数とリスト scores = [70, 85, 92] print(sum(scores) / len(scores)) # 平均 # 関数と条件分岐 読むコツ • = は「代入」(等しい、ではない) • インデント(字下げ)が“かたまり” • def は関数の定義 • print で画面に表示 • # から後ろはメモ(コメント) def grade(x): return "合格" if x >= 80 else "再" print(grade(85)) うさうさ研修工房 🐰 面白きこともなき世を面白く 3 / 10

5.

HOW · 2 pandas:表データを読む・見る import pandas as pd 最初に必ずやる 3つ df = pd.read_csv("sales.csv") • 形を見る:df.shape df.head() # 先頭5行 • 欠損を見る: df.isna().sum() • 分布を見る: df.describe() df.describe() # 統計量 df.groupby("region")["amount"].mean() 「いきなり分析」ではなく「まず眺める」。データ理解が9割。 うさうさ研修工房 🐰 面白きこともなき世を面白く 4 / 10

6.

HOW · 3 機械学習のいちばん小さい流れ › データ準備 › 学習 /評価に分割 › fit(学習) › predict(予測) 評価 最重要:学習に使ったデータで評価しない。テスト用は “本番のフリ ”で取り分ける。 うさうさ研修工房 🐰 面白きこともなき世を面白く 5 / 10

7.

HANDS-ON ハンズオン:最初の分類モデル from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.ensemble import RandomForestClassifier X, y = load_iris(return_X_y=True) X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size=0.3) model = RandomForestClassifier(random_state=42).fit(X_tr, y_tr) print(model.score(X_te, y_te)) # テストデータで採点 うさうさ研修工房 🐰 面白きこともなき世を面白く 6 / 10

8.

PITFALLS 新人がつまずく定番ポイント 環境構築で消耗 まずは Google Colab。インストール不要でブラウザだけ。 エラーが怖い エラーは敵でなく道案内。最後の行を読む癖を。 精度だけ見る accuracyは万能でない。混同行列も併せて見る。 写経で満足 1行ずつ値を print して“なぜ動くか ”を確認。 うさうさ研修工房 🐰 面白きこともなき世を面白く 7 / 10

9.

ROADMAP これからの学習ロードマップ 今日〜1週間 Python文法 + pandasでCSVを集計。Colabで写経して動かす。 1ヶ月 scikit-learnで分類/回帰。train/test・交差検証の基礎。 3ヶ月 PyTorch / TensorFlow に触れ、簡単な画像分類まで。 うさうさ研修工房 🐰 面白きこともなき世を面白く 8 / 10

10.

参考リンク集(新人向け) 出典は必ず一次情報に当たること。ラベル= [公式]公式ドキュメント / [査読付き]海外の査読付き論文 / [国内]国内学術誌。 公式 Python 公式チュートリアル(日本語) https://docs.python.org/ja/3/tutorial/ 公式 pandas User Guide https://pandas.pydata.org/docs/user_guide/ 公式 scikit-learn User Guide https://scikit-learn.org/stable/user_guide.html 公式 scikit-learn 交差検証 (Cross-validation) https://scikit-learn.org/stable/modules/cross_validation.html 査読付き Pedregosa et al. (2011) Scikit-learn: Machine Learning in Python, JMLR 12:2825-2830 https://www.jmlr.org/papers/volume12/pedregosa11a/pedregosa11a.pdf 査読付き Harris et al. (2020) Array programming with NumPy, Nature 585:357-362 https://doi.org/10.1038/s41586-020-2649-2 査読付き McKinney (2010) Data Structures for Statistical Computing in Python, Proc. SciPy https://doi.org/10.25080/Majora-92bf1922-00a 国内 間下 以大 (2018)「機械学習超入門(第 1回)」映像情報メディア学会誌 72(3):235-240 https://doi.org/10.3169/itej.72.235 うさうさ研修工房 🐰 面白きこともなき世を面白く