#57 Section 12 回帰(1)教材の用意&PyCaretのインストール/インポート

-- Views

February 09, 26

スライド概要

ここからは、『回帰』のコードの解説に入ります。

PyCaretが予測の途中でどのような処理や計算をしているかを体験していきましょう。

1.PyCaretのホームページ

まずは、教材の準備をしていきます。

PyCaretのホームページから『DOCS』をクリックし、さらに『Tutorials』をクリックします。

『Tutorials』にある『Regression』の『Quick start』の部分を今回の教材にします。

https://pycaret.gitbook.io/docs/get-started/tutorials

『Regression』は、①教師あり学習の一種で、連続する値の傾向をもとに予測を行うことです。日本語で、『回帰』と言います。

『Colab』をクリックすると、『Colab』の『Tutorial - Regression.ipynb』という名前のノートブックが現れます。この状態では、まだGoogleドライブに保存されているわけではありませんので、『ドライブにコピー』をクリックします。

その後、ノートブックの名称を『Regression』に変更、ファイル位置の移動(ここでは、『機械学習』フォルダーに移動)等を行います。教材の準備は完了です。

2.PyCaretのインストール/インポート

Colabには、PyCaretがインストールされていませんので、先ずはPyCaretをインストールしましょう。

その前に、『#56 分析環境再構築/コラボのPythonバージョンアップ』を参考にして、Pythonのダウングレードを行います。

通常の『!pip install paycaret』では、すべてのものをインストールすることはできません。 paycaretに続けて[full]を書くとフルバージョンをインストールすることができます。

★その前に、『ランタイム』→『ランタイムのタイプを変更』→『ランタイム バージョン』を『2025.07』にします。

詳細は、下記のブログをご覧ください!

#56 分析環境再構築/コラボのPythonバージョンアップ
https://tutorial4datascience.blogspot.com/2025/09/56.html

ColabでPyCaretをインポートすると、数分経過してから下記のように『セッションを再起動する』とのアラームが出てきます。Colabは最新に近いパーツで動いていますが、PyCaretはその最新のパーツに対応していないためです。

でも、ご安心を! 『セッションを再起動する』をクリックして、再起動すれば、PyCaretは問題なく稼働します。

PyCaretをインポートが完了し、稼働しているかどうか確かめるために、PyCaretのバージョンを確かめてみましょう。

PyCaretのバージョンは、3.3.2ということがわかりました。ちゃんとインストールされているようです。

3.分析データを読み込む

次に分析するデータを読み込みます。

PyCaretには、年齢、性別、BMI、子供の数、喫煙者かどうか、地域情報が含まれている『insurance』という保険料を予測するためのデータが入っています。得られたデータを『data』と宣言しています。

4.データ「insurance」の詳細

目的変数が『保険料』で、説明変数が『年齢』、『性別』、『BMI』、『子供の数』、『喫煙者かどうか』、『地域情報』という構造になっています。

BMIというのは、Body Mass Indexの略です。体重と身長から算出される肥満度を表す体格指数です。

profile-image

すべてのビジネスパーソンが意思決定プロセスにデータを活用する思考を身につけるため、まずは、データサイエンスの分析を体験していきましょう。SECIモデルの最初の段階、共同化(Socialization)からはじめていきます。 下記のブログで、ここにアップしたスライド、動画を随時、公開中です。 【ブログ】https://tutorial4datascience.blogspot.com/ 【Youtubeチャンネル】https://www.youtube.com/@DataScience_for_everyone 【Kindle】そして、このブログをまとめて書籍にしました!   https://amzn.to/4ryVppn   https://amzn.to/4pGgFb1

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

4th STEP 機械学習 Section 12 回帰(1) 教材の用意&PyCaretのインストール/インポート データサイエンス チュートリアル 1

2.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート さて、ここからは、機械学習の第ニ弾として、教師あり学習の回帰をはじ めます。 回帰の主な目的は、連続する値の傾向をもとに予測を行うことです。 例えば、下記のような場合に使われます。 ● 過去の気温データを基にして明日の気温を予測 ● 新しい店舗を開設する際に、検討している席数、最寄り駅からの徒 歩時間、モーニングサービスの有無を考慮しながら売上を予測 ● トッピングの数、パンの生地、直径からピザの価格を予測 今回もPyCaretの公式チュートリアルの一部を教材としていきます。 前世はデータサイエンティストだった 猫のタロー データサイエンス チュートリアル 2

3.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート PyCaretのホームページ (1) まずは、教材の準備をしていきます。 PyCaretのホームページから『DOCS』をクリックし、さらに『Tutorials』をクリックします。 https://pycaret.org/ https://pycaret.gitbook.io/docs データサイエンス チュートリアル 3

4.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート PyCaretのホームページ (2) 『Tutorials』にある『Regression』の『Quick start』の部分を今回の教材にします。 『Regression』は、 います。 の一種で、連続する値の傾向をもとに予測を行うことです。日本語で、『回帰』と言 回帰は、次のような場合に使われます。 1.株価の予測 2.過去の気温データを基にして明日の気温を予測 3.新しい店舗を開設する際に、検討している席数、 最寄り駅からの徒歩時間、モーニングサービスの 有無を考慮しながら売上を予測 4.トッピングの数、パンの生地、直径からピザの価格 を予測 データサイエンス チュートリアル 4

5.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート PyCaretのホームページ (3) 『Colab』をクリックすると、『Colab』の『Tutorial - Regression.ipynb』という名前のノートブックが現れます。この状態では、 まだGoogleドライブに保存されているわけではありませんので、『ドライブにコピー』をクリックします。 これで、教材の準備は完了です。 データサイエンス チュートリアル 5

6.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート PyCaretのインストール/インポート (1) この教材では、既にコードが書いてありますから、それを見ていきながら、何をやっているのか理解していきましょう! Colabには、PyCaretがインストールされていませんので、先ずはPyCaretをインストールしましょう。 その前に、『#56 分析環境再構築/コラボのPythonバージョンアップ』を参考にして、Pythonのダウングレードを行います。 通常の『!pip install paycaret』では、すべてのものをインストールすることはできません。 paycaretに続けて[full]を 書くとフルバージョンをインストールすることができます。 コードセルに『!pip install paycaret[full] 』とコードを書きます。 その後、実行します。 結構なパーツが含まれていますから、数分待つことになります・・・ データサイエンス チュートリアル 6

7.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート PyCaretのインストール/インポート (2) ColabでPyCaretをインポートすると、数分経過してから下記のように『セッションを再起動する』とのアラームが出てきます。 Colabは最新に近いパーツで動いていますが、PyCaretはその最新のパーツに対応していないためです。 でも、ご安心を! 『セッションを再起動する』をクリックして、再起動すれば、PyCaretは問題なく稼働します。 とは言え、2024年に入ってから3度のマイナー チェンジをしているので、PyCaretの進化が追 いつく努力は続けれらています。 Release情報 https://github.com/pycaret/pycaret/releases PyCaretは、非常に多くのパーツから成り立っ ているため、分析環境を構築するために多く の努力が必要とされます。これが、いまいち普 及が進まない原因です。解説本も少ない! 通常は、『python3 virtualenv』、『Anaconda』等を 使って、仮想環境を作ります(ここでは割愛します)。 データサイエンス チュートリアル 7

8.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート PyCaretのインストール/インポート (3) PyCaretをインポートが完了し、稼働しているかどうか確かめるために、PyCaretのバージョンを聞いてみましょう。 pycaret.__version__ アンダーバーを2個続けています。 PyCaretのバージョンは、3.3.2ですね。ちゃんとインストールされているようです。 データサイエンス チュートリアル 8

9.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート 分析データを読み込む 次に分析するデータを読み込みます。 PyCaretには、年齢、性別、BMI、子供の数、喫煙者かどうか、地域情報が含まれている『insurance』という保険料を予測 するためのデータが入っています。得られたデータを『data』と宣言しています。データの詳細は、次ページで解説します。 データサイエンス チュートリアル 9

10.

4th STEP 機械学習 Section12 回帰(1) 教材の用意&PyCaretのインストール/インポート データ『insurance』の詳細 *BMI 年齢 性別 子供の数 地域 喫煙者かどうか 保険料 説明変数 目的変数 (予想するモノ) *BMI:Body Mass Indexの略。体重と身長から算出される肥満度を表す体格指数で体重kg ÷ (身長m)2で算出します。 成人ではBMIが国際的な指標として用いられています。 データサイエンス チュートリアル 10