>100 Views
September 26, 24
スライド概要
さて、いよいよNDBデータから作成した分析用のデータを分析していきます。
今回は、次のような順番で分析の準備を整えていきましょう。
1.分析用ノートブックの作成
2.データの読み込み
3.データ型の確認
4.「医薬品名」ごとの薬価を示す列の追加
************
★この動画のブログ
■ データサイエンス チュートリアル
https://tutorial4datascience.blogspot.com/
1 3rd STEP 応用編 医療 Section 7 分析の準備
2 Section 7 分析の準備 1.分析用ノートブックの作成 前のSection6までで作成した「naihuku.csv」を分析していきます。データの読み込みに時間 がかかりますので、分析用の新たなノートブックを作成しましょう。名称は、「分析」と名付けます。
3 Section 7 分析の準備 2-1.データの読み込み ライブラリPandas、NumPyをインポートし、データ型に気を付けながら「naihuku.csv」 を読 込んだものを「df0」と宣言します。 その際、列名「薬効分類」、列名「都道府県番号」はまずは「int(整数型)」で読み込みま す。 その後、列名「薬効分類」、列名「都道府県番号」は、データ型を「str(文字列型)」に再変 換し、「df1」と宣言します。 これで、前のSection6で小数点が付いていた列名「薬効分類」、列名「都道府県番号」は、 小数点以下が無くなっていることと思います。 次ページの画面イメージ画像をご覧ください。
4 Section 7 分析の準備 2-2.データの読み込み
5 Section 7 分析の準備 3.データ型の確認 念のため、データ型を確認しておきましょう。 「dtypes」を使うと右記のように、データ型を確 認できます。 データ分析のためのデータが出来上がりました。
6 Section 7 分析の準備 4.「医薬品名」ごとの薬価を示す列の追加 次に、それぞれの行ごと、すなわち「医薬品名」ごとの「薬価」を算出した列「金額」を追加し ましょう。分析の時に、医薬品名毎の金額で分析を進めるためです。 さあ、準備が整いました。次のSectionからは、分析を始めていきます。