>100 Views
September 07, 23
スライド概要
本セクションはでは、ビンのラベルを元のデータに付与して作った「id_pos7_2」を、seabornでグラフを描いた際に、影響力のある3カ国を選んで、結果がわかりやすいように、データを作っていきます。
1.「groupby」を用いて、国別にTotal(合計金額)を算出します。これは、㉖の応用ですね。
2.カンマに続けて「sort_values」を使い、 Totalが大きい順に並べ替えます。これは、⑰の応用ですね。
3.Section 10で解説した列の値に対する条件に応じて行を抽出する「query」を用いて、上位3カ国のデータのみを抽出します。「㉔ データ名.query(“列名 == 列名”)」とは異なりますので、注意してください。
■この動画のブログ
データサイエンス チュートリアル
https://tutorial4datascience.blogspot.com/
1 2nd STEP 集計とグラフ描画 Section 20 グラフ用のデータを作る ㉖’ データ名.groupby(“列名”).sum() ⑰ データ名.sort_values(“列名”,ascending=False) 51 データ名.query( ‘列名 == [“文字名1”, “文字名2”] ‘)
2 Section 20 グラフ用のデータを作る 本セクションは、ビンのラベルを元のデータに付与して作った「id_pos7_2.」を、seabornでグ ラフを描いた際に、影響力のある3カ国を選んで、グラフに描いた結果がわかりやすいように、 簡単なデータを作っていきます。 今までの復習もかねて、 下記のプログラムでグラフ用のデータを作りましょう。 1.㉖’ データ名.groupby(“列名”).sum()で、国別にTotal(合計金額)を算出 2.「sort_values」を使い、 Totalが大きい順に並べ替える ⑰ データ名.sort_values(“列名”,ascending=False) 3.51 データ名.query( ‘列名 == [“文字名1”, “文字名2”] ‘)でTotal上位3カ国の データのみを抽出する。 ※ 51 は、「㉔ データ名.query(“列名 == 列名”)」とは異なりますので、注意!これは、 欠損でない行を抽出する場合に使います。
3 Section 20 グラフ用のデータを作る 1.㉖’ データ名.groupby(“列名”).sum()で、国別にTotal(合計金額)を算出 2.⑰ データ名.sort_values(“列名”,ascending=False)を使い、 Totalが大きい順に 並べ替える
4 Section 20 グラフ用のデータを作る 3.51 データ名.query( ‘列名 == [“文字名1”, “文字名2”] ‘)でTotal上位3カ国のデータ のみを抽出する。 「id_pos7_2.」から、Total上位3カ国のデータを抽出することができました。