>100 Views
September 05, 23
スライド概要
seabornで折れ線グラフを描くには、「lineplot」を使います。「barplot」と同様に、各グループごとの平均値を自動的に算出してくれますので、平均値を求めた集計表を作らなくとも、いきなりグラフを描くことができます。
それらを実現するプログラムは下記の3つです。
66 sns.lineplot(data=データ名, x=“列名1”, y=“列名2")
67 sns.lineplot(data=データ名, x=“列名1”, y=“列名2“, errorbar=None)
68 plt.xticks(rotation=角度)
69 sns.lineplot(data=データ名, x=“列名1”, y=“列名2“, hue=“列名3”)
また、グラフ関数を使う時には、慣れるまで、グラフ関数に含まれている集計機能を確認するようにしましょう。ここでは、「groupby」を使います。
「groupby」は、複数の列ごとにグルーピングすることもできます。これを用いて、年月ごとの各国の「Total」の平均値を求め、「hue」を使ったグラフがそれをプロットしていることを確認しています。
groupby([“列名1”, “列名2”])[[“列名3”]].mean( )
●列名1、列名2は、グルーピングする列名
●列名3には、計算対象の列名
1st STEP同様、動画のテキスト、追加情報は下記のブログを参考にしてください!
■この動画のブログ
●データサイエンス チュートリアル
https://tutorial4datascience.blogspot.com/
1 2nd STEP 集計とグラフ描画 Section 24 折れ線グラフ 66 sns. lineplot(data=データ名, x=“列名1”, y=“列名2") 67 sns. lineplot(data=データ名, x=“列名1”, y=“列名2“ , errorbar=None) 68 plt.xticks(rotation=角度) 69 sns. lineplot(data=データ名, x=“列名1”, y=“列名2“ , hue=“列名3”)
2 Section 24 折れ線グラフ 1.lineplot さて、このセクションでは、折れ線グラフの描き方を習得していきます。 前回の「barplot」の部分を「lineplot」に書き換えるだけです。 66 sns. lineplot(data=データ名, x=“列名1”, y=“列名2") xとyの列名を「x=“Month”, y=“Total”」とす ると、年月ごとの「Total」の平均値の推移を表す グラフを描くことができます。 実行すると、折れ線グラフと、それを囲む薄い面が 描画されました。この薄い面は、 「barplot」と同 様に95%の信頼度の信頼区間を示しています。 「barplot」と同様に信頼度を指定することもでき ます。 また、x軸は年4桁月2桁を表していますが、重 なっているので、見にくくなっています。
3 Section 24 折れ線グラフ 2.lineplotの調整 エラーバーは、( )内にカンマに続けて「errorbar=None」を付け加えることにより消すことがで きます。 67 sns. lineplot(data=データ名, x=“列名1”, y=“列名2“, errorbar=None) ちなみに、 「errorbar=None」は、前のセクションでやった「barplot」にも使うことができます。 また、x軸の年月を表すラベルが重なって見えにくくなるのを防ぐためには、ラベルに角度をつけて 表示させます。次の68、1行を付け加えてください。 68 plt.xticks(rotation=角度)
4 Section 24 折れ線グラフ 3.lineplotでも使えるhue 「lineplot」は、「histplot」、「catplot」、「countplot」と同様に、「hue」を使ってサブグ ループに分け、それらの平均値を色分けすることができます。 69 sns. lineplot(data=データ名, x=“列名1”, y=“列名2“, hue=“列名3”)
5 Section 24 折れ線グラフ 66 sns. lineplot(data=データ名, x=“列名1”, y=“列名2") まずは、「lineplot」で折れ線グラフを描いてみます。x軸に「Month」、y軸に「Total」を指定し ます。 薄い色で示されたところは、 95%の信頼度の信頼区間 を示しています。 x軸が見づらくなっています。
6 Section 24 折れ線グラフ さて、このグラフはどの数値をプロットしてるので しょうか? 確認してみましょう。 ㉖、㉗の復習で「groupby」を使い、 「Month」ごとの「Total」の平均値を算出します。 グループごとの平均値を計算する関数は、 「mean」です。 どうやら、「Month」ごとの「Total」の平均値のよ うですね。 グラフ関数を使う時には、慣れるまで、グラフ関 数に含まれている集計機能を確認するために、 このような作業をすることをお勧めします。
7 Section 24 折れ線グラフ 67 sns. lineplot(data=データ名, x=“列名1”, y=“列名2“ , errorbar=None) 68 plt.xticks(rotation=角度) 次は、グラフの見栄えを整えます。 エラーバーを消し、x軸のラベルを 見やすくするために角度をつけて表 示しましょう。 ( )内に、カンマに続けて 「errorbar=None」を加えます。 これで、エラーバーが消えます。 次は、x軸のラベルを見やすくする ために角度をつけて表示します。 改行して、 「plt.xticks(rotation=角度)」 を加えます。「plt」は、㉝で出てき た「matplotlib」の略号ですね。
8 Section 24 折れ線グラフ 66 sns. lineplot(data=データ名, x=“列名1”, y=“列名2") 今度は、「hue」を使います。国別に「Total」の平均値の月ごとの推移を見てみましょう。
9 Section 24 折れ線グラフ 最後は、「lineplot」が何を描いているかを確認しましょう。 「groupby」は、複数の列ごとにグルーピングする こともできます。これを用いて、年月ごとの各国の 「Total」の平均値を求めることができます。 groupby([“列名1”, “列名2”])[[“列名3”]] .集計関数( ) ●列名1、列名2は、グルーピングする列名 ●列名3には、計算対象の列名