#25 棒グラフ

>100 Views

September 05, 23

スライド概要

seabornで棒グラフを描くためには、データの平均値のグラフを描く「barplot」とデータの個数のグラフを描く「countplot」があります。

それらを実現するプログラムは下記の3つです。

【再掲】
㊱ sns.barplot(data=データ名, x=“列名1”, y=“列名2”)

64 sns.barplot(data=データ名, x=“列名1”, y=“列名2”, 引数)

64’ 横向きの棒グラフ
  sns.barplot(data=データ名, x=“列名2”, y=“列名1”, 引数) 

65 sns.countplot(data=データ名, x=“列名1”, y=“列名2”)


「barplot」は平均値のグラフですので、信頼区間の幅を表すエラーバー(error bar)を使い、平均値のばらつきを示す方法も身に付けていきましょう。

1st STEP同様、動画のテキスト、追加情報は下記のブログを参考にしてください!

■この動画のブログ

●データサイエンス チュートリアル
 https://tutorial4datascience.blogspot.com/

■参考URL

●matplotlibの色指定の方法(再掲)
 https://matplotlib.org/2.0.2/examples/color/named_colors.html

profile-image

すべてのビジネスパーソンが意思決定プロセスにデータを活用する思考を身につけ、ブルシットジョブをこの世からなくしていきましょう!

Docswellを使いましょう

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

1 2nd STEP 集計とグラフ描画 Section 23 棒グラフ 再掲 ㊱ sns.barplot(data=データ名, x=“列名1”, y=“列名2”) 64 sns.barplot(data=データ名, x=“列名1”, y=“列名2”, 引数) 64’ sns.barplot(data=データ名, x=“列名2”, y=“列名1”, 引数) 65 sns.countplot(data=データ名, x=“列名1”, y=“列名2”)

2.

2 Section 23 棒グラフ 1.barplot Section 16では、x軸の要素とy軸の要素を1個づつにした年ごとの集計表を作り (「reset_index」も使いましたね!)、 「seaborn.barplot」で棒グラフを描きました。 しかし、「seaborn.barplot」が威力を発揮するのは、各グループの平均値を比較する場 合です。わざわざ各グループごとの平均値を求めた集計表を作らなくとも、いきなりグラフを描 くことができます。各グループの要素の平均値を「barplot」が計算してくれます。 ㊱ sns.barplot(data=データ名, x=“列名1”, y=“列名2”) 棒の中央にある線は、エラーバー (error bar)と言い、信頼区間の幅を表しま す。何も記載しない場合(デフォルト値)は信 頼度が95%になります。

3.

3 Section 23 棒グラフ 2.barplotのエラーバーの調整 95%の信頼度の信頼区間とは、その区間に95%の確率で母数が存在することを意味しま す。信頼区間とは、ある信頼度の測定誤差のバラツキの範囲を表します。「barplot」で、 それを表現するのがエラーバーですが・・・ エラーバーの調整は、 の部分に下記の引数(関数の入力値)を入れます。 64 sns.barplot(data=データ名, x=“列名1”, y=“列名2”, ) ●barplotの信頼区間を示すバーの終端の線(キャップ)のサイズは「capsize=数」 ●エラーバーの太さは「errwidth=数」 ●エラーバーの色は、「errcolor=‘色’」(histplotと同様にmatplotlibの色 指定の方法を使います) ●エラーバーの信頼度を指定するには「errorbar=(‘ci’, 数)」

4.

4 Section 21 ヒストグラム 参考1(再掲) seabornでは、matplotlibの色指定の方法を使います。詳細は、下記を参照してください。 https://matplotlib.org/2.0.2/examples/color/named_colors.html 主要な色は、一文字で下記のように指定できます。 b:青 (Blue) g:緑 (Green) r:赤 (Red) c:シアン (Cyan) m:マゼンタ (Magenta) y :黄 (Yellow) k :黒 (Black) w:白 (White) マゼンタは、明るく鮮やかな赤紫色のことで、インク・トナーにも使われています。

5.

5 Section 23 棒グラフ 3.横方向の棒グラフ 「barplot」は、横方向の棒グラフを描くこともできます。 書き方は簡単です。x軸とy軸に指定した列名を入れ替えれば横方向の棒グラフを描くこと ができます。 64’ sns.barplot(data=データ名, x=“列名2”, y=“列名1”, 引数)

6.

6 Section 23 棒グラフ 4.countplot また、「countplot」を用いて、棒グラフを描くこともできます。 「barplot」は、指定した列の数字の平均値を表したグラフを描くことができましたが、 「countplot」は、指定した列の数字の個数を表したグラフを描くことができます。 65 sns.countplot(data=データ名, x=“列名1”, y=“列名2”) これは、ヒストグラムで学んだ「catplot」+引数(kind=‘count’)と同じグラフです。 「countplot」 は、引数を指定する必要はありません。

7.

7 Section 23 棒グラフ 参考1 棒グラフを描くために、データの平均値のグラフを描く「barplot」とデータの個数のグラフを描く 「countplot」があります。 sns.barplot 平均値のグラフ 棒グラフ sns.countplot 個数のグラフ

8.

8 Section 23 棒グラフ ㊱ sns.barplot(data=データ名, x=“列名1”, y=“列名2”) まずは、㊱の復習です。x軸に「Country」、y軸に「Total」を指定して、棒グラフを描きましょう。 「Country」ごとの「Total」の平均値を 比較する棒グラフが描けました。 注文の数は、圧倒的に「United Kingdom」が多いのですが、注文1商 品当たりの売上の平均値は、3カ国の 中では最低です。 また、エラーバーは、 デフォルトで、95% の信頼度の信頼区間を示しています。

9.

9 Section 23 棒グラフ 64 sns.barplot(data=データ名, x=“列名1”, y=“列名2” , 引数) 様々な引数を指定して、棒グラフのエラーバーの体裁を整えてみましょう。 エラーバーの傘を0.05、 太さを1.2、色を 赤(’r’)、信頼度を50%にしてみました。 何度か試してみて、気に入ったものを選び ましょう。 ここでは、信頼度を50%にしましたが、信 頼度は通常、デフォルト(95%)にしてお きましょう。

10.

10 Section 23 棒グラフ 64’ sns.barplot(data=データ名, x=“列名2”, y=“列名1” , 引数) 今度は、横棒のグラフを描いてみましょう。x軸とy軸を逆に指定するだけです。

11.

11 Section 23 棒グラフ 65 sns.countplot(data=データ名, x=“列名1”, y=“列名2”) 「countplot」で、棒グラフを描いてみましょう。 「countplot」は、個数をカウン トする機能をもっていますので、 「catplot」のように引数を指 定する必要はありません。