633 Views
April 03, 24
スライド概要
[第5回大阪sas勉強会] 麻生 美由紀
SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです
はじめてのPython 2019/5/24 麻生 美由紀
はじめに • 私はSASを始めて,丸3年になります.(もう中級レベル?) • SASも奥が深いと感じています. • しかし,他の言語を知らなさ過ぎるので,もう一つなにかを学 習したいと思いました. • なので,手始めにPythonをやってみようと思った次第です. 麻生が大学院時代に研究対象と していた動物.
なぜPython? • プログラミング自体は初心者なので,とっつきやすいもの,簡 単なものからやりたい. • データ解析の分野にもPython使われているみたいだし,一応今 の仕事に共通点なくはない. • Pythonだったら,仕事中でもできる! • アプリやゲーム,画像認識,機械学習など,用途がいろいろあ るので,覚えたら面白そう(やんわり). 今は何をやりたいのか明確ではないですが…学んでいく うちにそのうち…
今やっていること • Pythonの参考書を読む. (借りながら…) • 主な情報源:Google • Anaconda jupyter notebook (5.4.0)でPythonを触ってみる. • 人口のデータ,天気のデータ(無料で誰でも手に入るもの)を データ加工ライブラリであるpandas, 数値計算のライブラリ numpyで加工してみる. • グラフ作成のためのライブラリmatplotlibでグラフを描いてみ る. • classを使って,オブジェクト指向を理解してみる. • 画像処理ライブラリPillow(PIL)で日の丸と星を書いてみる. • 機械学習のライブラリscikit learnを少し触ってみる.
成果を少しご紹介
例) 人口データ可視化 国勢調査 時系列データ:都道府県別,年齢別の人口データを 可視化する. https://www.e-stat.go.jp/statsearch/files?page=1&layout=datalist&toukei=00200521&tstat =000001011777&cycle=0&tclass1=000001094741 ◆csvファイルをダウンロード(無料) ◆使用したライブラリ • pandas • Numpy • matplotlib
例)人口データ可視化 ◆データ加工からグラフ作成までの流れ ① csvデータを読み込み(DataFrameとして) ② 興味のある部分を抽出 ③ グラフ用にデータを加工 ④ グラフを作成 ◆②,③の段階で悪戦苦闘…試行錯誤… SASでいう,'where PREFNAME="大阪府";'をするのに,少し時 間がかかった…. SASに慣れているので,なかなか「オブジェクト指向」という ものが身につかず….(いまだに曖昧)
例)人口データ可視化 • 実際のコードを紹介していたら,いろいろやりすぎていて,時 間がかかるし,何より今日はSASの勉強会ですので,今回は割 愛します. • 興味のある方は是非お問い合わせください.
例)人口データ可視化 社会の教科書に載っているような,棒グラフを作成することに成功 しました. 我が故郷では、面白いぐらい高齢化が進んでいます。みなさんも試しにやってみてはいかがでしょうか。
• おまけ(開発の雰囲気だけを味わってみてください) 頑張っているのが 雰囲気でも伝わっ たら嬉しいなぁ
感想 • オブジェクト指向の感覚を少し掴めた. • SASよりグラフが描きやすいかも?(簡単なグラフの場合) • でも棒グラフだけしか書けていない. • 初心者でもとっつきやすい. • 成果が目に見えてわかるので,楽しい? • 学習を継続していないと忘れてしまう.(今ももう忘れかけて いる) • もっと違うライブラリも試してみたい. • まずは,目的・目標を決めることが大事….
終