411 Views
April 04, 24
スライド概要
[第7回大阪sas勉強会]亀井亮太
SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです
SASを用いて、贔屓球団 の勝敗 シミュレーション イーピーエス株式会社 統計解析1部 亀井亮太
自己紹介 名前:亀井亮太 出身地:千葉県 趣味:野球観戦(主に千葉ロッテマリーンズの試合) ダーツ、ゴルフ(最近できていませんが…。) 大学時代(生命科学研究科) 細胞、マウスを用いてたんぱく質の品質管理機構を 研究していました。⇒Hsp47, Adiponectin (プログラミングに関しては、素人でした。) 2020年4月 入社
2021年5月29日現在の千葉ロッテマリーンズのチーム成績 を基に、SASを用いて、勝敗をシミュレーションしてみました。 (得点数、失点数に着目) 51試合分の、1試合における得点、失点から要約統計量を算出。 平均 平均の95%信頼区間は 標準偏差
参考 昨年優勝、5月29日現在で首位チームのソフトバンクホークスでは 失点が少ない
求めた得点と失点の平均、標準偏差を用いて、残り試合数 分(92試合)乱数を作成
得点 失点
野球の試合において、得点数(失点数)がマイナスとなることはないの で、マイナスの値を取った場合は0 とする。 野球の試合のスコアには、整数しかないため、以下のように 条件を設定する。 試合に勝つ ・・ 得点 – 失点 >= 1 試合に負ける ・・ 得点- 失点 =< -1 引き分け ・・ -1 < 得点 – 失点 < 1
今回の結果 既に行われている結果を足 した値(シーズン結果) 今回の検証では、千葉ロッテマリーンズは 69勝57敗17引き分け (勝率 0.548) でシーズン終了を迎えます。 *勝率= 勝利数 / (勝利数 + 負け数)
もう一度、乱数を作成し直した結果。 65勝 50敗 28引き分け (勝率 0.565)となりました。
これを50回行った際の要約統計量がこちらです。 勝率の平均は0.548となりました。 過去5年間の優勝チームの勝率は 0.635, 0.563, 0.624, 0.657, 0.621となっており、 このままでは優勝は厳しいので、奮起に期待します。
参考 ホークスの場合 71勝47敗25分け (勝率 0.602) 同様に繰り返して、勝率の要約統計量を求めてみました。 勝率の平均は0.573となりました。 やはり、ホークスは強いですが今年はパリーグが混戦なので、 思ったより勝率は低いように思いました。
まとめ ・SASを用いて、ロッテの今シーズンの成績をシミュレーションしてみた。 ・51試合の結果からは今シーズンの優勝は厳しそうである…。 ・やはりホークスは強い….。 今後の課題 ・今回用いたデータは、得点数、失点数だけである。 実際は、選手の離脱、獲得、成績、対戦相手(特に先発投手)のデータは 加味されておらず、また、僅差での勝利、敗戦に関しても加味されていない。 (僅差での勝利、敗戦には7,8,9回に出てくる勝ちパターンといわれる中継ぎ陣 の成績が影響してくる。) ・これらのより複雑なデータを加味するには機械学習を用いてシミュレーション する必要があるかと思います。 業務に直結しませんし、新規性のない発表となってしまい、申し訳ありません。 ありがとうございました。