野球のデータ分析についてやってみたいけどどうしたらいいの?
PythonやRといったプログラミング言語について教えて!
こんなお悩みを解決します。
☑著者のプロフィール
小さいころからドラゴンズファン
中学の頃にマネーボールを読んで感激
もっぱら見る専門!独学でセイバーメトリクス歴5年
野球のデータ分析について
データ分析その目的は?
データ分析とは、
収集したデータを加工し、眺めてみることで
知見、新たな法則を見出すことです。
野球においても、
過去のデータ分析から得られた知見から
新たな戦略・戦術を見出すことが行われてきました。
セイバーメトリクスとは?
セイバーメトリクスとは
野球のデータを統計学的にあらゆる角度から分析し、
新たな法則を発見することです。
それによって、これまでにない価値観を生み出すことを
目的とします。
これまで多くの分析がされました。
データに基づく新たな価値観は
旧来の経験による野球観を
全く覆すものとなってきています。
セイバーメトリクス:得点の確率を下げる悪い戦略だ
例 ランナー1塁でのバントには価値があるのか?
経験則:ランナーを進塁させる良い戦略だ
野球データ分析のやり方
野球データ分析を行うには、
結論としては、PythonやR言語の
プログラミング言語を使いこなしましょう!
PythonやR言語はプログラミング言語の1種です。
プログラミング言語とは?
コンピュータに特定の動作を実行させる
形式化されたコードです。
プログラミング言語それぞれには、
異なる文法や構文をもっています。
そして、それぞれにおいて、
得意不得意な動作があります。
なぜプログラミング言語を使うのか?
PythonやR言語のプログラミング言語を使うと
いくつかのメリットがあります。
主なメリットは以下になります。
- 自動化できる
- 再現性がある
- PCへの負荷が少ない
プログラミング言語で、コード作成すれば
データ分析を自動化することができます。
例えば、エクセルで自分で加工すると
その過程で何をどうやって、
一つずつ手作業する必要があります。
しかし、PythonやR言語でコードを作成すれば
実行すれば、即結果ができます。
また、行った分析については、
履歴として残りますし、なんどでも反復して
データ加工をすることができます。
データ分析用の2大言語 PythonとRについて
プログラミング言語には、
それぞれ得意とすること、不得意なこと
があると先述しました。
プログラミング言語は、全部で200〜300種ぐらいある
とされています。
その中で、データ分析を得意とするプログラミング言語の代表格が
PythonとR言語になります。
Pythonとは?
Pythonの特徴は、汎用性が高いということです。
Pythonはデータ分析を得意とする一方、
分析以外のこともできる言語です。
例えて言えば、アプリ制作などもできます。
Rとは?
統計解析、データ可視化に特化している言語といえます。
データの加工と統計解析などが可能です。
また、グラフの描画が簡単にできるという
特徴もあります。
ちなみに、メジャーリーグの分析ツールとしてお
R言語は最もよく使われている言語の一つといわれています。
まとめ
野球のデータ分析だけなら
Rで十分できます!
個人的にはRの方が簡単なような気もします。
一方、これから始めるなら
Pythonでもオッケーです。
プログラムの知識や扱う能力は
何かと役に立ちますので、
色々と活用できる可能性もあるからです。
どうやって学ぶか?
まずは、以下の本を読んでみることを
強くオススメします!!
Rによるセイバーメトリクス入門
おすすめのポイント
- セイバーメトリクスをやってみたい人におすすめ
- R言語の使い方について一通り学べます
- 自分で実際にデータを分析できたときの感動はひとしお!
まとめ
ここまでの内容をまとめます。
- 野球のデータ分析に関わるプログラミング言語について
- PythonとR言語について特徴をまとめました
野球データについて学ぶと野球観戦がさらに楽しくなるのは間違いなし!
身近の野球オタクとの話が盛り上がること間違いなし!