確率統計の知識を使わずに競馬をするのに比べて、確率統計から予想したほうが大幅に回収率が上がることは事実です。

なぜなら競馬は毎年ほぼ同じスケジュールで約1000レース開催され、述べ1万8千頭の馬が出走します。

このように1年間で毎年同様のスケジュールで競馬は開催されますので毎年大量のデータが蓄積されていきます。

確率・統計を用いるのに十分なデータ数が揃いますので、それらを分析することでレースの傾向などが浮き彫りになってきます。

そのことから競馬は、他のギャンブルよりも過去のデータを使えるギャンブルと言えます。このデータをうまく使えば投資ということも可能になってきます。

確率統計を使って競馬は主な工程

  • 過去のレースのデータを集める
  • 集めたデータを簡略化してデータ群としてまとめる
  • データ群の関係性を比べる

実は、確率統計を用いて競馬を行う工程は、おもにこの3つです。

過去のレースデータを加工できる形で集め、そのデータをグループ化して関係性を調べて行きます。

そこから得られた情報をもとにして予想していくのが確率統計競馬です。また、それらを元にして、馬の強さなどを数値化で判断できるような指数を作って予想することもできるようになります。

過去のレースのデータを集める

具体的にはデータを集める方法として、もっとも簡単なのはJRA-VANからデータを入手することだと思います。

JRA-VANなら過去10年以上の全データを低額で購入することができます。ここで集めたデータを使い確率統計処理を行います。

集めたデータを簡略化してデータ群としてまとめる

集めたデータは簡略化してデータ群としなければ、ただの数値の集まりです。この数値の集まりを平均値、偏差、偏差平方和、分散、期待値、標準偏差などの統計的な手法でデータ群の特徴を数値化します。

データ群の関係性を比べる

多変量解析と言われる手法を用います。その中でも競馬の予想に必要なのは単回帰分析、重回帰分析、因子分析などです。

指数を紐解く

最も有名な指数として西田式スピード指数というものがあります。

競馬ブックに記載されているスピード指数というものは西田式スピード指数をベースに独自のアレンジが加えられて進化したものです。

この西田式スピード指数の考え方を理解して、実際にどのように手法で開発したのかを知れば、あなたオリジナルの指数の開発に役立つと思います。

このサイトでは数学が苦手な文系の方でも競馬に必要な確率統計の情報をまとめています。