荒れやすい条件とは?


分析方法

馬券の対象としては平地競走での単勝・馬連・3連複、障害レースは除外しました。分析方法としては各馬券の払戻金のパーセンタイル値のグラフを出力し中央値で評価します。パーセンタイル値とは全体を100として小さい方から数えて何番目になるのかを示す数値でパーセンタイル0が対象データの中で最も小さい値、パーセンタイル100が最も大きい値、パーセンタイル50が中央値になります。
平均値を使わない理由は、平均値は極端な値に影響されやすく、超高配当がデータに含まれる場合、平均値がその値に引っ張られてしまうためです。
また、払戻金の傾向に加え1番人気の勝率や回収率も判断材料にします。

全体

まず平地競走全体のデータから見ていきます、期間は2020年~2024年の5年間です。横軸がパーセンタイルで、縦軸は払戻金です。パーセンタイル値を100まで表示するとグラフが縦に広がり中央値付近が分かりにくくなるため80まで表示しています。
単勝の中央値は460円、馬連の中央値は1810円、3連複の中央値は4990円となっています。
1番人気の成績は勝率が33.3%、連対立が52.0%、複勝率が64.4%、単勝回収率が77.7%となっています。
これらのデータを基準に条件別のデータを見ていきます。

頭数別

頭数別のデータを見ていきます。グラフの中に各中央値とカッコ内に全体標準と比較したときの比率を記載しました。
13~14頭立が標準的なデータに近いことがわかります。多頭数ほど荒れる傾向があり、18頭立の場合は標準と比較して単勝は123%、馬連は149%、3連複は182%に上がっています。
頭数別の1番人気の成績を見ていくと、ハッキリとした傾向は見えませんが特徴としては10頭以下の少頭数では勝率・回収率ともに安定感があります。多頭数では勝率こそ落ちていくものの回収率ではそれほど落ちてはいません。
[結論]
多頭数では高配当が出やすいが、オッズに反映されている傾向があるため多頭数だからといって1番人気を軽視するのは得策ではない。

クラス別

クラス別のデータを見ていきます。
新馬・未勝利/1勝クラス・2勝クラス/3勝クラス・オープンという3グループに分けられそうです、クラスが上がるにつれ配当も高くなります。
1番人気の勝率・回収率では新馬~2勝クラスまでは比較的良い成績ですが、3勝クラス以上では勝率・回収率ともに下がっており、1番人気が期待に応えられていないと言えます。
[結論]
3勝クラス以上では高配当が出やすく1番人気の成績も下がるので積極的に穴を狙っていくべき。

斤量設定別

斤量設定別のデータを見ていきます。
馬齢、定量、別定についてはクラス別と相関があると考えられるのでここではハンデ戦に着目していきます。
ハンデ戦は他の斤量設定に比べダントツで高配当が出る傾向があります。3連複の配当中央値は9880円となっており全体標準に比べ197%で約2倍となっていますのでハンデ戦では高めを意識して馬券を狙うのが良さそうです。
1番人気の勝率・回収率も全体標準を下回っており期待に応えられていません。
[結論]
ハンデ戦は高配当が出やすく1番人気の成績も下がるので積極的に穴を狙っていくべき。

芝/ダート別

芝/ダート別のデータを見ていきます。
芝/ダートではほとんど差がない結果となっています。数値の上ではややダートの方が高配当になっていますが、恐らくダートの方が多頭数で行われるレースが多いことが影響していると思われます。
1番人気の勝率・回収率ではダートの方がやや安定しています。
[結論]
芝/ダートはあまり関係ない。

馬場状態別(芝)

芝の馬場状態別のデータを見ていきます。
芝のレースでは馬場状態が悪くなるほど荒れる傾向があり、特に不良馬場では高配当が出やすい結果となりました。
1番人気の勝率・回収率でも重・不良では一気に成績が落ちていることが分かります。
[結論]
芝の重・不良馬場では高配当が出やすく1番人気の成績も下がるので積極的に穴を狙っていくべき。

馬場状態別(ダート)

ダートの馬場状態別のデータを見ていきます。
芝の馬場状態別とは対照的にダートでは馬場状態はあまり関係ないような結果になっています。しいていえば良馬場がやや荒れやすいくらいですが誤差の範囲内と言えそうです。
1番人気の勝率・回収率でもあまり差がありません。
[結論]
ダートの馬場状態はあまり関係ない。

距離別(芝)

芝の距離別のデータを見ていきます。
距離が短いほど高配当が出る傾向があります、特に1400m以下では高配当が期待できます。
1番人気の勝率・回収率では1400mは悪くない数値ですが1200mでは勝率・回収率ともにワーストなので1200mでは積極的に穴を狙っていくべきと言えます。
[結論]
芝1200mは高配当が出やすく1番人気の成績も下がるので積極的に穴を狙っていくべき。

距離別(ダート)

ダートの場合は芝ほどの傾向は確認できません。強いて言えば短距離でやや高配当が出やすい傾向がありますが、1番人気の成績は標準の範囲内なので穴を狙うのは得策とは言えません。
[結論]
ダートの距離はあまり関係ない。

競馬場別(芝)

芝の競馬場別のデータを見ていきます。
まず特徴として言えるのは東京競馬場が固いということでしょう、単勝・馬連・3連複どれもダントツで低い配当になっています。次いで京都・阪神は低配当という結果になっています。4大競馬場の中では中山は標準よりもやや高配当が期待できそうです。
荒れる競馬場という観点では、福島・新潟・小倉あたりのローカル開催は高配当の傾向があります。
1番人気の勝率・回収率ではやはり東京は安定した結果を残しています。中山では勝率・回収率ともに低水準となっています。ほかの競馬場はバラツキがあり何とも言えない結果となりました。
[結論]
芝の競馬場別では福島・新潟・小倉などのローカル開催で高配当が期待できる。

競馬場別(ダート)

ダートの競馬場別を見ていきます。
芝で固かった東京競馬場はダートではそれほど固くなく標準的と言えます。福島・新潟・小倉は芝と同様にダートでも高配当が出やすいようです。
福島は1番人気の勝率・回収率ともにワーストとなり期待に応えられていない結果となっています。
[結論]
福島ダートは高配当が出やすく1番人気の成績も下がるので積極的に穴を狙っていくべき。

1番人気のオッズ別

レース条件ではありませんが1番人気のオッズ別のデータを見ていきます。
1番人気のオッズが高くなればなるほど荒れる傾向があります。特に1番人気が4倍以上の場合は一気に高配当が出やすくなり、勝率・回収率でも悪くなっています。
逆に1番人気が1倍台の場合は配当もかなり低水準となっており穴を狙うのは得策とは言えません。
[結論]
1番人気のオッズが4倍以上の場合は高配当が出やすく1番人気の成績も下がるので積極的に穴を狙っていくべき。

AIで荒れるかどうかを予想してみた

頭数、クラス、斤量設定、芝/ダート、馬場状態、競馬場、距離、1番人気オッズ、さらに2~5番人気のオッズを学習データとして追加してレースが荒れるかどうかを予想するAIを作ってみたいと思います。
まず荒れるレースの定義ですが、人によって違うと思いますがここでは一旦3連複の払い戻し10000円以上のレースを荒れるレースと定義します。
3連複が10000円以上のレース数は全体の約32%に相当しますので、何も考えずに3連複万馬券を狙った場合は3回に2回は自動的に外れになってしまいますが、レース条件によって狙うレースをどこまで絞れるか検証していきたいと思います。
目標は荒れると予想したレースの2回に1回は3連複万馬券になることです。
機械学習モデルはLightGBMを使います。過去5年分のレースを使いランダムに約13000レースで学習させ、3250レースでテストします。
[結果]
3250レース中1045レースを荒れると予想して53%(555レース)が正解でした。逆に荒れないと予想した2205レース中3連複万馬券になったレースは25%(542レース)でした。したがって、3連複万馬券になった全レースのうち51%はこちらのAIで拾えて残りの49%は拾えなかったことになります。
結果を評価すると、馬券が荒れるかどうかは馬の調子だったり過剰人気や過小評価の馬の有無によって左右される部分もあるのでレース条件とオッズだけで精度を出すには限界があると思います。しかし1/3の確率で発生するレースを1/2の確率で当てられるというのは個人的には十分活用できるレベルのAIが作れたのではないかと思います。
こちらで作成したAIは当サイトの出走表にも反映していきたいと思います。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

PAGE TOP