この記事では「AI予想って結局なんなの?」という方のために、以下の内容をまとめています。
- AI予想とは何か(定義)
- AI予想と「予想家」の違い
- AI予想を支える 2 つの技術(機械学習・統計学)
- AI予想の限界
- AI予想の正しい使い方
筆者は「BOATCRAFT」という競艇予想 AI を個人で開発しています。1999 年からの 27 年分・1,000 万件超のレースデータを集めてきました。 その経験から、AI予想の本質を、初心者の方にも分かるように解説していきます。 最後まで読んでいただければ、AI予想との付き合い方がガラッと変わるはずです。
AI予想とは何か
レース結果を「確率」で予測する手法のことです。
「AI が予想する」と聞くと、多くの方が「ボタンを押したら当たり目が出てくる魔法のツール」をイメージされます。 これは違います。完全に違います。
AI予想の本質は、こうです。
ただ、これだけです。
AI予想の 3 つの特徴
- データに基づく判断:経験や直感ではなく、過去データから判断します
- 確率で示す:「絶対勝つ」ではなく、「60% の確率で勝つ」と数字で出します
- 感情を排除:直近の印象に引っ張られません
例: 1 コース勝率は会場でこんなに違う
たとえば、競艇では「1 コース(1 号艇)は有利」とよく言われます。 でも実際にどれくらい有利か、ご存じでしょうか。
BOATCRAFT で 27 年分・1,000 万件超のレースデータを集計すると、 会場によって 1 コース勝率は大きく違うことが分かります。
| 順位 | 会場 | 1 コース勝率 | 特徴 |
|---|---|---|---|
| 1 位 | 徳山 | 62.58% | 全国 No.1 のイン天国 |
| 2 位 | 芦屋 | 61.38% | 静水面、イン圧倒 |
| 3 位 | 大村 | 60.94% | 海水・干満差小 |
| … | … | … | … |
| 22 位 | 桐生 | 45.13% | 標高 2 位、淡水 |
| 23 位 | 常滑 | 43.85% | 風の影響大 |
| 24 位 | 戸田 | 40.66% | 全国 No.24、外枠が走る |
出典: BOATCRAFT 27 年分データベース集計(1999 年〜2026 年)
最高の徳山と最低の戸田で、約 22 ポイントの差があります。 同じ「1 号艇」でも、徳山では 1.5 倍勝ちやすい、ということです。 AI予想は、こういう数字を何百万件のデータから自動で計算してくれます。
AI予想と「予想家」の違い
競艇場に行くと、「予想新聞」が売っています。 あれは「予想家」と呼ばれるベテランの方が、長年の経験で予想を作っているものです。 AI予想と予想家、何が違うのでしょうか。
ここが最大の違いです。
AI予想 vs 予想家 比較表
| 項目 | AI予想 | 予想家 |
|---|---|---|
| 判断根拠 | 過去データ(数値) | 経験・勘 |
| データ量 | 数百万〜1,000 万件超 | 個人の記憶範囲 |
| 感情の影響 | なし | あり |
| 説明可能性 | 計算式で説明可能 | 「直感」が含まれる |
| 一貫性 | 高い | ばらつきがある |
| 直前の印象 | 影響しない | 引っ張られやすい |
予想家の方のすごさは、「直感力」と「現場感」です。
AI のすごさは、「データの広さ」と「冷静さ」。
筆者も最初は予想家の本ばかり読んでいた時期がありました。 でも、ある時気づいたのです。
ある選手が 3 連続で 1 着を取ったら、「絶対今日も来る!」と思ってしまう。 逆に 2 連続で出遅れたら、「もうダメだ」と切り捨ててしまう。
AI はこれをやりません。 過去 27 年・1,000 万件超のデータから、淡々と確率を出す。感情で判断しない。 これが AI予想の最大の強みです。
AI予想を支える 2 つの技術
AI予想は、具体的にどんな仕組みで動いているのでしょうか。 魔法ではないなら、何かしらの技術があるはず、と思うのが普通です。 実際、AI予想は大きく分けて2 つの技術で支えられています。
技術 1: 機械学習
機械学習は、「過去の何百万件のレースデータを見て、勝ちパターンを自動で学習する」AI 技術です。 代表的なアルゴリズムには以下のようなものがあります。
| アルゴリズム | 特徴 |
|---|---|
| LightGBM | 高速・大規模データ向き、Microsoft 製 |
| XGBoost | 安定・高精度、業界の代表格 |
| CatBoost | カテゴリ変数(級別等)に強い、Yandex 製 |
| ニューラルネット(NN) | 非線形な複雑なパターンを捕捉 |
BOATCRAFT では、この4 つのアルゴリズムをブレンドして使っています。
なぜ 4 つも使うのか。それぞれ得意な領域が違うからです。
たとえば、LightGBM は大量のデータを高速で処理するのが得意。
CatBoost は「A1 級」「B2 級」といったカテゴリデータの扱いが上手。
ニューラルネットは、人間が気づかないような複雑な相互作用を見つけてくれます。
これが BOATCRAFT の設計思想です。
技術 2: 統計学
機械学習だけでも予想はできます。ただ、それだけでは弱い場面があります。
たとえば、新人選手が初めて出場するレース。データが少ないため、機械学習はうまく予測できません。
そこで使うのが統計学です。
統計学は 100 年以上前からある古典的な手法ですが、今でも超強力です。代表的なものに以下があります。
- ベイズ推定:「事前の知識」と「新しいデータ」を組み合わせて確率を更新する手法
- ロジスティック回帰:オッズから勝率を逆算する手法
- 階層モデル:「同じ年代・同じ支部の選手の傾向」から推定する手法
新人選手のレースなら、「同じ支部の若手選手の成績」を事前知識として使い、わずかなデータでも確率を計算できます。
機械学習が苦手なところを、統計学が補う。
これが BOATCRAFT の「ハイブリッド設計」です。
AI予想の限界
AI予想はすごい技術です。ただ、限界もちゃんと知っておいてほしいです。
限界 1: データに現れない要素は読めない
AI が見ているのは「データ化された情報」だけ。データに現れない要素は、当然読めません。
- 選手の体調(前日の風邪・睡眠不足)
- メンタル状態(家族の問題、プレッシャー)
- 整備士との関係性
- 当日の天候の急変
これらは予想家の方のほうが強い領域です。
限界 2: 急な気象変化への対応
レース直前に風が急変したり、雷雨で水面が荒れたり。 こうした「直前の変化」をどこまで反映できるかで、AI の精度は大きく変わります。 BOATCRAFT では、展示タイム・気象・水面状態を直前情報として取り込んでいますが、 レース開始の数分前の変化までは追いきれないこともあります。
限界 3: 「絶対」は存在しない
これが一番大事です。
確率 60% というのは、4 回に 1.6 回は外れるということです。
筆者も最初は「AI を使えば勝てる」と思っていた時期がありました。 でも、何度も大負けして気づきました。
では「データに無い要素はどう判断すればいいのか」。 その答えが、次章で解説する「AI予想の正しい使い方」です。
AI予想の正しい使い方
ここが一番大事なところです。
使い方の 3 原則
・「今日は風が強いから、AI の数字より低く見積もろう」
・「最近の調子を加味して、もう少し買い目を絞ろう」
・「直前の選手コメントが良くなかったから、警戒しよう」
AI の数字をスタート地点にして、自分の判断を上乗せします。
AI に判断させるのではなく、AI を使って自分が判断する。 これが AI予想の正しい使い方です。
世の中の AI予想アプリは、ほとんどが「予想を見せるだけ」。「これ買え」と一方的に出してきます。 それでは「予想を作る楽しさ」がなくなってしまいます。
だから BOATCRAFT は、「ユーザーが 23 個のつまみを動かして、自分の予想ロジックを作る」という設計にしました。
BOATCRAFT の 23 つまみとは
「コースの重要度」「モーター気配の重要度」「選手の調子の重要度」など、 23 個の要素を自分の感覚で調整できます。
| カテゴリ | つまみ例 |
|---|---|
| コース要因 | 艇番、会場特性 |
| 機力要因 | モーター 2 連率、ボート 2 連率 |
| 直前情報 | 展示タイム、ST、風速、波高 |
| 選手品質 | 全国勝率、級別、年齢、F-L 数 |
各つまみは 0.0〜5.0 まで 0.1 刻み(51 段階)で調整可能です。
ユーザー全員が違う予想ロジックを持てます。
これが「予想を作る道具」というコンセプトの中身です。
AI予想は道具。最後に判断するのは、自分。 これだけ覚えておけば、AI予想との付き合い方を間違えません。
まとめ
長くなりましたが、ポイントを 5 つにまとめます。
- AI予想は「絶対当たる魔法」ではない。「確率を数字で示す道具」。
- 判断の根拠が「経験」ではなく「データ」。BOATCRAFT は過去 27 年分・1,000 万件超を見ている。
- 機械学習(4 アルゴリズム)と統計学のハイブリッドで支えられている。
- データに出ない要素や急変には弱い。「絶対」は存在しない。
- AI は「答え」ではなく「判断材料」。最後に決めるのは自分。
AI予想の本質を理解できれば、あとは実際に触ってみるだけです。
次回の記事では、「BOATCRAFT が 4 つの AI アルゴリズムを使っている理由」をもっと深く解説する予定です。
「なぜ単一モデルではダメなのか」「ブレンドって具体的にどうやるのか」、ここを詳しく書きます。
楽しみにお待ちください。