jra 1 2 3 1 2 3 1 -...

26
1 研究の概要 競馬において、投票者が競馬新聞の出馬表において、どういった情報を重要 視し、レースの着順を予想しているのかを明らかにするため、出馬表に記載さ れる情報が単勝オッズに与える影響を、重回帰分析を用いて検証した。その結 果、馬番(枠順)、負担重量といったレース前に分かる明確な有利不利のある情 報、また、レースの運び方、レースと同距離の過去のレースの複勝率、最近の レース結果のうち前走の結果、前々走の結果、3 走前の結果、4 走前の重賞では ない時の結果、 5 走前の重賞ではない時の結果を重要視しており、それらの情報 が単勝オッズに反映されていることが分かった。また、実際の着順と出馬表と の関係を見ることで、着順の予想に真に有用な情報は何か明らかにするため、 実際のレースの着順を被説明変数にし、第一の分析と同様に出馬表に記載され る情報を説明変数にして、分析を行った。投票者が重要だと考えている情報と の比較をするため、第一の分析結果と第二の分析結果との比較を行った。その 結果、単勝オッズに影響を与えていた情報が、実際の着順に対しては影響を与 えていなかった、または単勝オッズに影響を与えていなかった情報が、実際の 着順に影響を与えていることが分かった。このことから、投票者が重要視する 情報には予想に役立たないものがあり、また重要視していない情報が実際の着 順に影響のある情報であることが分かった。 1 はじめに 投票者が馬券 1 を買う際には多くの情報を参考にする。麻生(2001)によれば、 競馬新聞やスポーツ新聞を中心に、雑誌、テレビやラジオ、インターネットな どの競馬メディア、口コミで広がる噂や、個人の記憶までもがその情報となる。 中でも競馬新聞に書かれる「レーシングフォーム(以下出馬表)」には過去のレ ースについて非常に詳細に記述されており、それを見るだけで過去のレースを 1 競馬というのは、レースに出走する競走馬の着順を予想し、勝ち馬投票券(以 下馬券)を購入し、投票者の購入した馬券が当たれば、 JRA (日本中央競馬会) が公表するオッズに掛け金を乗じた金額が配当として得られる、という公営賭 博である。 馬券の買い方には様々な種類があり、 JRA によると単勝(1 着を当てる馬券)、 複勝(3 着までに入る馬を当てる馬券)、馬連(1 着と 2 着になる馬の組み合わ せを当てる馬券)、馬単(1 着と 2 着になる馬を着順通りに当てる馬券)、 3 連複 1 着、2 着、3 着となる馬を当てる馬券)、3 連単(1 着、2 着、3 着となる馬 を着順通りに当てる馬券)がある。

Upload: truongphuc

Post on 18-May-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

1

研究の概要 競馬において、投票者が競馬新聞の出馬表において、どういった情報を重要

視し、レースの着順を予想しているのかを明らかにするため、出馬表に記載さ

れる情報が単勝オッズに与える影響を、重回帰分析を用いて検証した。その結

果、馬番(枠順)、負担重量といったレース前に分かる明確な有利不利のある情

報、また、レースの運び方、レースと同距離の過去のレースの複勝率、最近の

レース結果のうち前走の結果、前々走の結果、3 走前の結果、4 走前の重賞では

ない時の結果、5 走前の重賞ではない時の結果を重要視しており、それらの情報

が単勝オッズに反映されていることが分かった。また、実際の着順と出馬表と

の関係を見ることで、着順の予想に真に有用な情報は何か明らかにするため、

実際のレースの着順を被説明変数にし、第一の分析と同様に出馬表に記載され

る情報を説明変数にして、分析を行った。投票者が重要だと考えている情報と

の比較をするため、第一の分析結果と第二の分析結果との比較を行った。その

結果、単勝オッズに影響を与えていた情報が、実際の着順に対しては影響を与

えていなかった、または単勝オッズに影響を与えていなかった情報が、実際の

着順に影響を与えていることが分かった。このことから、投票者が重要視する

情報には予想に役立たないものがあり、また重要視していない情報が実際の着

順に影響のある情報であることが分かった。 1 はじめに

投票者が馬券1を買う際には多くの情報を参考にする。麻生(2001)によれば、

競馬新聞やスポーツ新聞を中心に、雑誌、テレビやラジオ、インターネットな

どの競馬メディア、口コミで広がる噂や、個人の記憶までもがその情報となる。

中でも競馬新聞に書かれる「レーシングフォーム(以下出馬表)」には過去のレ

ースについて非常に詳細に記述されており、それを見るだけで過去のレースを

1 競馬というのは、レースに出走する競走馬の着順を予想し、勝ち馬投票券(以

下馬券)を購入し、投票者の購入した馬券が当たれば、JRA(日本中央競馬会)

が公表するオッズに掛け金を乗じた金額が配当として得られる、という公営賭

博である。 馬券の買い方には様々な種類があり、JRA によると単勝(1 着を当てる馬券)、

複勝(3 着までに入る馬を当てる馬券)、馬連(1 着と 2 着になる馬の組み合わ

せを当てる馬券)、馬単(1 着と 2 着になる馬を着順通りに当てる馬券)、3 連複

(1 着、2 着、3 着となる馬を当てる馬券)、3 連単(1 着、2 着、3 着となる馬

を着順通りに当てる馬券)がある。

2

イメージすることが出来るようになっている。出馬表に記載されている各出走

馬の情報には、『タイム、2 コーナー、3 コーナー、4 コーナーでの順位、ゴー

ル時の順位、開催日、競馬場、レース名、馬場状態、騎手、1 着(または 2 着)

との着差、最初と最後の 600mのタイム、1 着(または 2 着)馬、レースぶりの

短評(麻生 2001)』がある。さらに、重要だと考えられるものとしては、過去

のレースのラップタイムがスローペースなのか標準のペースなのか、ハイペー

スなのかという情報、出走馬の得意なレースのしかた、体重、調教師の情報、

最近の調教の短評なども記載されている。 投票者は予想を立てる際にこの膨大な情報の中から、自分にとって何が有用

な情報なのか取捨選択し、レースの実際の結果を正確に予想しなければならな

い。その投票者の取捨選択の結果がオッズとなって表れているのである。本論

文では中央競馬 において、その馬券 を購入する投票者がどういった情報をも

とに着順の予想をするのかを、2015 年 1 月~9 月末に中央競馬で行われた芝コ

ースの重賞レースのデータを用いて、単勝オッズを被説明変数とし、出馬表に

記載される情報を説明変数とし、重回帰分析を用いて検証を行った。さらに真

に予想に有用な情報は何か明らかにするため、レースの実際の着順を被説明変

数とし、出馬表に記載される情報を説明変数として重回帰分析を行い、第一の

検証結果との比較を試みた。

2 先行研究との関係 投票行動に関連する先行研究を見てみる。芦谷(2010)で、「穴馬バイアス

(Longshot bias)」についてのサーベイが行われていた。それによれば、

Griffith(1949)が「穴馬バイアス」と呼ばれる、勝つ可能性が低いと考えられて

いる出走馬へ、実力以上のオッズがついてしまうという過剰な選好が見られる

ことを指摘し、この傾向は本命馬より穴馬の方が配当が大きくなることに起因

するものであった。穴馬バイアスの研究を通して、Preston and Baratta (1948),Yaari

(1965), Rosett (1971),Piron and Smith (1995)は起こる確率の低い事象を過大に見積

もり、逆に起こる確率の高い事象を過小に見積もる傾向があることを明らかに

した。これは競馬の予想において、心理的要因が作用していることとなる。こ

の傾向は本論文においても投票者がレースの予想をする際に見られた。また、

佐伯,山根(2015)において、投票行動を決定する際に、投票者が不確実性の指

標である出走馬について、全ての出走馬を考慮するのか、オッズが低い(人気

3

の高い)出走馬のみを考慮するのかという実証を行っている。その結果、投票

者は戦力バランスが均衡することで投票を忌避し、オッズの低い出走馬の部分

的な戦力バランスを考慮する方が、投票者の行動をよりよく説明できることを

明らかにした。すなわち、出走馬の実力が拮抗しているときは、投票に参加し

ようとは思わない人が多く、投票行動は人気の高い実力のある出走馬に限定し

た方がどのようにオッズが変動するかについてより正確に把握できるというこ

とを明らかにした。また太田ら(2009)の研究においては、レースの結果が単

勝オッズをどれだけ反映しているのかを確かめており、単勝オッズがレースの

結果をかなり正確にあらわしていることが明らかにし、『馬券を買う人々に馬

の強さが正確に伝わっているとするモデルは正しい』と結論付けた。しかしい

ずれの研究も、投票者がどういった情報に影響を受け、どのようにオッズが決

定しているのかについて言及しているものはなかった。

3 研究の動機と目的 研究の動機と目的であるが、第一にどういった情報を投票者が参考にしてい

るのか分かれば、競馬の予想を立てる際に非常に参考になると考えた。前述し

た通り、多くの投票者は競馬に関する専門紙である競馬新聞やスポーツ新聞の

競馬面、テレビ、ラジオ、最近ではインターネットの競馬情報サイトから情報

を得て予想の参考にする。それらには非常に多くの情報が記載されており、予

想にはどういった情報が有用なのか適切に判断することは困難だ。単勝オッズ

と着順の関係は強い相関があり、投票者のどの馬が 1 着になるかという予想は

かなり正しいことが分かっている。だからこそ投票者の全体がどういった情報

を参考に予想を立てているか分かれば、初心者もその情報をもとに予想をたて

れば良いので、この検証は有用なものとなる。 第二に投票者がどのような情報をもとに予想をするべきか知りたいと考えた。 投票者は多くの情報からレースの着順を予想するが、その予想をたてる時に重

要だと考えている情報が、真に予想をたてるのに役立つものなのかを検証した

い。本論文の第一の目的である、投票者がどのような情報を参考にしているの

かを明らかにした上で、実際のレース結果に影響が見られる情報、すなわち予

想を立てるのに真に有用な情報との比較を行い、そのズレは何なのか、そのズ

レを生じさせる原因は一体何なのかを明らかにしようと試みた。 この研究の背景には、運営側や競馬関係者と、投票者の間の大きな情報格差

が存在すると考えたからである。この情報格差が存在する証拠に、オッズに大

4

きな影響を及ぼすとして競馬関係者のレースの勝敗予想を公表することが事実

上制限されている。それは競馬法第十六条二項「日本中央競馬会は、競馬の公

正かつ安全な実施を確保するため必要があると認めるときは、農林水産省令で

定めるところにより、前項の規定による免許を取り消すことができる。」と記載

されており、競馬関係者の予想を公表する行為が競馬の公正かつ安全な実地を

妨げると考えられているのである。関係者だけがもつ有用な情報を公表するこ

とが法律で事実上禁じられているため、かなりの情報の非対称性が起こってい

ることが推察される。また競馬新聞上でも調教師や騎手のコメントが記載され

ていることがあるが、レースで勝利するために本当の情報は隠しておくという

のが常であろう。例えば騎手へレースにおいてどういった騎乗をするかという

指示はフタを開けてみないと分からない。そのような関係者にしか分からない

隠された重要な情報がある中で、レースの着順を正確に予想するのは非常に難

しい。しかし太田ら(2010)において明らかにされている通り、単勝オッズは

実際のレース結果を大きく反映しており「馬の強さが正確に伝わっている」。こ

の矛盾に疑問を持った。投票者はどういった情報から馬の強さを推し測ってい

るのか、ということをやはり知る必要があると考えた。

4 材料及び方法 4.1 方法 出馬表に記載される情報が単勝オッズにどのような影響を与えるのかを検証

するための方法として、被説明変数にはJRAが発表した最終の投票締め切り後

の単勝オッズ(p)の値を、競馬新聞(JRA-VAN2を用いた)の出馬表から読み取

れる情報を説明変数とし、以下のモデルを用いて重回帰分析を行う。 モデル:𝑦� = 𝑏0 + 𝑏1𝑥1 + 𝑏2𝑥2 + ⋯+ 𝑏𝑘𝑥𝑘

= 𝑏0 + ∑ 𝑏𝑖𝑥𝑖𝑘𝑖=1

単勝オッズを被説明変数としたのは、太田ら(2009)の研究において、単勝

オッズはレースの着順をかなり正確に表していることが明らかにされており、

2 JRA(日本中央競馬会)システムサービスが運営する競馬情報サービスで主に

中央競馬に関する情報提供を行っており、データ配信サービスのスタンダード

となっている。

5

そのため単勝オッズが正確な予想といえるからである。その正確な予想がどう

いった情報から決定するかを知るためである。 さらに実際の勝敗に相関のある出馬表に記載される情報と、投票者が参考に

する情報との乖離があるのかどうか検証するために、同じ説明変数を用いて、

被説明変数をレースの実際の着順とし、上記と同様の分析モデルで重回帰分析

を行った。 4.2 データ

ここでは分析に使用した説明変数のデータについて記述する。本論文では分

析の対象としたのは、中央競馬3で行われた2015年1月〜9月末の芝コース、レー

スのグレード4を重賞(G1、G2、G3)、1月から5月末までは馬齢4歳以上の競走

馬のみが参加出来るレース、6月〜は馬齢3歳以上の競走馬が参加出来るレース

とした(サンプル数=750)。分析の対象とした理由は以下である。国内で開催

されるレースの種類には中央競馬と地方競馬の2種類あって、中央競馬としたの

は、地方競馬に比べて中央競馬のレースの方が世間からの注目度が高く、得ら

れる情報も多いためである 6月からのレースを3歳以上の競走馬が参加出来るレースとしたのは、1月〜5

月末までは3歳馬限定のレースと馬齢4歳以上のレースの2種類に分けられてお

り、6月になるとレースの体系が再編され、2歳馬限定のレースとが3歳以上のレ

ースの2種類となるためである。 国内競馬においては、格の低い順に、新馬限定戦、未勝利限定戦、500万下

限定戦、1000万下限定戦、1600万下限定戦、オープン特別戦、G3、

G2、G1といったレースがある。その中で馬齢3歳以上、4歳以上の重賞レー

スに限定したのは、Bruce and Johnson(2002)によれば重賞レースは世間が注目す

るために投票者間の情報の非対称性が小さく、格落ちのレースはオッズに対し

てインサイダーの影響が大きいとしているためだ。格の低いレースというのは

国内競馬においては、上記したもののうち、新馬限定戦、未勝利限定戦、50

0万下限定戦、1000万下限定戦、1600万下限定戦のようなレースであ

3政府出資の特殊法人である日本中央競馬会が主催するものであり、地方競馬は

各地方自治体が主催している。 4初出走の競走馬は新馬クラス、勝利のない競走馬は未勝利クラス、あとは獲得

賞金に合わせて、500 万下クラス、1,000 万下クラス、1,600 万下クラス、オー

プンクラスとなる。オープンクラスには重賞と言われる G1、G2、G3 というグ

レードのレースがある。

6

る。世間からの注目度が低いレースは出馬表から得られる情報が少なく、Bruce and Johnson(2002)の指摘するように、オッズにはインサイダー情報が影響して

いると考えられるため、格の低いレースは除いた。また馬齢を限定したのは、

重賞レースであるが、馬齢が2歳であった場合、過去に出走したレースが少な

く、出馬表に記載される情報も少ないからである。それに比べて馬齢3歳以上、

4歳以上の重賞レースの出馬表には過去の情報が多く、詳細に記載されているた

めに、馬齢3歳以上、4歳以上の重賞に限定して分析することが本論文には好ま

しいといえる。 コースを限定したのは、芝コースとダートコースでは競走馬に求められる能

力が違うことが明らかであるからだ。競走馬がこれまで主戦場としてきたコー

スからダートコースあるいは芝コースでも好走できるかどうかを試す意味で違

うコースに出走させることはあっても、1頭の競走馬が芝コースにもダートコー

スにも継続して出走することは稀であり、主戦場とするコースに継続して出走

させるのが常だからである。加えて主にダートの重賞は中央競馬ではなく地方

競馬で行われる。中央競馬の芝コースのG1は20レースあるのに対してダートコ

ースのG1はフェブラリーステークス、チャンピオンズカップの2つだけしかない。

そのため2種類のコースうち集められる重賞のデータが芝コースの方が多かっ

たことが理由である。 4.3 使用した説明変数 ここでは本論文で使用した説明変数について記述する。

① n, 馬番(枠順) 馬番とは、レースに出走する馬にはあらかじめ割り振られた番号である。これ

を使って、「何番が 1 着」といったように投票者は馬券を購入する。それに加え

てこの番号にはもう一つ重要な意味がある。どの位置から競走馬がスタートを

切るかということを示す番号であるという意味をもつ。馬番号の 1 番の競走馬

から順にコースの内側のスタートゲートに入る。その性格を有しているため馬

番は枠順とも呼ばれる。この枠順はレースにとって非常に重要であると考えら

れている。それは、直線のみで構成されているレース以外ではコースにはカー

ブがあるからだ。直線のみで構成される重賞レースは、新潟競馬場で行われる

1,000m アイビスサマーダッシュ G3 のみである。コースにカーブがあるのにも

7

関わらず、競馬は陸上競技のトラックと違って外側を回る距離のロスが計算さ

れておらず、横一線でのスタートなので、外側からスタートする出走馬は明ら

かな不利がある。そのため投票者は枠順を考慮しているものと予想した。なお

枠順は抽選によって決定される。なお内枠からスタートするのか、外枠からス

タートするのかは 100%運で決定するので、馬の力量とは無関係である。 ② s, 先行馬ダミー v8, 差し馬ダミー v9, 追込馬ダミー 競走馬がどういうレース運びを過去のレースでしていたか、得意なレース運び

を表している。「先行」とはスタート直後から前の方に位置取りをし、そのまま

逃げ切る方法である。スタミナを必要とする方法であるといえる。「差し」とは

中位に位置取りをし、ゴール前の直線で瞬発力を活かして先行馬をかわす方法。

「追込」とは再後方に位置取りをし、ゴール前の直線で一気に前方の競走馬を

かわしていく方法。「差し」よりもより競走馬に瞬発力が必要となる。レースの

運び方は競走馬の個性であるものの、予想する人の好みがオッズに反映されて

いるものと考えられる。 ③ l, 前レースからの馬体重増減絶対値 馬体重増減絶対値とは、出走馬の体重が前走からいくら増えた(減った)か、

ということをプラス○kg(マイナス○kg)で表したものである。競走馬の調子

を測るために馬体重を考慮することがある。「体重の過剰な増減が勝敗に影響を

与える」といった記事は目にすることが多い。また常本・鈴木三好・光本・小

栗(1992)によると、日本で競走馬の体重の記録が競争成績表に記載され初公

表されたのは、昭和 45 年 8 月からであり、このことが出走時の馬体重がコンデ

ィションおよび競争能力と何らかの関係があることを示唆するものであるとし

ている。すなわち前回のレース時の馬体重から、あまりにも馬体重が増えたり

減ったりすることで投票者が投票を忌避すると考えられる。 ④ v13, 負担重量5 負担重量とは、出走馬に負荷される重りのことである。JRA によれば負担重量

の決め方は大きく分けて 2 種類あって、出走馬の年齢や性別の差を埋めて、同

5 競走馬が負担しなければならない重量のこと。騎手自身の体重と身に着ける衣

服、プロテクター、鞍などの馬具の重さを合わせたもの。

8

一条件下にする方法と、負担重量を変更することによってハンデキャップをつ

ける方法がある。前者には馬の年齢と性別によってあらかじめ定められている

馬齢重量表に従い負担重量が決定する馬齢重量戦(2 歳時と 3 歳時の同一年齢の

馬だけのレースに用いられる)と馬の年齢と性別によって競争ごとに自由に負

担重量が決定できる定量戦(主に G1 レースに用いられる)がある。後者には馬

の性別と年齢で定められる基準重量に、その馬の獲得した賞金の額、過去に勝

利した競争のグレードなどによって重量が加算され、負担重量が決定される別

定重量戦、3 人のハンデキャッパーが各馬に等しく勝機を与えようと出走馬の競

争成績や最近の調子などを資料とし、馬の能力に応じ重量を増減させるハンデ

キャップ戦がある。今回分析対象としたレースでは定量戦が 6 レース(G1 が 5レース、G2 が 1 レース)、別定重量戦が 22 レース(G2 が 11 レース、G3 が 11レース)、ハンデキャップ戦が 21 レース(G2 が 2 レース、G3 が 19 レース)

であった。1kg 負担重量が増加すると 0.2 秒〜0.4 秒タイムが増加するという通

説(競馬百科 297-305)あるため、その影響はオッズに影響していると予想される。 ⑤ a, 連勝ダミー このダミー変数は直近の5回以内のレースの中に連続した二回以上の1着が

あったかどうかを表すものである。直近 5 走の中に連勝していれば、安定して

力を発揮できる競走馬だという判断材料にもなりうる。また競走馬の積んでき

た実績の中で、過去のレースで結果がでていない競走馬だとしても最近になっ

て安定して勝利できる力をつけてきた、あるいは好調を維持していると考えら

れる。 ⑥ ore, 前走上がり 3 ハロン好タイムダミー

このダミー変数は、前走の上がり 3 ハロンのタイムが前走の出走馬のうち3

番目に速いタイムならば好タイムだとする変数である。コースにはハロン棒と

いうポールが 200m(=1ハロン)ごとに立っている。「上がり」というのはゴ

ール前をどのくらいの速さで駆け抜けたかという意味である。したがって「上

がり 3 ハロン」はゴールの 600m 手前からゴールまでを何秒で走ったかという

タイムである。したがって競走馬の純粋な瞬発力、スピードが表れる数値とい

える。レースにおいてその競走馬がゴール前でしっかり他の出走馬を抜ききる

力を有しているのかを判断する材料となる。しかし異なるレースを単純にタイ

9

ムだけで測って比べれば不都合が生じる。1 つはレースの距離の問題である。

1,200mを走るレースでは上がり3ハロンを計測するまでに競走馬が走る距離は

600m である。これに対して 3,000m を走るレースでは、計測するまでに 2,400mの距離を走らなければならない。その距離分の体力が消耗されてからの計測と

なる。このため全体としての上がり 3 ハロンのタイムも落ちる。もう 1 つはレ

ースのペースの問題がある。速いペースでレースが進むと、上がり 3 ハロンま

でにやはり体力が消耗されてしまう。やはりそのレース全体の上がり 3 ハロン

も落ちる。そのレース差を除くため、実際のタイムではなく、前レースの出走

馬のうち 3 番目以内に速いタイムかどうかで上がりの 3 ハロンが好タイムかど

うかを判断するのが望ましいと考えた。 ⑦ v28, 全レース勝率 v29, 全レース連対率6 出走馬が過去に出走した全てのレースにおいての勝率と連対率である。これは

過去を遡って全レースを対象にすることで、新馬戦から現在まで、安定的に力

を発揮できているかどうかの指標として用いた。この数値が高ければ高いほど

高い能力を有しており、全レースの連対率からは外部環境がどうであれ好走が

期待できるという安定性も有していると考えられる。 ⑧ v35, 該当距離勝率 v39, 該当距離複勝率 出走馬が過去に出走したレースの中で当該レースと同じレースの距離のもの

の勝率と複勝率を用いた。陸上競技に 100m、200m のような短距離を専門のラ

ンナーや中距離、長距離のランナーがいるように、競走馬においても短距離ば

かりに出走している競走馬、逆に長距離ばかりに出走している競走馬が多くい

ることから競走馬ごとに最も力を発揮できる距離が存在すると考えられる。中

央競馬では 1,000m~1,400m のスプリントレース、1,600m のマイルレース、

~2,400m の中距離レース、~3,600m の長距離レースと大雑把に区分することが

できる。過去に次回と同じ距離のレースに出走し、好走しているならば、同距

離の当該レースでも力を発揮することが出来る、距離適性を有しているのでは

ないか、という判断材料になっていると考えられる。 ⑨ rx, 該当コース勝率 v49, 該当コース複勝率

6 2 着以内に入る確率。また複勝率は 3 着以内に入る確率。

10

出走馬が過去に出走したレースの中で次回のレースに該当するレースの行わ

れた競馬場における勝率と複勝率を用いた。競馬場にはそれぞれ特徴がある。

その特徴が出走馬の得手不得手となることは競馬ファンにとってはよく言われ

ることである。中央競馬が開催される競馬場は全部で 10 場あり、4 大競馬場と

呼ばれるのは東京競馬場、中山競馬場、京都競馬場、阪神競馬場、ローカル競

馬場では札幌競馬場、函館競馬場、福島競馬場、新潟競馬場、中京競馬場、小

倉競馬場がある。ここで競馬場ごとの違いを明確にするため、4 大競馬場の芝コ

ースを比較してみる(表 1)。 表 1:コースの特性比較

直線距離 高低差 東京競馬場 525.9m 2.7m 中山競馬場 310m 5.3m

京都競馬場(内回りA7) (外回り A)

328.4m 403.7m

3.1m 4.3m

阪神競馬場(内回り A) (外回り A)

356.5m 473.6m

1.9m 2.4m

最大差 215.9m 3.4m (JRA ホームページより)

表 1 に示したのは、各競馬場のゴール前の最後の直線の距離の長さと、コー

スの高低差である。特徴的なのは東京競馬場のゴール前の直線が他競馬場と比

べて非常に長いことや、中山競馬場はアップダウンが激しいことが挙げられる。 先に述べた競馬ファンの通説というのはこれらの競馬場ごとの特徴からきて

いる。例えば直線距離の長い東京競馬場や、高低差 5.3m というタフなコースで

過去に好結果を出した出走馬は、同じ競馬場でレースをする時、再び好走する

だろうという考えのもと、投票者の予想の材料となっている。本論文で分析対

象となったのは東京競馬場 8 レース、中山競馬場 9 レース、京都競馬場 6 レー

ス、阪神競馬場 8 レース、札幌競馬場 3 レース、小倉競馬場 3 レース、中京競

馬場 4 レース、福島競馬場 2 レース、新潟競馬場 4 レース、函館競馬場 2 レー

スであった。

7 競馬場によっては外側を回るコースと内側を回るコースがあり、それぞれ外回

り、内回りと呼ばれる。A というのはコースの幅員の種類で広いものから順に Aとなっている。

11

⑩x1, 前走重賞の時の着順 x2, 前走重賞でない時の着順 x3, 前々走重賞の時の着順 x4, 前々走重賞でない時の着順 x5, 3 走前重賞の時の着順 x6, 3 走前重賞でない時の着順 x7, 4 走前重賞の時の着順 x8, 4 走前重賞でない時の着順 x9, 5 走前重賞の時の着順 x10, 5 走前重賞でない時の着順 出走したレースが重賞の時と重賞でない時とでダミー変数をとり、着順との交

差項とした。競馬新聞に記載されているのは最近の 5レースという場合が多い。

そのためここで分析するのは最近の 5 レースとした。 表 2 に変数の概要をまとめた。

表 2:変数の概要 Variable 平均 標準偏差 最小 最大

n s

v8 v9

l v13

a ore v28 v29 v35 v39

rx v48

x1 x2 x3 x4 x5 x6

54.676 8.496 0.372

0.3667 0.2093

4.993333 55.3 0.124 0.34

0.2454467 0.3706133 0.2381357 0.4398049 0.2017431 0.3951808

5.096 1.788

4.72267 2.077333

4.748 2.217333

77.11926 4.760413

0.4836609 0.482216

0.4071042 4.811114 1.691098

0.3298015 0.4740249 0.1055907 0.1272445 0.242506

0.3042814 0.2709653 0.3533068 5.320827 3.497337 5.340016 3.787675 5.347644 3.690633

1.3 1 0 0 0 0

49 0 0

0.039 0.094

0 0 0 0 0 0 0 0 0 0

525.1 18 1 1 1

38 58.5

1 1 1 1 1 1 1 1

18 16 18 18 18 17

12

x7 x8 x9

x10

4.174667 2.217333

3.768 2.222667

5.075678 3.779216 4.892111 3.697113

0 0 0 0

18 17 18 17

サンプル数は 750 であった。1 レースの出走頭数は最大で 18 頭で、最小が 8頭である。馬番(n)の平均値は 8.496 であった。ややフルゲートである 18 頭

立てのレース数は少ない。 出走馬のレースの運び方のうち逃げ型 84 頭、先行型(s)は 245 頭、差し型

(v8)267 頭、追い込み型(v9)154 頭であった。後方からレースを進める競

走馬が多くみられる。 前レースからの馬体重の増減絶対値(l)の平均値は 4.993333 であり最大の

絶対値は38kgであった。38kgという増減は明らかに前走から増えすぎであり、

休養明けの可能性が考えられる。負担重量(v13)の平均値は 55.3kg、最小値

は 49kg、最大値は 58.5kg であった。 全レースの勝率(v28)の平均値は 24.54467%、全レースの連対率(v29)の

平均値は 37.06133%であった。 該当距離勝率(v35)の平均値は 23.81357%、該当距離複勝率(v39)の平均

値は 43.98049%であった。複勝率になればかなり高い平均値を示しており、該

当するレース距離が得意な出走馬が多いということだと推察される。 該当コース勝率(rx)の平均値は 20.17431%、該当コース複勝率(v48)の

平均値は 39.51808%であった。しかし該当コースでのレース経験が少ない、ま

たは該当コースで一度もレースを行っていない出走馬が多く見られた。 近 5 走着順については、最小値が 0 となっているのは着順と重賞ダミーと

の交差項だからである。前走重賞時着順の時(x1)の平均値は 5.096 位、前走

重賞でない時の着順(x2)の平均値は、1.788 位、前々走重賞時(x3)の平均

値は、4.72267 位、前々走重賞でない時の着順(x4)の平均値は 2.077333 位、

3 走前重賞時の着順(x5)の平均値は、4.748 位、3 走前重賞でない時の着順(x6)の平均値は、2.217333 位、4 走前重賞時の着順(x7)の平均値は、4.174667 位、

4 走前重賞でない時の着順(x8)の平均値、2.217333 位、5 走前重賞時の着順

(x9)の平均値は、3.768 位、5 走前重賞でない時の着順(x10)の平均値は、

13

2.222667 位であった。近走が重賞の時の結果は、レースのレベルが高いため重

賞でない時と比較して約 2 着程度順位が下がる。 4.4 使用しなかった説明変数について 多重共線性が見られそうなJRA-VANの出馬表に記載される情報についてはあ

らかじめ被説明変数には加えないでおいた。数値化するのが難しい情報である

騎手、調教師、血統8 の情報ついては本論文については、説明変数には加えな

かった。 騎手について数値化が難しかった理由は、騎手の強さを明確にすることが難し

かったからである。確かに騎手の年間獲得賞金ランキングは存在する。しかし

騎手が騎乗してきた競走馬は異なるため、強い競走馬に騎乗出来ればレースに

勝利する可能性は大きく、したがって賞金を獲得しやすくなり、逆にそれほど

強くない競走馬に騎乗すればレースに勝利する可能性は低くなるので、このラ

ンキングでは明確に騎手の強さを測ることは難しいと考えた。また騎手がどの

競走馬に騎乗するのかを決定する方法においても、この賞金ランキングが騎手

の強さを明確に表しているとは言い難いところがある。『基礎競馬.com(http://www.kiso-keiba.com/jockey/06-2.html)』によれば、『所属に関しては、

関西の厩舎所属、関東の厩舎所属、そしてフリーと大きく3つに分かれます。

厩舎に所属している場合、厩舎側が騎手に乗せる馬をある程度用意してくれま

す。(厩舎にもよるとは思いますが)もちろん、厩舎が担当する強い馬にめぐり

合える可能性もあります。』とある。調べたところによれば、どの騎手をどの馬

に乗せるかということは馬主の方針に基づいて調教師に決定権がある。強い馬

には良い騎手を乗せようという思惑があるため、成績上位の騎手には強い馬の

騎乗依頼が多くなる。このことからも、賞金ランキングが騎手の力を反映して

いるかどうか疑わしい。また前述の騎手の決定方法であるが、どういった方法

で騎手の騎乗馬が決定するのかについて、JRA の公式な文書は見当たらなかっ

た。これらの理由より、騎手の力を数値化するのは難しいと判断し、説明変数

に加えないでおいた。 調教師については、調教師の優劣を判断する材料として、JRA が発表する賞金

ランキングがあるが、管理頭数もそれぞれの調教師で異なるため変数に加えな

8 父馬、母馬の血筋。

14

いでおいた。 血統においても、その血統の優劣を判断する材料として、JRAが発表する種牡

馬9 別の賞金ランキングがあるが、種牡馬の子供の頭数も違うため、それだけ

では優劣を判断できないと考えたからである。以上の理由から説明変数には加

えないでおいた。

5 分析結果と解釈 表3:単勝オッズへの影響

サンプル数 750

Adj R-squared 0.4009

被説明変数:単勝オッズ 係数 標準誤差 t 値 p 値

馬番,a 1.470836 0.4671749 3.15 0.002

先行ダミー,s 9.335826 10.52849 0.89 0.376

差しダミー,v9 21.63424 10.6007 2.04 0.042

追込みダミー,v10 39.98511 11.25472 3.55 0,000

馬体重,l -0.3493235 0.4714372 -0.74 0.459

負担重量,v13 4.414594 1.411252 3.13 0.002

連勝,a 8.716327 7.59158 1.15 0.251

3 ハロンタイム,ore -7.524323 5.460741 -1.38 0.169

全勝率,v28 -73.66625 38.2699 -1.92 0.055

全連対率,v29 -22.09384 31.03 -0.71 0.477

距離勝率,v35 9.85235 14.71993 0.67 0.504

距離複勝率,v39 -38.31713 11.52655 -3.32 0.001

コース勝率,rx -8.918296 12.13046 -0.74 0.462

コース複勝率,v49 -8.443 901.367 -0.93 0.354

前走重賞着順,x1 4.399757 0.5743876 7.66 0,000

前走非重賞着順,x2 6.206117 0.840806 7.38 0,000

前々走重賞着順,x3 2.512142 0.515898 4.87 0,000

前々走非重賞着順,x4 3.780117 0.7515111 5.03 0,000

3 走前重賞着順,x5 2.515142 0.5316352 4.73 0,000

9父親の馬(SIRE)。その子供がどれだけ賞金を稼いだかでランク付けされてい

る。2015 年の JRA のリーディングサイアーはディープインパクトである。

15

3 走前非重賞着順,x6 3.605811 0.7907284 4.56 0,000

4 走前重賞着順,x7 -0.3518515 0.5521217 -0.64 0.524

4 走前非重賞着順,x8 1.821119 0.7778978 2.34 0.019

5 走前重賞着順,x9 0.6292099 0.5383573 1.17 0.243

5 走前非重賞着順,x10 2.251107 0.7507948 3,00 0.003

_cons -255.3589 80.92109 -3.16 0.002

5.1 単勝オッズを被説明変数とした時 5.1-1 有意となった説明変数について

本論文では、競馬の予想において投票者がどのような情報から出走馬の強さ

を推し量っているのかを重回帰分析を用いた検証を行った。得られた結果は(表

3)に示されている。なおサンプル数は 750 であり、被説明変数がどの程度モデ

ル式によって表されるかを示す表中の Adj R-squared(自由度修正済決定係数)

が 40.09%であった。 表に示された結果を見る。まず各説明変数の係数のp値を見ることによって、

各変数が被説明変数に与える影響に関する統計的有意性を判断することができ

る。有意水準を 95%とすると、馬番(P>0.002,正の相関関係)、出走馬のレー

スの運び方のうち、差し馬ダミー(P>0.042,正の相関関係)、追込み馬ダミー

(P>0.000,正の相関関係)、負担重量(P>0.002,正の相関関係)、次のレースと

同距離の過去のレースの複勝率(P>0.001,正の相関関係)、最近の 3 レース

x1~x6(P>0.000,正の相関関係)、4 走前、5 走前の重賞でないレース x8(P>0.019,正の相関関係),x10(P>0.003,正の相関関係)以上が有意な値を示した。もう

少し有意水準の基準を緩めて有意水準を 90%とすると、有意な値を示したのは、

全レース勝率(P>0.055,正の相関関係)であった。以上より上記の変数が統計

的に有意な影響があるという結果が得られた。すなわち投票者はこれらをもと

に予想をたてていることが分かった。以下でこの有意な影響が見られた値につ

いて解釈をする。 (1)馬番=枠順(n) 馬番については表中の係数をみると、馬番が1つ大きくなれば、約1.5オ

ッズが大きくなる。これは内側でレースができ、よりロス無くコースを周回す

16

ることができるためだと考えられる。不確実な要素が多い中で確実にレースの

有利、不利がある要素であるため、投票者は信頼できる情報と考えている。 (2)負担重量(v13) 負担重量については、1kg 重量が増えると、約4.4オッズが大きくなる。

負担重量も馬番と同様に、レース前の出走馬の負担重量の差は、出走馬にとっ

て確実な有利不利のあるものなので、投票者は信頼できる情報として捉えてい

るようだ。よって投票者は負担重量についての通説を支持する結果となったと

いえる。 (3)レースの運び方(s、v9、v10) レースの運び方については先行型よりも後方待機型のレース運び方をする出

走馬を意識した投票行動であった。各出走馬の仕掛けるレースの展開のうち、

先行、逃げ切り型のレース展開を得意とする競走馬ではなく、後方待機、差し

切り型のレース展開を得意とする競走馬を意識した投票行動を投票者が行うの

はどうしてなのか考える必要がある。 考えられる可能性の1つめは、始めから前の方でレースを運び、そのまま逃

げ切って勝つことは難しいことだと投票者の多くが考えている可能性である。 2 つめは心理的な要因が働いて、後方から鮮やかに抜き去って勝つ勝ち方を投

票者が「強い」と判断しているという可能性である。先頭を走る馬に、およそ

届きそうもない後方から一気に差し切って勝という勝ち方は見ている側に衝撃

を与える。これならば、レース途中の位置取りが後方である追込み馬ダミーの

有意水準が差し馬ダミーよりも低いことの説明がつく。 3 つめは単に先行型の馬の方が能力が低かった可能性である。実際に先行馬の

能力が低いのか、あるいは投票者の心理的な選好が影響しているのかどうか見

るために、JRA がサラブレッドを格付けした、JPN サラブレッドランキングの

2015 年上半期の 4 歳以上(芝コース)において 50 位以内の競走馬の得意なレ

ースの運び方を JRA-VAN の出馬表に記載された情報を集計し、(表 4)にまと

めた。

表 4:上位 50 位以内の競走馬のレースの運び方 レース展開 逃げ 先行 差し 追込み

頭数 4 18 19 8

17

上位 50 以内の競走馬について先行型が 22 頭、差し型が 27 頭であり、大きな

差は見られなかったことから、得意なレースの運び方の違いが勝敗に影響して

いるのではない。よった先行型の馬の能力が劣っている訳ではないことが分か

る。よって投票者は心理的な要因によって差し型の出走馬を好んで投票してい

ると推察される。 (4)次のレースと同距離の過去のレースの複勝率(v39, 該当距離複勝率) 該当距離複勝率については、0.1上がれば、約38.4下がる。オッズが

次のレースと同距離の過去のレースの複勝率については、次走と同距離の過去

のレースで勝利したのか(v35, 該当距離勝率)ということよりもあくまでも「好

走したか」「この距離を走れる潜在能力があるか」が大切なのである。また、一

度でもそういった好走していれば、前に走った時よりも今回は成長している可

能性があると考えられているからかもしれない。 (5)最近のレース結果 有意な数値を示した最近のレース結果の、前走、前々走、3 走前について、投

票者はまずレースの着順という分かりやすい結果を参考にしていることが分か

る。そしてそれが最近であればあるほどオッズへの影響が大きくなる。その証

拠に、レース結果がより過去のものになるにつれて全体の傾向として P 値の上

昇と係数の推計値の低下が見られる。 また、直近の3走においては重賞での着順が被説明変数へ大きな影響を及ぼし

ているのに対して、それ以前のレースにおいては重賞でない時のレースの着順

に被説明変数へ大きな影響を及ぼしていることが分かった。具体的には 4 走前

の重賞レースの時の値が P>0.524、係数が-0.35 であり、5 走前の重賞レースの

時の値が P>0.243、係数が 0.294 であり、それぞれ有意なものとはならず、ま

た被説明変数への影響も小さかった。4 走前,5 走前の重賞でない時の値がそれ

ぞれ P>0.019,係数が 1.82、P>0.003,係数が 2.25 であり、有意かつ被説明変数

への影響も大きかった。 ここでなぜ直近の3走においては重賞での着順が単勝オッズに影響を及ぼし

ているのに対して、それ以前のレースにおいては、重賞でない時のレースの着

順が単勝オッズへ影響を及ぼすのかを検証する必要がある。そのため、過去の

レースごとに重賞レースとそうでない時の数を集計した(表 5)。

18

表 5:重賞レースとそうでない時の数

重賞 重賞でない 前走 495 255 前々走 454 296 3 走前 452 298 4 走前 431 319 5 走前 402 348

集計した結果、4 走前、5 走前は重賞レースに出走している競走馬が比較的少

ないことが分かる。4 走前、5 走前の重賞レースの結果が有意なものとなったの

は、今回分析対象としたのが重賞レースだったために、重賞レースへ出走する

ステップとなる下級のレースが多く、そういったステップアップのためのレー

スに勝利しないことには分析対象とした重賞レースに出走することはないこと

に起因するものであると推察される。G1 レースに限定して分析すれば出走馬の

過去出走したレースのグレードの差が縮小するはずなので、また違った結果が

得られるだろう。 5.1-2 有意とならなかった説明変数について

また上記の説明変数以外の有意な値を示さなかったものについても考察を加

える。なお「最近のレース結果」については有意な値を示したものの中に記し

てある。 (1)前レースからの馬体重の増減(l) 明らかな馬体重の増加や減少は競走馬のコンディションに問題があり、勝敗

に影響を及ぼすという通説から、投票者は大幅な馬体重の増減を忌避する意識

が働くのではないかと予想したが、結果に示した通り、投票において馬体重の

増減は考慮されていなかった。増加した馬体重を成長分だと捉える場合や減少

した分を馬体が絞れて良い体つきになったと捉えるのかは投票者の選好である

のかもしれない。 もしくは、馬体重をそもそも無視している可能性もある。出走馬の馬体重か

らコンディションが良いのか悪いのかということ推察するにはかなり専門的な

19

知識や経験が必要とされることは間違いない。専門的な知識や経験のない投票

者が馬体重の増減の情報だけで、正確に馬のコンディションをつかむことが困

難なため、そもそも馬体重を考慮しないという結果が表れていると考えられる。 コンディションに関して言うと、媒体では分からないが、体重の増減よりも

馬のコンディションをよくつかむことのできる、調教師からのインサイダー情

報がオッズに影響している可能性がある。 (2)連勝ダミー(a) 連勝ダミーについては、最近のレースの中で連勝していることは被説明変

数に影響を及ぼさない。続けて勝利することが必ずしも投票に影響を及ぼす

のではなく、x1~x6、x8、x10 あるいは該当距離複勝率(v38)が有意な値を

示したのと同様に「過去のレースで好走したかどうか」が勝敗予想に作用し

ていると考えられる。

(3)該当コース勝率、該当コース複勝率(rx、v49) 競馬場のコースで競走馬に得手不得手があるという通説からレースの行われ

る競馬場での過去の勝率、複勝率がオッズに影響していると予想したが、そ

の影響は見られなかった。この結果は、出走する競馬場でレースをした経験

が少ない、また一度もその競馬場でレースを行っていないという出走馬が多

く見られたことも影響していると考えられる。また全体の傾向としてレース

が始まる前に分かる確実な差がオッズに影響していることから、同じ競馬場

のコースで競争するという点で確かな差が見られないと判断しているためだ

ろう。

5.2 実際の着順を被説明変数とした時 5.2-1 有意となった説明変数について 単勝オッズを被説明変数とした時の分析結果と比較するため、レースの着順

を被説明変数とし、単勝オッズを被説明変数とした時に用いた説明変数をこち

らでも説明変数として用いて重回帰分析を行った。その結果を(表6)にまと

めた。被説明変数がどの程度モデル式によって表されるかを示す表中の Adj R-squared(自由度修正済決定係数)が 15.63%であり、オッズを被説明変数と

20

した時よりも低下した。よって着順を出馬表との関係で表すことは、単勝オッ

ズを被説明変数とした時と比べて不十分だといえる。 表に示された結果を見る。まず各説明変数の係数の P 値を見ることによって、

各変数が被説明変数に与える影響に関する統計的有意性を判断することができ

る。有意水準を 95%とすると、馬番(P>0.001,正の相関関係)、全レースの勝

率(P>0.031,正の相関関係)、上がり3ハロン好タイムダミー(P>0.047,正の相

関関係)、前走が重賞の時の着順(P>0.000,正の相関関係)、前走が重賞でない

時の着順(P>0.000,正の相関関係)、前々走が重賞の時の着順(P>0.002,正の相

関関係)、前々走が重賞でない時の着順(P>0.024 正の相関関係)、3走前重賞

でない時の着順(P>0.001,正の相関関係)以上が有意な数値を示した。 少し有意水準を緩めて 90%とすると、該当距離複勝率(P>0.060,正の相関関

係)、3走前重賞の時の着順(P>0.055,正の相関関係)以上が有意な数値を示し

た。有意な数値を示した説明変数がレースの着順と関係していることが分かっ

た。以下では有意となった説明変数と有意とならなかった説明変数についての

解釈と単勝オッズを被説明変数として重回帰分析を行った時との比較を行う。 5.2-2 有意となった説明変数の解釈 (1)馬番=枠順 単勝オッズを被説明変数とした時にオッズへの影響が見られたが、実際の着

順にも同じように影響が見られた。枠順が1上昇すれば、オッズは 0.119 上昇

する。これより、この情報はレースの予想に役立つといえる。すなわち投票者

に枠順には有利不利があるとみなされていたが、その考えは正しいと考えられ

る。 (2)全レースの勝率 単勝オッズを被説明変数とした時にオッズへの影響は、有意にならなかった

ものと比べて比較的有意なものとなったが、実際の着順に対する影響は大きい

ものとなった。なお勝率が1%上昇すれば、オッズが 6.041 上昇する。これよ

り、全レースの勝率はレースの勝敗予想に役立つと考えられる。実際の着順に

影響を及ぼす情報であるのにも関わらず、なぜ投票者はこの情報を重要なもの

と考えていないのかについて推察を行う。最近のレース結果を重要視する投票

者にとっては、昔のレース結果も含んだ全レースの勝率は軽視するのだと考え

られる。さらに最近のレースで1着になったかどうかではなく、好走するかを

21

重要視している。しかし実際の着順を被説明変数とした時にこの情報が有意と

なったのは、やはりしっかりと1着になることの出来る出走馬がレースでも好

走することができるのだと考えられる。 (3)上がり3ハロン好タイムダミー 単勝オッズを被説明変数とした時のオッズへの影響は見られなかったが、実

際の着順を被説明変数とした時には有意となった。これより上がり3ハロンの

情報はレースの予想に役立つと考えられる。その理由として、レースに勝つた

めには第一に他の出走馬よりもスピードで勝っていることが必要であるという

ことだろう。第二にそのスピードを出し切れるレース展開にあったかどうかと

いうことも重要だと考えられる。他の出走馬に進路を妨げられることなく、ス

ピードに乗れた出走馬が勝利するのだと考えられる。なぜ単勝オッズへの影響

が見られないのか推察することは現段階では難しい。 (4)最近のレース結果 最近のレース結果のうち、前走が重賞の時の着順、前走が重賞でない時の着

順、前々走が重賞の時の着順、前々走が重賞でない時の着順、3走前重賞でな

い時の着順がオッズへ影響していることが分かった。よって最近のレース結果

のうち、前走、前々走、3走前までの情報はレースの予想に役立つが、4走前、

5走前の情報は役には立たないと考えられる。その理由として考えられるのは、

前走、前々走で良い着順であった出走馬は、コンディションが良かったり、力

がつけていたりという理由があるのかもしれない。また3走前重賞の時の着順

よりも3走前重賞でない時の着順が影響していることが分かったが、その理由

を推察することは難しい。なお4走前、5走前のレース結果については実際の

着順への影響は見られなかったが、単勝オッズへの影響は上記の通り見られて

いる。その部分について推察を加える。おそらく投票者は得られる多くの情報

を考慮して予想をするので、4走前、5走前のレース結果も考慮にいれてしま

うことでこのズレが生じていると考えられる。 (5)該当距離複勝率 単勝オッズを被説明変数にした時に有意な値を示し、単勝オッズの影響が見

られたが、実際の着順を被説明変数とした時は、有意水準を 90%とした時は有

意な値となった。投票者は該当するレースの距離の長さを走れるだけのスタミ

ナがあるか、またはその距離の長さが出走馬にとって得意であるかどうかを見

極める指標となっていたが、この結果から、ある程度はその指標としての役割

22

を果たしているといえる。 3.2-3 有意とならなかった説明変数について 以下では有意とならなかった説明変数について、解釈と単勝オッズを被説明

変数とした時との比較していく。 (1)レースの運び方 単勝オッズを被説明変数にした時に有意な値を示さなかった先行馬ダミーに

加えて、単勝オッズを被説明変数とした時に有意な値であった、レースの運び

方のうち、差し馬ダミー、追込み馬ダミーについても有意な値を示さなかった。

5.1-1 の(3)で示した通り、強い競走馬には決まったレースの運び方があると

いう訳ではなく、投票者の心理的な選好がオッズに影響しているという推察が

補強された結果となった。投票者は出走馬がどういったレース運びをするのか

に高い関心があり、勝敗とは無関係に単にどういったレースの運び方が好きか

という投票者の選好がオッズに表れている。これは投票者が出馬表の中の情報

で重要だと考えているものと実際の着順とはズレがあるということである。よ

ってどういったレースの運び方をするのかという情報は、実際の着順を予想す

る際には役立たないといえるだろう。 (2)前レースからの馬体重の増減 単勝オッズを被説明変数にした時と同様に馬体重の増減は着順への影響は見

られなかった。よってこの情報はレースの予想には役立たないといえる。実際

の着順を被説明変数とした時も有意な値をとらなかったことから、投票者が馬

体重の増減の情報をそれほど重要だと考えていなかったことは正しかった。 (3)負担重量 単勝オッズを被説明変数とした時は有意な値を示し、単勝オッズへの影響が

見られ、JRA の本来の目的であるオッズのコントロールへは役立っていること

が分かった。しかし実際の着順を被説明変数とした時に、実際の着順への影響

は見られなかった。よってこの情報はレースの予想には役立たないといえる。

沖(1986)が指摘した、『競争距離 2,000m 程度までならば、競争能力の高い馬

は、負担重量が重くなってもその能力が発揮できる』という可能性と類似する

ものである。これは投票者が重要だと考えている情報、すなわち競馬ファンの

間で、負担重量は着順に影響を与えるという通説は正しいとはいえず、投票者

が負担重量の有利不利を着順予想に際して過剰に考慮していたことが分かった。

23

(3)その他の変数 連勝ダミー、全レースの連対率、該当距離の勝率、該当コースの勝率と複勝率

については、単勝オッズを被説明変数とした時と実際の着順を被説明変数とし

た時のいずれも有意な値を示さなかった。これより、これらの情報はレースの

予想に役立たないといえる。よってこれらの説明変数については投票者が予想

において重要だとみなしていないことは正しいと考えられる。

表 6:実際の着順を被説明変数とし、重回帰分析を行った結果 サンプル数 750

Adj R-squared 0.1563

被説明変数:着順 係数 標準誤差 t 値 p 値

馬番,n 0.1187565 0.341414 3.48 0.001

先行ダミー,s 0.6625855 0.76694275 0.86 0.389

差しダミー,v9 0.6150927 0.774705 0.79 0.427

追込みダミー,v10 0.8435887 0.8225011 1.03 0.305

馬体重,l -0.0120711 0.344529 -0.35 0.726

負担重量,v13 -0.0372885 0.1031351 -0.36 0.718

連勝,a 0.6415574 0.5547968 1.16 0.248

3 ハロンタイム,ore -0.7950968 0.3990739 -1.99 0.047

全勝率,v28 -6.04146 2.796785 -2.16 0.031

全連対率,v29 1.321865 2.26769 0.58 0.56

距離勝率,v35 0.1533459 1.07574 0.14 0.887

距離複勝率,v39 -1.586289 0.8423662 -1.88 0.06

コース勝率,rx 0.4674675 0.8865003 0.53 0.598

コース複勝率,v49 -0.503506 0.6653012 -0.76 0.449

前走重賞着順,x1 0.1173088 0.419765 4.09 0,000

前走非重賞着順,x2 0.274173 0.614466 4.46 0,000

前々走重賞着順,x3 0.1173088 0.0377021 3.11 0.002

前々走非重賞着順,x4 0.1242117 0.0549208 2.26 0.024

3 走前重賞着順,x5 0.745483 0.0388522 1.92 0.055

3 走前非重賞着順,x6 0.1953656 0.0577869 3.38 0.001

4 走前重賞着順,x7 -0.0677594 0.0403494 -1.68 0.094

24

4 走前非重賞着順,x8 -0.0259632 0.0568493 -0.46 0.648

5 走前重賞着順,x9 0.216431 0.0393434 0.55 0.582

5 走前非重賞着順,x10 0.16416 0.0548685 0.3 0.765

_cons 8.182374 5.913758 1.38 0.167

6 結論

本論文では競馬において勝敗予想をする際に、競馬新聞の出馬表の情報にお

いて、どういった情報を重要視し単勝オッズに反映されているのかということ

を明らかにするため、重回帰分析を用いて検証を行った。その結果、レースに

おける確実な有利不利である馬番(枠順)と負担重量、投票者の心理的な選好

の表れるレースの運び方、距離適性を示す指標である当該レースと同距離の過

去のレースの複勝率、最近のレース結果のうち前走の結果、前々走の結果、3 走

前の結果、4 走前の重賞ではない時の結果、5 走前の重賞ではない時の結果を重

要視し、いずれも単勝オッズに対して正の影響が見られた。投票者は馬券を購

入する際に、以上の情報を中心にレースの着順を予想を立てれば良いと考えら

れる。 さらに実際の勝敗に相関のある出馬表に記載される情報と、投票者が参考に

する情報との乖離があるのかどうか検証するために、同様の説明変数を使い、

実際の着順を被説明変数として分析を行った。その結果、投票者が重要視し、

オッズに反映されている情報と実際の着順との間にズレがあることが分かった。

そのズレとは、投票者が重要視している、レースの運び方、負担重量、4 走前の

重賞ではない時の結果、5 走前の重賞ではない時の結果は実際の着順には影響が

見られなかったことである。レースの運び方については投票者の心理的な選好

が過剰にオッズに表れていることを示唆する結果となり、負担重量については

重量の有利不利を過剰に考慮していることを示唆する結果となった。4 走前、5 走前のレース結果についても投票者が過剰に考慮してレースの着順予想が行わ

れていることを示唆する結果となった。 逆に投票者が重要だと見なしていなかった、全レースの勝率、前走の上がり 3

ハロンのタイムの情報には実際の着順と正の相関があったことである。 以上の結果より投票者が重要視している情報に加えて、実際の着順と相関の

ある情報を考慮すれば、より良い予想になると考えられる。

25

また今後の課題として、考慮出来なかった情報が非常に多い点が挙げられる。

本論文では便宜上出馬表に記載される情報をもとに投票者がレースの着順予想

を行っていると仮定した。確かに出馬表に記載される情報は、レースの着順を

予想する際に極めて重要な情報であることは、単勝オッズを被説明変数とした

時の分析結果の決定係数が示す通りである。しかし 1 章で記述した通り、投票

者は出馬表だけでなく、様々な情報を元に予想を行っている。そのため出馬表

の情報だけではやはり不十分である。具体的には投票者の掛け金に対するリタ

ーンに関する情報が考慮できていないことは大きな反省点である。投票者は常

に掛け金のリターンを気にして馬券を購入している。そういった出走馬の強さ

にまつわることではない情報がオッズに与える影響を差し引いて考える必要が

あったのかもしれない。また、出馬表が発表された時には分からない、馬場状

態や天候などの直前情報も考慮できなかった。それらの情報がどの程度単勝オ

ッズに影響するのかは分からないが、より説明変数となり得る情報をピックア

ップすることで、よりこの研究結果の信頼度が高まったことは言うまでもない

だろう。

参考文献 芦谷政浩『穴馬への過剰な選好(longshot bias)に関するサーベイ』国民経

済雑誌,202(2):13-28 2010-08 麻生征宏『現代社会における賭けに関する研究:競馬を事例として A Study

on Modern Gambling:in the Case of Horse Racing in Japan 』スポーツ社会学

研究 9,50−59,133,2001 太田慎吾,山中真人,佐藤丈,野村敬明『競馬におけるオッズ変動の解析による情

報伝達の研究(経済物理学とその周辺,統計数理研究所研究会共同研究集会,経済

物理学 2009-ミクロとマクロの架け橋-,京都大学基礎物理学研究所 2009 年度前

期研究会,研究会報告)』物性研究 93(5),679-680,2010-02-05 佐伯真,山根史博『国内競馬における不確実性仮説の検証:部分的戦略バラン

スと投票行動』国民経済雑誌,212(4),55-67,2010-10 常本健輔,鈴木三義,三好俊三,光本孝次,小栗紀彦『競走馬の体重と競争能力と

の関係 Trends in the relationships of racing performance and body weight in race horse』帯広畜産大学学術報告.自然科学 18(1),1-9,1992-11-20 日本中央競馬会『競馬百科』みんと 297-305,1976

26

Bruce, A. C., Johnson, J. E. V. (2002) “Investigating the Roots of the Favourite-Longshot

Bias : AnAnalysis of Decision Making by Supply- and Demand-Side Agents in Parallel Betting

Markets,” J. ofBehavioral Decision Making, 13, 413_430.