競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj...

32
卒業研究論文 競走馬の強さの分析と 馬券ポートフォリオ問題 学籍番号 12D8101016J 秋田 貴成 中央大学理工学部情報工学科 田口研究室 2016

Upload: others

Post on 19-Mar-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

卒業研究論文

競走馬の強さの分析と

馬券ポートフォリオ問題

学籍番号 12D8101016J

秋田 貴成

中央大学理工学部情報工学科 田口研究室

2016 年

Page 2: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

i

あらまし

本研究では対戦成績に基づく Bradley-Terry モデルを用いて競走馬の強さについて論ず

る.また,リターンの期待値(回収率)を確認した上でリスクの低減を考えた馬券の組み合

わせについて論ずる.

まず,過去の競走馬の対戦成績から,Bradley-Terry モデルを用いて各競走馬の「強さ」

を推定して,求めた競走馬の推定値と実際の競走馬の成績を比較して評価を行う,

続いて,本研究ではリターンの複数の期待値と組み合わせてリスクの低減を考えた馬券

におけるポートフォリオ最適化問題についても論ずる.馬券を投資の対象とすることによ

って,2 次計画問題として定式化して,最適解を求める.

キーワード:Bradley-Terry モデル,ポートフォリオ,線形計画問題

Page 3: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

ii

目次

第 1章 はじめに ......................................................................................................... 1

第 2章 強さをはかる .................................................................................................. 2

2.1 Bradley-Terryモデル....................................................................................... 2

2.1.1 「強さ」について ...................................................................................... 2

2.1.2 BTモデルの意味 ........................................................................................ 3

2.2 勝ち数の分布と尤度 ......................................................................................... 4

2.3 「強さ」の推定 ................................................................................................ 5

2.3.1 推定量に関する注意 .................................................................................. 7

第 3章 利用データとその使用方法 ........................................................................... 10

3.1 競走馬のレースに関するデータ...................................................................... 10

3.2 BTモデルにおけるデータ ............................................................................... 10

第 4章 競走馬の分析 ................................................................................................ 12

4.1 BTモデルによる分析 ...................................................................................... 12

4.1.1 近年のレース結果から ............................................................................. 12

4.1.2 年度別にみた強さ .................................................................................... 13

4.1.3 G1レースに勝つための指標 ..................................................................... 13

第 5章 競馬におけるポートフォリオ ....................................................................... 18

5.1 ポートフォリオ最適化問題 .............................................................................. 18

5.1.1 オッズについて ....................................................................................... 18

5.2 期待値と分散 .................................................................................................. 18

5.3 馬券的中の共分散を計算する ......................................................................... 21

第 6 章 おわりに ....................................................................................................... 27

6.1 まとめ ............................................................................................................. 27

6.2 今後の課題 ...................................................................................................... 27

謝辞 ............................................................................................................................ 28

参考文献 ..................................................................................................................... 29

Page 4: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

1

第 1章 はじめに

スポーツには様々な種類のものがある.個人で記録を競うもの,何人かで争って勝負を

決めるもの,チーム間で争って勝負を決めるもの等々,内容やルールは千差万別である

が,どのようなスポーツについても,プレイヤーの実力と共に偶然的要素である運が入

る.スポーツの面白さとは偶然的要素である運があることも魅力の1つであると思う.

スポーツの中にある偶然的要素は確率の概念を用いることによって,数学的にとらえる

ことができる.つまり,確率的な「モデル」を想定して,スポーツの記録を分析すること

によって,実力を運から離して考えることが出来る.

そこで,スポーツのデータについて,統計的分析を行う.本研究では競走馬のレースを

対象とする.競走馬のレース結果を対象にした理由として,データが豊富に存在するにも

関わらず,実際には直観による予想が主で統計的分析があまり深く行われていないと感じ

られたためである.今回は 2006 年から 2015 年までの中央競馬で行われた 10 年にわたる

データを使用する.

競馬には着順を予想して,その当たりによる配当を得るといった賭け事が存在する.そ

こで用いるのが馬券である.馬券にはあらかじめ各競走馬の人気の指標となるオッズとい

うものが存在する.オッズはその競走馬を含む馬券がいかに購入されたかで決定される.

つまり,オッズという情報からその馬券の的中する見込みを知ることができる.

今回はそのあらかじめ得られる情報のひとつである各馬券のオッズから,リターンの期

待値とリスクを求めることによって,少しでも回収率を見込んだ馬券の組み合わせについ

ての評価を行う.

Page 5: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

2

第 2章 強さをはかる

テニスやサッカーのように,2 人あるいは 2 つのチームが対戦する多くのスポーツにおい

ては,リーグ戦などのように互いに何回か対戦をし,その結果に基づいて各チームの「強さ」

を決めることがよくある.そこで本章では,合理的に個人または,各チームの強さを決める

ことが出来る Bradley-Terry モデル[1]について説明する.

2.1 Bradley-Terryモデル

2.1.1 「強さ」について

「強さ」というものを考えたときに,一般に,スポーツにおいては「強い」方が必ず勝つ

とは限らない.実際「強い」はずのチームが負ける「番狂わせ」がなく,一方がつねに勝つ

ものと決まっていれば,ゲームの興味はなくなってしまうだろう.したがって,あるチーム

が「強い」ということは,そのチームが必ず勝つということではなく,そのチームの勝つ「確

率」が大きいことを意味すると考える.そこで,勝敗の確率を問題とする.

いま,全部でm チームが互いに何回か対戦するものとし,そのうちのチーム i がチーム j

に勝つ確率を,

ijp ),,2,1,;( mjiji (2.1)

と表す.ここでは引き分けはないものと仮定すると,

1 jiij pp )( ji (2.2)

が成り立つ.

さて,対戦結果に基づいて「強さ」を計ることを考える前に,これらの確率から「強さ」

というものが一義的に定められるための条件について議論しておく.というのは,たとえば

3m として,

1331

3223

2112

2

1

2

1

2

1

pp

pp

pp

(2.3)

という関係が成り立つ場合は,チーム 2 が 1 より強く,3 が 2 よりも強く,1 が 3 より強

い,いわゆる「三すくみ」の状態になって,3 チーム間の「強さ」の順序さえ簡単には決め

られなくなってしまうからである.

Page 6: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

3

実は,各チームの「強さ」が一義的に定められるためには,それらの確率の間に単に上記

のような不等式が成立してはならないというだけでなく,より強い関係が成り立たなけれ

ばならない.そのための自然な条件として考えられるのは,各チームに対応してm 個の「強

さ」となる量 m ,,, 21 が存在して,全ての i , j の組み合わせに対し,確率 ijp が,

ji

iijp

)( ji (2.4)

と表されるものと想定する.あるいは,同じことであるが,

j

i

ji

ij

p

p

)( ji (2.5)

が成立するものと想定することである.このとき, i はチーム i の「強さ」を表すものと解

釈できる.この想定は,Bradley and Terry(1952)によるもので,Bradley-Terry モデル

(以下,BT モデル)と呼ばれる.

2.1.2 BTモデルの意味

BT モデルを導くには,いろいろな考え方があるが,そのひとつは次のようなものである.

いま,チーム i と j が「勝負」を決めるのに,直接には対戦せず,別のチーム k との対戦結

果によって決めることにする.つまり,チーム i が j に勝つことを「 ji 」と表すことに

して, ki , jk ならば,i が j に「勝った」ものとし, ki , jk ならば, j が

i に「勝った」ものとする.また, ki , kj または ki , kj のときは「引き分

け」として,同じことを,「勝負」がつくまで続ける.

このとき,チーム i が j に「勝つ」確率と「負ける」確率の比は jkkikjik pppp : であるか

ら,結局,チーム i が j に「勝つ」確率は,

jkkikjik

kjik

pppp

pp

(2.6)

となる.

さて,チーム i , j , k の間に「カモ・苦手」関係がないということは, i と j が直接対

戦したとき i が j に「勝つ」確率が,このように k を介して i , j の「勝負」を決めるとき

i が j に「勝つ」確率に等しいことを意味するものと考えられる.つまり,このときには,

jkkikjik

kjik

ijpppp

ppp

(2.7)

すなわち,

Page 7: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

4

jkki

kjik

ji

ij

pp

pp

p

p (2.8)

という関係が成り立つ.

いま,すべての i , j , k について上記の関係が成立するものとすれば,

mi

imi

p

p )1,,2,1( mi , 1m (2.9)

とおくとき,すべての i , j )( ji について,

j

i

jmmi

mjim

ji

ij

pp

pp

p

p

(2.10)

が成立する.こうして,式(2.5)が得られる.

式(2.5)はまた,

kjikjikijkij pppppp (2.11)

と書き直すことができる.この式は,3 チームがそれぞれ 1 回ずつ勝負したとき, ji ,

kj , ik という形の「三すくみ」が起こる確率が等しいことを意味している.もし

本当に「三すくみ」的な状況があればこれらの確率の一方が他方より大きくなる.したが

って,式(2.11)はそのような状況がないことを意味する.

2.2 勝ち数の分布と尤度

m チームの間で,何回か試合が行われたとき,その結果から各チームの「強さ」 i を推

定する問題を考える.いま,チーム i , j の間の試合数を )( jiij nn とし,i の j に対する勝

ち数を確率変数

ijX ),,2,1,;( mjiji (2.12)

で表す.引き分けはないものと仮定したから,

)( jinXX ijjiij (2.13)

となる.

ここで, ijX が 2 項分布 ),( ijij pnB に従うものとすれば,

Page 8: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

5

jiij x

ji

x

ij

jiij

ij

ijij ppxx

nxX

!!

!Pr ),,1,0( ijij nx (2.14)

となる.したがってそれらの同時確率は,

ji

x

ji

x

ij

jiij

ij

ijijjiij pp

xx

nmjijixX

!!

!,,2,1,;;Pr (2.15)

と書かれる.

さらに,BT モデルが成り立つときには,式(2.15)は,

m

i

t

i

jin

jijiij

ij

jin

ji

x

j

x

i

jiij

ij

ijij

i

ij

ij

jiij

xx

n

xx

nmjijixX

1

1

!!

!

!!

!,,2,1,;;Pr

              

(2.16)

となる.ここで,

m

ij

iji xt (2.17)

はチーム i の総勝ち数である.

式(2.16)を未知母数 ),,,( 21 m の関係とみなすとき,それを尤度(関数)と呼ぶ.

未知母数に関係のない部分を const.とおき,あらためて確率変数を含む形に書けば,いま

の場合の尤度は,

m

i

T

i

n

jiiij

1ji

const.L (2.18)

となる.つまり,この場合の尤度は個々の ijX を明示的に含まず,各チームの

総勝ち数

m

ij

iji XT (2.19)

だけの関数として表される.換言すれば,BT モデルのもとでは mTTT ,,, 21 が十分統計

量となる.逆に mTTT ,,, 21 が十分統計量となるのは BT モデルが成り立つ場合に限ると

いうことも証明できる.すなわち,この場合に各チームの「強さ」を求めるためには,試合

数のほかには各チームの総勝ち数を知ればいいことになる.

2.3 「強さ」の推定

「強さ」 ),,,( 21 m の推定に最尤方程式を用いる.つまり,式の尤度を最大に

Page 9: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

6

する ),,,( 21 m を求めて, に対する推定量とする.

ところで,式(2.4)の ijp の値は を定数倍しても変化しないから, i の値を一義的に定

めるためには何らかの基準化が必要となる.そのために, k を適当な定数として,

km

i

i 1

(2.20)

とおく.

この場合の最尤方程式の解はラグランジュの未定乗数法によって定められる.すなわち,

式(2.18)の対数(対数尤度)を,

const.logloglog1

ji

ji

iji

m

i

i nTLl (2.21)

とし, をラグランジュ乗数とすれば,

01

m

i

i

i

kl

(2.22)

01

m

i

i kl

(2.23)

より,

),,2,1(0ˆˆˆ

minT

ij ji

ij

i

i

   

, (2.24)

km

i

i 1

(2.25)

が得られる.

ここで,

ji

iijp

ˆˆ

ˆˆ

),,2,1,;( mjiji (2.26)

とおけば,式(2.24)から,

ij

iijiji pnT ˆˆ ),,2,1( mi (2.27)

となる.これをすべての i について加えれば,

Page 10: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

7

ji

ij

i

i

ji

jiijij

ji

ij

m

i

i

kn

ppn

nT

   

    ˆˆˆ

1

(2.28)

となり, 0 となることがわかる.したがって,最尤方程式は,

ij

i

ji

iij Tn

ˆˆ

ˆ ),,2,1( mi (2.29)

km

i

i 1

(2.30)

となる.

この方程式を解くには,次のようにするのが簡単である.式は,

i

i

ij ji

ij

ij

Tnn

ˆˆˆ

),,2,1( mi (2.31)

と書くことができるので, )0()0(

2

)0(

1

)0( ˆ,,ˆ,ˆˆm を適当な 1組の初期近似値として,

まずこの左辺の和に対する近似値

ij ji

ij

i

nr

)0()0(

)0(

ˆˆ ),,2,1( mi (2.32)

を計算する.そして,

)0(

)1(ˆ

i

ii

r

T (2.33)

とおいて,式を満たす新しい近似式)1(

ˆi を次式によって求める.

m

j

j

ii

k

1

)1(

)1()1(

ˆ

ˆˆ

),,2,1( mi (2.34)

式(2.32)~(2.34)を, ),,2,1(ˆ)(

mik

i の値が収束するまで繰り返すことで を推定でき

る.

2.3.1 推定量に関する注意

まず,nij = 𝑛,つまり,すべてのチームが同じ回数だけ対戦する場合について注意してお

こう.このときは式(2.29)から

Page 11: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

8

Ti − 𝑇𝑘 =𝑛(��𝑖 − ��𝑘)

��𝑖 + ��𝑘+ ∑

𝑛(��𝑖 − ��𝑘)��𝑗

(��𝑖 + ��𝑗)(��𝑘 + ��𝑗)𝑗≠𝑖,𝑗≠𝑘

が得られる.この右辺は(πi − ��𝑘) ×(正の量)という形であるから,πiの大きさの順序は勝敗

Ti,あるいは勝率Ti

𝑛(𝑚−1)の順序と同じになる.したがってこの場合は,勝敗で順位を決める

ことは合理的であると考えられる.

これに対してnijが一定でないときには,強さπjの順位は必ずしも勝率による順位と一致

しない.このことは当然であって,強いチームと多く対戦したチームは勝ち数が多くなく

ても,必ずしも弱いことにはならないはずである.しかしながら,この場合でもどの相手

に勝って,どの相手に負けたかは問題にする必要がなく,それぞれの相手との試合数のほ

かの総勝数だけで強さが求められることになる.だから番狂わせや金星は考慮にする必要

がない.それは,もし総勝数とそれぞれの相手との対戦数が一定ならば強い相手に勝った

ということは,他方では弱い相手に負けたことを意味するので,当チームが強いことには

ならないからである.

次に,全勝や全敗のチームがある場合についてふれておこう.いま,チーム 1 が全勝だ

ったとすれば,x1i = n1j (𝑗 = 2,3,… ,𝑚)であるから,

∑𝑛1𝑗 =∑𝑥1𝑗 = 𝑇1

𝑚

𝑗=2

m

j=2

となる.したがって,方程式(2.29)がi = 1で解をもつためには,n1j > 0のチーム,つまりチ

ーム 1 と対戦したすべてのチーム j について

π1��1 + ��𝑗

= 1

すなわち,πj = 0が成り立たなければならない.このとき,式(2.29)の第 j 方程式が解をも

つためには,Ti = 0となる必要がある.つまり,全勝のチーム 1 と対戦したチームすべて全

敗でなければ,方程式(2.29)は解をもたない.特に,チーム 1 と対戦したチーム同士が対戦

していれば解は存在しない.したがって通常の状況では,全勝のチームがあるときは各チ

ームの強さは決定できないことになる.

一方,チーム 1 が全敗だったとすれば,Ti = 0,したがって式(2.29)からπ1 = 0となる.さ

らにこのとき,式(2.29)は

Page 12: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

9

∑ 𝑛𝑖𝑗��𝑖

��𝑖 + ��𝑗= 𝑇𝑖 − 𝑛𝑖𝑗 (𝑖 = 2,3,… ,𝑚)

j≠i,j≠1

と書き直される.つまり,全敗のチームがあるときには,そのチームの強さは 0 であり,

それ以外のチームの強さの計算においては全敗に対する勝利は無視される.

Page 13: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

10

第 3章 利用データとその使用方法

本研究で使用するデータは,中央競馬で行われたレースのレース結果データとオッズデー

タであり,日本中央競馬会の公式データ配信サービスである JRA-VAN が配布しているデ

ータを用いる.

3.1 競走馬のレースに関するデータ

競走馬の分析をするにあたり,競走馬のレース結果をデータとして用いる.今回,2006

年から 2015 年までに中央競馬[2]で行われたレース結果のデータを入手することができた.

1 レース分のデータから得られるデータは,レース名,レースの開催年月日,場所,レース

距離,全着順,枠番,馬番,人気,全競走馬名,全騎手名,タイム,オッズなどであり,そ

の一例を表 3.1 に示す.

3.2 BTモデルにおけるデータ

以上のデータを用いて BT モデルによる「強さ」の推定を試みたいわけだが,BT モデル

は一対比較法であるので,1 レースに 2 頭以上が同時に出走するレース結果をそのまま利用

することはできない.

そこで,各レースの出走馬の名前と着順さえあればどの馬が何着か分かるので,多数ある

データの中から競走馬名と着順だけを取り出す.そして,一対比較の対を作るために,各競

走馬の中から 2 頭を取り出す全組み合わせを考える.その全組み合わせに対して一対比較

をそのレース結果で行うことになる.

表 3.1 入手可能な競争データの一例(2015 年 11 月 1 日天皇賞秋)[3]

Page 14: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

11

表 3.1 の例でいうと,ラブリーデイ対ステファノス,ラブリーデイ対イスラボニータ,ラ

ブリーデイ対ショウナンパンドラ,…,サトノクラウン対ヴァンセンヌという様に,出走馬

数n = 18, Cn 2 = 153通りの一対比較を行う.そして,競走馬ごとに,自分自身以外の対戦

相手との勝ち数と負け数をカウントし,n × nの対戦成績表を作る.そのようにして得られ

た各競走馬の対戦成績から「強さ」の推定を行う.

ここで,2 歳重賞レースに出走した競走馬と,重賞レース経験が少ない 3 歳馬は強さの計

算から除外した.レースには 2 歳馬限定,3 歳馬限定,3 歳馬以上,4 歳馬以上のレースが

あるが,2 歳馬には 3 歳馬以上の競走馬とレースを行うことがなく,接点がないことにな

る.このため,2 歳馬と 3 歳以上の競走馬は間接的に対戦することもないので,BT モデル

が成立しないと考えられるからである.

また,強さの推定を行う上で,何頭か全勝の競走馬が現れる場合と全敗の競走馬が現れる

場合があった.しかし,2.3.1 で述べたように BT モデルでは全勝馬が現れた場合には強さ

を計算することができない.また,全敗馬も同様に強さの推定値は 0 となってしまう.そこ

で,すべての馬に対して,1 勝 1 敗した架空の dummy 馬を用意し,全勝,全敗馬の処理を

施した.この操作の結果,dummy 馬以外の対戦成績も変わらず,すべての競走馬の強さを

推定することができる.

Page 15: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

12

第 4章 競走馬の分析

本章では,第 2 章で説明した BT モデルを用いて競走馬の強さを推定する.直接対戦して

いなくても間接的に強さを比較できるという BT モデルの特徴を利用して,年度を通した強

さ推定を行う.

4.1 BTモデルによる分析

競馬におけるコースには芝,ダート,障害があるが,本研究では芝のみを対象にした.こ

れは,芝をコースとしたレースが最も多く,出走馬も多いことによる.また,芝に出走する

競走馬はダートには出走せず,またその逆も然りのためこれもまた間接的にも対戦するこ

とがないので BT モデルが成立しないと考えたためである.

4.1.1 近年のレース結果から

ここで,入手できたレース結果の中で 3.2 のデータに関する条件,4.1 で説明したコース

に関する条件の下,2015 年の重賞レースに出走経験のある競走馬の対戦結果から強さを,

BT モデルを用いて推定した.上位 100 頭の強さの値を表 4.1 に示す.

表 4.1 によると,強さ推定値第 1 位は強さ推定値 9.834078 でゴールドアクターとなっ

た.ゴールドアクターは競馬の目玉のレースでもある有馬記念を制した馬である.2015 年

度の成績は G1 こそ 1 勝だが,4 戦全勝と負けなしで実際にも強いと認識できる馬である.

第 2 位は強さ推定値 7.470509 でドゥラメンテであった.骨折をして後半レースに参加する

ことはできなかったが,500 万下の 1 着から始まり,その後 G1 である皐月賞,東京優駿を

ともに 1 着で 2 連勝と底が見えない競走馬である.第 3 位は強さ推定値 6.012632 で年度代

表馬と最優秀短距離馬を受賞,6 戦全勝し,G1 も 3 勝と強さを見せつけたモーリスとなっ

た.

上位 10 頭に注目してみると,3歳馬が 3 頭,4歳馬が 5 頭,5歳馬と 7 歳馬が 1 頭ずつ

であった.馬によってタイプはあるだろうが,一般には 4~6 歳までにピークを迎えるとい

われている.こうしたなかで,8 頭もが 4 歳以下であった.2015 年度は若い馬が台頭して

きており,特に,重賞レースで 6 戦中 5 戦 3 着以内に入賞しているリアルスティールや,

G1 で 2 勝しているミッキークイーン,また,G1 で負けを知らないドゥラメンテ,これら

3歳馬は今後の競馬界を引っ張る新しい競走馬とも期待できる.

また,求めた強さの順位は必ずしも勝率とは一致しないことに注意されたい.例えば,モ

ーリスは G1 で 3 勝し 6 戦全勝と勝率も 100%となっているが,第 3 位である.これは 3 歳

馬が強い年で,1 負こそあったが 3 歳限定レースなどでその強い馬達にも勝った第 2 位の

Page 16: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

13

ドゥラメンテが評価されたためである.これは間接的にも強さを推定できる BT モデルの特

徴である.

4.1.2 年度別にみた強さ

今度は年度別に推定した強さを比較してみる.2006 年度から 10 年間に及ぶ各年度の上

位 10 頭の強さを表 4.2 示す.

各年度の 1 位を見てみると,やはりどの馬も G1 を制した名だたる競走馬ばかりである.

中でも 2006 年度のディープインパクトが強さ推定値 32.70405 と圧倒的な強さである.実

際にこの年のディープインパクトの成績は,失格となった凱旋門賞を除いて G1 で 4 勝,

G2 で 1 勝,なんとすべて 1 番人気の全戦全勝であった.

また,ウォッカに着目してみると,2007 年度の 10 位から 2008 年度に 3 位,2009 年度

に 1 位と年々ランキングと強さ推定値を上げており,ウォッカの成長が見て取れる.実際

にもウォッカは 2007 年に日本ダービーの 1 勝,2008 年に安田記念,天皇賞(秋)の 2 勝,

2009 年にヴィクトリアマイル,安田記念,ジャパンカップの 3 勝している.

4.1.3 G1レースに勝つための指標

競馬の最高峰のレースである G1.そこで勝つためにはどの程度の強さが必要なのか,こ

こで考えてみる.ここで 2011 年から 5 年間でそれぞれ G1 を制した競走馬の強さを表 4.3

に示す.

あるレースにおいて比較してみると,例えば有馬記念では平均値 7.3697 と全 G1 レース

の中でも圧倒的に高い値をだしており,G1 最高峰のレースである有馬記念を制するにはそ

の年度の最強クラスの馬でなければ勝てないということがわかる.4 番人気で平均値とは程

遠い 2014 年度のジェンティルドンナの 1.44 という値は結果的には有馬記念において番狂

わせの優勝だったとも捉えることができる.

全体的に強さの平均値を見ると,各 G1 レースによってかなりばらつきがあることが分か

る.中には,その年の最強クラスの馬が制して平均値を底上げしてしまっているレースもあ

るが,ヴィクトリアマイル,エリザベス女王杯,桜花賞,オークス,秋華賞といった牝馬限

定のレースの平均値が全体的に比べて低いことがわかる.これは,人間でも一般に女性の方

が男性より力が弱いように,牝馬は牡馬に比べて弱いといわれているが,こうした数値から

もそういったことがわかる.これは牡馬の G1 レースである皐月賞,日本ダービー,菊花賞

と比較しても,平均値の違いは明らかで,牝馬は牡馬に比べて弱いということがはっきりと

わかる.また,その中でも 2012 年度ジャパンカップ,秋華賞,オークス,桜花賞で優勝し

たジェンティルドンナは牡馬と比べても,決して弱いとは言えない.

では,G1 レースに必要とされる最低の強さはどれくらいか.平均でみるとヴィクトリア

マイルの 0.2376 であるが,4 歳馬以上の牝馬でなくては出走できず限定されている.次の

NHK マイルカップも 3 歳馬のみのレースと限定されている.では,次はどのレースであろ

Page 17: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

14

うか.天皇賞(春)の 1.0961 であるが,レース距離が 3200m と長距離のレースとなってい

る.競走馬には性別など距離適性というレース毎の得意不得意がありそうなので,一概に

G1 レースに必要とされる最低の強さを断言することは難しい.どうやら平均値の低い G1

レースは,条件があったりそこに出走してくる競走馬の数も全体的に少なかったりするの

で,平均値も低くなると考えられる.

Page 18: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

15

表 4.1 2015 年度の強さ 上位 100 頭

順位 競走馬名 強さ 順位 競走馬名 強さ1 ゴールドアクター 9.834078 51 アンドリエッテ 0.3677982 ドゥラメンテ 7.470509 52 トーホウジャッカル 0.3591973 モーリス 6.012632 53 ロサギガンティア 0.359034 ミッキークイーン 2.654638 54 ラストインパクト 0.3558355 リアルスティール 2.618609 55 エキストラエンド 0.3530146 サトノアラジン 2.17025 56 ディアデラマドレ 0.3523247 ラブリーデイ 1.852896 57 リアファル 0.3428628 エイシンヒカリ 1.671597 58 カレンミロティック 0.3412989 エアロヴェロシティ 1.634614 59 カムフィー 0.341089

10 イスラボニータ 1.617042 60 スピルバーグ 0.34017111 ディサイファ 1.424839 61 ダコール 0.33613212 ステファノス 1.39578 62 クラレント 0.3316713 ミトラ 1.283911 63 クルミナル 0.33047314 ロゴタイプ 1.271366 64 トーセンスターダム 0.32981515 キタサンブラック 1.161243 65 トーセンビクトリー 0.32441216 ヌーヴォレコルト 1.128098 66 ブライトエンブレム 0.32426317 フィエロ 1.095784 67 スマートレイアー 0.32246318 マリアライト 1.039606 68 サンライズメジャー 0.30865519 アンビシャス 0.887666 69 ヴェラヴァルスター 0.30701320 フルーキー 0.814254 70 ベルーフ 0.30388821 サトノラーゼン 0.812183 71 ヒストリカル 0.30350122 ショウナンパンドラ 0.804473 72 パッションダンス 0.29962523 サウンズオブアース 0.779686 73 タッチングスピーチ 0.29928624 キズナ 0.758899 74 ジュンツバサ 0.29481725 デニムアンドルビー 0.752769 75 コウエイオトメ 0.29035226 ビッグアーサー 0.739719 76 ファタモルガーナ 0.28133327 エアソミュール 0.644811 77 ルージュバック 0.28055128 ホッコーブレーヴ 0.592741 78 シベリアンスパーブ 0.28024229 アルビアーノ 0.59161 79 ストレイトガール 0.28007330 ラキシス 0.557378 80 ケイアイエレガント 0.27366131 タンタアレグリア 0.536279 81 メイショウカドマツ 0.26422132 ウイングチップ 0.526927 82 グランデッツァ 0.26339633 ダノンプラチナ 0.518145 83 カレンブラックヒル 0.25472934 フェイムゲーム 0.456786 84 ウインバリアシオン 0.2484635 グランシルク 0.454683 85 プロモントーリオ 0.24725136 ゴールドシップ 0.444797 86 ウインリバティ 0.24465837 マイネルフロスト 0.431482 87 クインズミラーグロ 0.23786538 カフェブリリアント 0.418432 88 ダンスディレクター 0.23722839 トゥインクル 0.414364 89 レッドデイヴィス 0.23356340 アイスフォーリス 0.410715 90 アースソニック 0.22667241 クイーンズリング 0.407843 91 スーパームーン 0.21884842 ミュゼエイリアン 0.397295 92 サクラゴスペル 0.21415343 ウリウリ 0.393944 93 ナカヤマナイト 0.20570844 サトノクラウン 0.388644 94 クラリティスカイ 0.20552245 ヴァンセンヌ 0.384909 95 ダービーフィズ 0.2037246 ワールドエース 0.377969 96 ミッキーアイル 0.20294247 アドマイヤデウス 0.374703 97 アルフレード 0.1970448 マキシマムドパリ 0.374119 98 アースライズ 0.19265949 レーヴミストラル 0.369473 99 トーセンレーヴ 0.19261450 アルバート 0.368158 100 サトノノブレス 0.185407

Page 19: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

16

表 4.2 各年度の強さ 上位 10 位

      2006年度       2007年度       2008年度       2009年度1 ディープインパクト 32.70405 ダイワスカーレット 8.653854 ダイワスカーレット 13.17489 ウオッカ 12.468052 ポップロック 9.128611 アドマイヤムーン 6.002568 ディープスカイ 5.785031 カンパニー 6.9190223 ブリッシュラック 7.148372 メイショウサムソン 4.404274 ウオッカ 3.736122 ディープスカイ 4.5271864 ダイワメジャー 3.800246 ポップロック 3.808388 エイジアンウインズ 3.354786 レッドディザイア 3.8438655 ドリームパスポート 3.46663 カンパニー 2.524249 スクリーンヒーロー 3.05694 ブエナビスタ 3.0991816 メイショウサムソン 2.252939 ロックドゥカンブ 2.463209 アルマダ 2.758568 シンゲン 2.8422917 ソングオブウインド 2.016931 アドマイヤジュピタ 2.240268 エイシンデピュティ 2.364268 ドリームジャーニー 2.3550518 ジョイフルウィナー 1.790537 ダイワメジャー 1.578096 ブルーメンブラット 2.324092 オウケンブルースリ 2.1471779 ダンスインザムード 1.376118 ベッラレイア 1.503201 ジャガーメイル 2.319706 コンデュイット 1.993073

10 ウィジャボード 1.362618 ウオッカ 1.4856 スリープレスナイト 2.166234 アクシオン 1.874069

      2010年度   2011年度 2012年度       2013年度1 ブエナビスタ 13.17723 オルフェーヴル 8.842621 ゴールドシップ 8.909968 オルフェーヴル 7.820732 ヴィクトワールピサ 11.31797 スノーフェアリー 6.302825 ジェンティルドンナ 6.958334 ロードカナロア 7.3120433 ローズキングダム 6.033464 ダークシャドウ 5.131584 ディープブリランテ 4.887457 エピファネイア 3.1635424 ビッグウィーク 3.770872 アヴェンチュラ 4.995116 トーセンホマレボシ 4.430496 ジェンティルドンナ 3.023675 アーネストリー 3.244458 カレンチャン 3.262249 ヴィルシーナ 3.35344 フーラブライド 2.4469756 ダノンヨーヨー 3.193031 エイシンアポロン 2.532077 ワールドエース 3.237205 エクセラントカーヴ 2.3593447 エイシンフラッシュ 2.256972 ブエナビスタ 2.117082 ルーラーシップ 2.716201 ダノンシャーク 2.2977858 ペルーサ 2.194098 ルーラーシップ 2.077816 フェノーメノ 2.684977 アルキメデス 2.2923429 トーセンジョーダン 2.193443 ヒルノダムール 2.01621 カレンブラックヒル 2.681816 フェノーメノ 2.269987

10 ウルトラファンタジ 1.779508 トーセンジョーダン 1.729545 スカイディグニティ 2.556282 キズナ 2.247599      2014年度        2015年度

1 ジャスタウェイ 7.039598 ゴールドアクター 9.8340782 スピルバーグ 5.132951 ドゥラメンテ 7.4705093 ハープスター 4.280027 モーリス 6.0126324 ヌーヴォレコルト 3.227439 ミッキークイーン 2.6546385 イスラボニータ 2.763149 リアルスティール 2.6186096 トーホウジャッカル 2.620528 サトノアラジン 2.170257 アルキメデス 2.350682 ラブリーデイ 1.8528968 エピファネイア 2.281143 エイシンヒカリ 1.6715979 ゴールドシップ 2.177408 エアロヴェロシティ 1.634614

10 ディアデラマドレ 1.860566 イスラボニータ 1.617042

Page 20: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

17

表 4.3 G1 を制した競走馬の強さ

レース名年度 有馬記念 ジャパンカップ マイルチャンピオンシップ エリザベス女王杯2011年度 オルフェーブル 8.842620854 ブエナビスタ 2.11708234 エイシンアポロン 2.532076971 スノーフェアリー 6.302824872012年度 ゴールドシップ 8.90996766 ジェンティルドンナ 6.958333973 サダムパテック 0.32123235 レインボーダリア 0.1835151842013年度 オルフェーブル 7.820730282 ジェンティルドンナ 3.023670477 トーセンラー 2.228011809 メイショウマンボ 0.6681597422014年度 ジェンティルドンナ 1.44109755 エピファネイア 2.281143238 ダノンシャーク 0.666589911 ラキシス 0.6888722022015年度 ゴールドアクター 9.834077893 ショウナンパンドラ 0.804473475 モーリス 6.012631735 マリアライト 1.039605924   平均 7.369698848 3.036940701 2.352108555 1.776595585

天皇賞(秋) 菊花賞 秋華賞 スプリンターズステークス2011年度 トーセンジョーダン 1.72954475 オルフェーブル 8.842620854 アヴェンチュラ 4.995115878 カレンチャン 3.2622489772012年度 エイシンフラッシュ 0.724485652 ゴールドシップ 8.90996766 ジェンティルドンナ 6.958333973 ロードカナロア 0.90040712013年度 ジャスタウェイ 0.795130761 エピファネイア 3.163542319 メイショウマンボ 0.668159742 ロードカナロア 7.3120434322014年度 スピルバーグ 5.132951266 トーホウジャッカル 2.620527865 ショウナンパンドラ 0.376940425 スノードラゴン 0.4150039182015年度 ラブリーデイ 1.852895509 キタサンブラック 1.161242896 ミッキークイーン 2.654638263 ストレイトガール 0.28007319   平均 2.047001587 4.939580319 3.130637656 2.433955324

宝塚記念 安田記念 日本ダービー オークス2011年度 アーネストリー 0.464632442 リアルインパクト 0.361170143 オルフェーブル 8.842620854 エリンコート 0.1205207812012年度 オルフェーブル 0.897234059 ストロングリターン 0.457812776 ディープブリランテ 4.887457237 ジェンティルドンナ 6.9583339732013年度 ゴールドシップ 0.487566037 ロードカナロア 7.312043432 キズナ 2.247599465 メイショウマンボ 0.6681597422014年度 ゴールドシップ 2.177408075 ジャスタウェイ 7.039598407 ワンアンドオンリー 0.846346034 ヌーヴォレコルト 3.2274394282015年度 ラブリーデイ 1.852895509 モーリス 6.012631735 ドゥラメンテ 7.470509199 ミッキークイーン 2.654638263   平均 1.175947224 4.236651299 4.858906558 2.725818437

ヴィクトリアマイル NHKマイルカップ 天皇賞(春) 皐月賞2011年度 アパパネ 0.332022317 グランプリボス 0.31975579 ヒルノダムール 2.016209881 オルフェーブル 8.8426208542012年度 ホエールキャプチャ 0.112868621 カレンブラックヒル 2.681816121 ビートブラック 0.274101938 ゴールドシップ 8.909967662013年度 ヴィルシーナ 0.281885982 マイネルホウオウ 0.192597799 フェノーメノ 2.269986972 ロゴタイプ 1.3596208692014年度 ヴィルシーナ 0.181299879 ミッキーアイル 0.257120934 フェノーメノ 0.475159982 イスラボニータ 2.7631490472015年度 ストレイトガール 0.28007319 クラリティスカイ 0.205522406 ゴールドシップ 0.444796962 ドゥラメンテ 7.470509199   平均 0.237629998 0.73136261 1.096051147 5.869173526

桜花賞 高松宮記念2011年度 マルセリーナ 0.412953783 キンシャサノキセキ 0.9843338032012年度 ジェンティルドンナ 6.958333973 カレンチャン 0.4942030342013年度 アユサン 0.621979209 ロードカナロア 7.3120434322014年度 ハープスター 4.280027261 コパノリチャード 0.3653363542015年度 レッツゴードンキ 0.165297194 エアロヴェロシティ 1.634613745   平均 2.487718284 2.158106074

Page 21: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

18

第 5章 競馬におけるポートフォリオ

一般的な投資家は,リスク管理のために自らの資産を複数の金融商品に分散させて投資

する。その金融商品の組み合わせのことをポートフォリオという.本研究では,投資対象を

馬券とし,最適化問題として扱う.

5.1 ポートフォリオ最適化問題

今回競馬におけるポートフォリオを考えるわけだが,ここでは投資対象を馬券にする.つ

まり,馬券のポートフォリオの最適解を求めることがここでの問題である.馬券にはあらか

じめ的中する見込みが立つオッズというものがある.この各馬券に対するオッズを用いる

ことによってポートフォリオ最適問題を導こうというわけである.

5.1.1 オッズについて

各馬券にあてられているオッズだが,このオッズとはそもそもなにか.よくギャンブル

などで目にするが,オッズとは的中確率に対応する数値である.また,オッズが示す数値は

馬券が的中した場合の配当を与える.例えば,競馬において,オッズが「2.0 倍」の単勝を

100 円勝った場合,2.0 × 100円=200 円の払戻金を受け取れるというわけである.

では,そのオッズはどのように決まるのか.オッズの元となるのは票数である.1 票は 100

円で,馬券ごとに独立しているので票数がゼロならオッズもゼロとなる.オッズの計算とし

ては,ある馬券に入った票数をそのレースの全馬券の総票数で割る.その逆数がオッズとな

る.つまり,オッズは全買い目に対する占有率(シェア)の逆数である.しかし,実際のオッ

ズはそこから控除率 25%で引き去られているのでもっと少なくなる.[4]

オッズをみることによって,その馬券の的中する見込みが立つわけである.本研究ではこ

のオッズを使ってポートフォリオ問題を解いていく.

5.2 期待値と分散

ポートフォリオとは,様々な資産を組み合わせて,一定のリターンの下,リスクを低減す

るような資産構成のことをいう.ここで,ポートフォリオ問題でよく耳にする期待値とは,

取る可能性のある値×確率の和で定まり,本研究でいう馬券があたった時のリターンのこ

とである.分散とは,実現値の期待値のまわりのばらつき具合のことをいう.本研究では馬

Page 22: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

19

券にあてられたオッズを用いることによって,期待値と分散を求める.ここではその期待値

と分散の求め方について説明する.

いま,対象とする馬券を2つとする.馬券 1 と馬券 2 に対して,それぞれが当たる確率

P(X1 = 1) = 𝑝1

P(X2 = 1) = 𝑝2 (5.4)

と表す.ここで,P に対するXは確率変数を意味して,当たった時はX = 1,外れた時はX = 0

となる.

ここで馬券に対しての投資割合をそれぞれZ1, 𝑍2とすると,

𝑍1 + 𝑍2 = 1 (5.2)

が成り立つ.

馬券 1,馬券 2 に対するオッズを𝑟1, 𝑟2と表す.それぞれの馬券に対するリターンは,

𝑟1𝑍1 = 𝑦1

𝑟2𝑍2 = 𝑦2

(5.3)

と表せ,(Z1, 𝑍2)の投資に対するリターンを Y とすると,

𝑌 = 𝑦1𝑋1 + 𝑦2𝑋2 (5.4)

のようにリターンを確率変数として表せる.

次に,リターン Y に対し,期待値を求めていく.期待値は,

𝐸[𝑦1𝑋1 + 𝑦2𝑋2] = 𝑦1𝐸[𝑋1] + 𝑦2𝐸[𝑋2] = 𝑦1𝑝1 + 𝑦2𝑝2 (5.5)

と表せる.

期待値に対して,分散は,

𝐸[(𝑦1𝑋1 + 𝑦2𝑋2 − (𝑦1𝑝1 + 𝑦2𝑝2))2] =

𝐸[(𝑦1(𝑋1 − 𝑝1) + 𝑦2(𝑋2 − 𝑝2))2] =

𝑦12𝐸[(𝑋1 − 𝑝1)

2] + 𝑦22𝐸[(𝑋2 − 𝑝2)

2]

+ 2𝑦1𝑦2𝐸[(𝑋1 − 𝑝1)(𝑋2 − 𝑝2)]

(5.6)

Page 23: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

20

となる.ここで,

𝐸[(𝑋1 − 𝑝1)2] = 𝜎1

2

𝐸[(𝑋2 − 𝑝2)2] = 𝜎2

2

𝐸[(𝑋1 − 𝑝1)(𝑋2 − 𝑝2)] = 𝜎12

(5.7)

と置くと,

E[(𝑦1𝑋1 + 𝑦2𝑋2 − (𝑦1𝑝1 + 𝑦2𝑝2))2] = 𝑦1

2𝜎12 + 𝑦2𝜎2

2 + 2𝑦1𝑦2𝜎12 (5.8)

となる.(5.5)の期待値を定めたとき,(5.2)の制約の下でこの式を最小化する問題を最適化問

題とする.

(5.8)の𝜎12, 𝜎2

2, 𝜎12を数値化して得ることができれば,{𝑦𝑖}または𝑦1, 𝑦2に関する二次計画問題

となる.

そこで,𝜎の値を求める.𝜎12と𝜎2

2は二項分布に従う確率変数X1, 𝑋2の分散なので,

𝜎12 = 𝑝1(1 − 𝑝1)

𝜎22 = 𝑝2(1 − 𝑝2)

(5.9)

と与えられて,求めることができる.問題は𝜎12である.そこで𝜎12を以下のように解いてみる.

対象馬券である,馬券 1 と馬券 2 についてそれぞれの組み合わせを考えてみる.

当たりパターン

図 5.1 𝜎12の計算方法

馬券 1 と馬券 2 について,それぞれのあたりパターンが生起する確率を求めることによっ

て𝜎12の値が求められる.ここで,𝜎12について当たりパターンの説明をする.

馬券 1 と馬券 2 が共に当たるとき,起こる確率を𝑞1とする.このとき,𝜎122 への寄与は,

𝑋1 = 1,𝑋2 = 1なので,

𝑞1 ∗ (1 − 𝑝1)(1 − 𝑝2) (5.10)

である.次に,馬券 1 が当たり,馬券 2 が外れるとき,起こる確率を𝑞2とする.このときの

馬券1 馬券2 起こる確率   ○    ○   ○    × →  ×    ○  ×    ×

𝑞1𝑞2𝑞 𝑞

𝜎12 = 𝑞1 1 − 𝑝1 1 − 𝑝2 + 𝑞2 1 − 𝑝1 −𝑝2 + 𝑞 −𝑝1 1 − 𝑝2 + 𝑞 −𝑝1 (−𝑝2)

Page 24: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

21

𝜎122 への寄与は,𝑋1 = 1,𝑋2 = 0となるので,

𝑞2 ∗ (1 − 𝑝1)(−𝑝2) (5.11)

である.次に,馬券 1 が外れ,馬券 2 が当たるとき,起こる確率を𝑞 とする.このときの

𝜎122 への寄与は,𝑋1 = 0,𝑋2 = 1となるので,

𝑞 ∗ (−𝑝1)(1 − 𝑝2) (5.12)

である.最後に,馬券 1 と馬券 2 が共に外れるとき, 起こる確率を𝑞 とする.このときの𝜎122

への寄与は,𝑋1 = 0,𝑋2 = 0となるので,

𝑞 ∗ (−𝑝1)(−𝑝2) (5.13)

となる.これによって𝜎12の値を求めることができる.

いま,対象馬券を 2 つとしてきたが,これは対象馬券が3つの場合でも同じである.対象

である3つの馬券に対して,馬券 1 と馬券 2 についての𝜎12,馬券 1 と馬券 3 についての𝜎1 ,

馬券 2 と馬券 3 についての𝜎2 の値を求めればよい.

𝐸[(𝑦1𝑋1 + 𝑦2𝑋2 + 𝑦 𝑋 − (𝑦1𝑝1 + 𝑦2𝑝2 + 𝑦 𝑝 ))

2] =

𝑦12𝜎1

2 + 𝑦22𝜎2

2 + 𝑦 𝜎 2 + 2𝑦1𝑦2𝜎12 + 2𝑦1𝑦 𝜎1 + 2𝑦2𝑦 𝜎2

(5.14)

5.3 馬券的中の共分散を計算する

実際に,5.2 で説明した方法である馬券の組み合わせについてリスクとリターンを求め

てみる.ここで投資対象である馬券について少し説明する.馬券には様々な種類があるが

そのなかで単勝とはその馬が 1 位になる馬券のことで,馬単とは馬i,馬jの順に 1 着 2 着

となる馬券,馬連とは馬i,馬jの 2 頭が順不同で 2 着以内に入ることである.本研究ではこ

の 3 種類の馬券に基づいて論ずる.

今回,2015 年 11 月 29 日に行われたジャパンカップ(G1)のオッズを用いる.また,対

象馬券は 1 番人気だったラブリーデイの単勝 2.7 倍,そのラブリーデイと 2 番人気のゴー

ルドシップの馬単 21.2 倍,ラブリーデイとゴールドシップの馬連 11.0 倍であった.ここ

でそれぞれの馬券的中確率が必要となる.馬券の当たる確率は,

Page 25: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

22

単勝

1

𝑟𝑖/ (

1

r1+

1

r2+⋯+

1

rn) = 𝜋i (5.15)

馬単 𝜋𝑖 ∗

𝜋𝑗

1−𝜋𝑖= 𝜋𝑖𝑗 (5.16)

馬連 𝜋𝑖𝑗 + 𝜋𝑗𝑖 = ��𝑖𝑗 (5.17)

で求めることができる.

ここで,それぞれの馬券の当たる確率の計算法について説明する.まず,単勝確率の求め

方は,過去のデータから経験的に,買われた馬券の支持率が単勝確率と比例することは分

かっている.一方,オッズは支持率の逆数に比例するものなので,これらの事実から単勝

確率は式(5.15)で得られることがわかる.また,馬単が当たる確率,すなわち,1 着目が馬

i であるとき,2 着目が馬 j となる馬単の確率𝜋𝑖𝑗は,馬 i を除いたレースで馬 j が 1 着とな

る確率πj/(1 − 𝜋𝑗)とあると考えられるので,式(5.16)となる.馬連の当たる確率��𝑖𝑗は,馬 i

が 1 着で馬 j が 2 着である確率𝜋𝑖𝑗と馬 j が 1 着で馬 i が 2 着である確率𝜋𝑗𝑖を足せばよい(式

(5.17)).これは[3]を参照した.

この式から 1 番人気であるラブリーデイの単勝確率は 0.29 となった.1 番人気のラブリー

デイと 2 番人気のゴールドシップに関する馬単は 0.0702,馬連は 0.129 となった.これら

の値を用いて,それぞれの当たりパターンが起こる確率を計算する.ここで,1 とは馬 1

に対する単勝馬券のことで(1,2)は馬 1 と馬 2 に対する馬単馬券,{1,2}は馬連馬券とする.

図 5.2 単勝と馬単の当たりパターン

まず,図 5.2 の 1 と(1,2)の組み合わせについて考えてみる.1 と(1,2)が共に当たる確率は

(1,2)が起これば必然的に単勝馬券も当たるので,起こる確率𝑞1は

𝑞1 = 𝜋1 ∗ (

𝜋21 − 𝜋1

) (5.18)

1 (1,2) 起こる確率○ ○○ ×× ○× ×

𝑞1𝑞2𝑞 𝑞

𝑞 = 0

= 1− (𝑞1 + 𝑞2 + 𝑞 )

Page 26: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

23

となる.次に,1 が当たり(1,2)が外れる確率は 1 着が馬 1 で 2 着が馬 2 以外なので,馬 1

が 1 着である確率に,馬 1 が 1 着の場合を除いた馬 2 が 1 着の場合の確率を全体から引い

たものを掛けた確率

𝑞2 = 𝜋1 ∗ (1 −

𝜋21 − 𝜋1

) (5.19)

となる.馬 1 の単勝が外れて(1,2)が当たることはないので𝑞 は 0 となる.最後に両方が外

れる場合は以上の場合を足して全体から引いた確率である.𝑞 はどの当たりパターンに関

しても同じである.

図 5.3 単勝と馬連の当たりパターン

次に図 5.3 の 1 と{1,2}の組み合わせについて考える.まず 1 と{1,2}が共に当たる確率は

1 と(1,2)の𝑞1のパターンと同様で,確率は式(5.18)となる.次に,1 が当たり,{1,2}が外れ

る確率も,1 と(1,2)の𝑞2のパターンと同様で,確率は式(5.19)となる.次に,1 が外れて{1,2}

が当たる確率は,馬 2 が 1 着で馬 1 が 2 着となる場合であるので,

𝑞 = 𝜋2 ∗ (

𝜋11 − 𝜋2

) (5.20)

となる.

図 5.4 馬単と馬連の当たりパターン

最後に,図 5.4 の(1,2)と{1,2}の組み合わせについて考える.(1,2)と{1,2}が共に当たる確

率は,馬 1 が 1 着で馬 2 が 2 着なら共に成り立つので,結局𝑞1の確率は式(5.18)となる.次

に,(1,2)が当たり,{1,2}が外れる場合は存在しないので𝑞2の確率は 0 となる.次に,(1,2)

1 {1,2} 起こる確率○    ○○    ××    ○×    ×

𝑞1𝑞2𝑞 𝑞

𝑞 = 𝜋2 ∗𝜋1

1 − 𝜋2

= 1− (𝑞1 + 𝑞2 + 𝑞 )

(1,2) {1,2} 起こる確率○    ○○    ××    ○×    ×

𝑞1𝑞2𝑞 𝑞

𝑞2 = 0

𝑞 = 𝜋2 ∗𝜋1

1 − 𝜋2 = 1− (𝑞1 + 𝑞2 + 𝑞 )

Page 27: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

24

が外れて,{1,2}が当たる場合は馬 2 が 1 着で馬 1 が 1 着であれば良いので確率𝑞 は式(5.20)

となる.

以上のパターンについて,それぞれ計算することによって共分散を計算することができ

る.ここで,それぞれのパターンについて計算し,3 種類の馬券に対するポートフォリオを

考える.リターンの期待値の分散は,

𝜎 2 = 0.207 𝑦1

2 + 0.0653 𝑦22 + 0.113 𝑦

2 + 0.111 𝑦12 +

0.0415 𝑦1 + 0.122 𝑦2 (5.21)

と表せる.また,制約式は,

𝑦1𝑟1+𝑦2𝑟2+𝑦 𝑟

= 1

𝑝1𝑦1 + 𝑝2𝑦2 + 𝑝 𝑦 = 𝑅

(5.22)

である.この式の意味はそれぞれの馬券に対する投資割合は 1 であるということと,馬券

に対するリターンの期待値 R の設定である.ここで期待値の値は𝑝1𝑟1,𝑝2𝑟2,𝑝 𝑟 の値のう

ち,最小値<R<最大値とする.ここでは 0.793<R<1.49 となった.式(5.22)の下で式(5.21)を

最小化する問題を解く.次の図に結果を与える.

図 5.5 馬券 1 と(1,2)と{1,2}における期待値と分散

0

1

2

3

4

5

6

7

8

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

リスク

リターン

1と(1,2)と{1,2}における期待値と分散

Page 28: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

25

図 5.5 を見ると,期待値(リターン)0.8 において分散(リスク)は 0.748 である.このときのポ

ートフォリオは,単勝馬券にほぼ 100%投資し,残りわずかを馬連に投資するという組み合

わせである.期待値 1.45 において分散は 7.44 である. このときのポートフォリオは,馬

単に 23%投資し,馬連に 77%投資する組み合わせという結果になった.この図から期待値

に対する最小の分散を求めることができ,また,その時の𝑦の値から投資割合も知ることが

できる.求める期待値によって投資割合は変わってくるので,そのときの自身の持ち金によ

って投資割合を変えるといったときは,この図を参考にすることによって馬券の投資金額

に対する戦略を練ることもできる.

実際に,馬連{1,2}の 1 つと馬単(1,2)と(2,1)の2つの馬券の組み合わせ,どちらを買うのが

良いのだろうか検証してみる.ここで,馬券の 1,2 に関して上同様にラブリーデイとゴール

ドシップの組み合わせとする.まず,{1,2}のオッズは 11.0 倍であるのでそのオッズを用い

て期待値と分散を求めると,R = 1.43,𝜎 2 = 13.7となった.次に,オッズ 21.2 倍の(1,2)とオ

ッズ 19,7 倍の(2,1)の組み合わせを買ったとすると次の図 5.6 のような結果となる.図を見

てみると,(1,2)と(2,1)の組み合わせのとき,R = 1.43での分散は 9.71 となり,期待値 1.43

の下でリスクを考えると,{1,2}を買うより(1,2)と(2,1)の組み合わせを買う方がリスクを抑

えることができると分かった.それどころか,{1,2}の方は期待値を 1.43 まで求める場合,

必然と分散も 13.7 となる訳だが,一方,(1,2)と(2,1)の組み合わせは常に{1,2}のリスクより

低い値を取るので合理的な買い方といえる.また,期待値を 1.43 以上求める場合は(1,2)と

(2,1)の組み合わせでしか存在しないので,結果的に{1,2}を買うよりも(1,2)と(2,1)の組み合

わせを買う方がリスクを抑えられて,かつ期待値も見込んだ買い方ができるということに

なる.

図 5.6 馬単(1,2)と(2,1)における期待値と分散

0

2

4

6

8

10

12

14

16

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

リスク

リターン

(1,2)と(2,1)における期待値と分散

Page 29: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

26

このように,期待値と分散について 5.2 で述べた求め方で,馬券に対するオッズさえわか

れば求める馬券の組み合わせについて,期待値と分散を求めることができる.馬券の組み合

わせについての期待値と分散を求めて,比較することによって,リターンの複数の期待値と

組み合わせてリスクの低減を考えた,最適な馬券の買い方を可能にした.

Page 30: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

27

第 6章 おわりに

6.1 まとめ

本研究では,BT モデルを用いて競走馬の強さを推定し,ランキングを作成した.同様に,

年度別やレース毎の強さも推定した.競走馬の強さの値を参考することによって,その年の

競走馬の強さを知ることや,レースに勝つための指標を知ることで勝ち馬の予想などに役

立つかもしれない.

続いて,馬券にあてられたオッズを基に,馬券を投資対象とすることによって,二次計画

問題として扱い,期待値と分散について最適解を求めた.求める期待値(リターン)によって

分散(リスク)が分かることから,実際に馬券を買うときに,手持ちの金額によって理想の掛

け方が見つかるかもしれない.

本研究では,競走馬の強さの推定値や,馬券に対する期待値と分散を参考することによっ

て直観による予想ではなく,統計的分析を行った馬券の購入を可能にした.身の回りの身近

な現象を統計的に分析することによって統計学のおもしろさを提供できたのではないだろ

うか.

6.2 今後の課題

今後の課題を以下に示す.

・本研究では,馬券ポートフォリオ問題として対象馬券を単勝,馬単,馬連の 3 つとした

が,馬券の種類や対象とする馬券の数を増やすことによって,より広い馬券の組み合わせ

を可能にし,リスクの低減を行う.

Page 31: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

28

謝辞

本研究を進めるにあたり,多くのご指導,ご助言を頂いた中央大学理工学部情報工学科の

田口東教授に心から感謝いたします.また,多くのご協力とご助言を頂いた山形浩一氏をは

じめとする田口研究室の皆様に心から感謝いたします.

Page 32: 競走馬の強さの分析と 馬券ポートフォリオ問題 - 中央大学...imk ,kmj ならば, が に「勝った」ものとする.また, ,jok または ,jmk

29

参考文献

[1] 竹内啓,藤野和健,スポーツの数理科学,共立出版社,東京,1988.

[2] 日本中央競馬会, <http://www.jra.go.jp/>.

[3] TARGET frontier JV,競馬予想の JRA-VAN, <http://jra-van.jp/>.

[4] シンドローム,<http://www.syndrome.jp/basic/pdds_mechanism.html>.

[5] 伊藤耕介, “テクニカル分析の立場をベースとした複勝馬券の的中確率に関する統計モ

デル,” 大阪商業大学アミューズメント産業研究所紀要第 12 号, 2010.