sports ranking
TRANSCRIPT
ネットワークの中心性に基づく個人スポーツの動的なラン
キング増田 直紀
東京大学大学院 情報理工学系研究科
With 茂木 隼 (M2)
FIFA Ranking
VS
Japan (ranked 19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
FIFA Ranking
VS
Japan (19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
WIN LOSE
Introduction FIFA Ranking
VS
Japan (19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
WIN LOSE
1勝の重みが全く違う
スポーツランキング
bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい
(eg 自国の大陸との対戦が多くなる)
rarr 単純に勝敗数でランキングを決めるのは不適切
bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip
(eg 「強い」大陸の国ほど得られるスコアが大きい)
複雑でわかりにくい場合が多い
新たな不公平性を生むことも
bull rarr ネットワークを用いたランキング手法
ネットワークを用いたランキング手法
bull 頂点 = 選手 (or team)
bull 1試合の勝者と敗者を有向辺で結ぶ
bull 各頂点の中心性 = 選手のランキング
bull 計算方法
1 prestige score [Radicchi 2011]
2 win-lose score [Park amp Newman 2005]
rarr static ranking systems
Static and dynamic ranking
bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず
本研究の目的時間構造を導入し 実力の変動を考慮し
たランキング手法を提案する
Static ranking
Dynamic ranking
Prestige score
bull player i が player j に勝った回数
bull j が負けた総数
bull 多くの相手に勝つほどスコアが上がる
bull 勝った相手のスコアが大きいほどスコアが上がる
bull 勝った相手の負け数 が小さいほどスコアが上がる
bull 負けの影響は直接は考慮されていない
bull PageRank と同じ
jiwin lose
0 lt q lt 1
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
FIFA Ranking
VS
Japan (ranked 19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
FIFA Ranking
VS
Japan (19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
WIN LOSE
Introduction FIFA Ranking
VS
Japan (19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
WIN LOSE
1勝の重みが全く違う
スポーツランキング
bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい
(eg 自国の大陸との対戦が多くなる)
rarr 単純に勝敗数でランキングを決めるのは不適切
bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip
(eg 「強い」大陸の国ほど得られるスコアが大きい)
複雑でわかりにくい場合が多い
新たな不公平性を生むことも
bull rarr ネットワークを用いたランキング手法
ネットワークを用いたランキング手法
bull 頂点 = 選手 (or team)
bull 1試合の勝者と敗者を有向辺で結ぶ
bull 各頂点の中心性 = 選手のランキング
bull 計算方法
1 prestige score [Radicchi 2011]
2 win-lose score [Park amp Newman 2005]
rarr static ranking systems
Static and dynamic ranking
bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず
本研究の目的時間構造を導入し 実力の変動を考慮し
たランキング手法を提案する
Static ranking
Dynamic ranking
Prestige score
bull player i が player j に勝った回数
bull j が負けた総数
bull 多くの相手に勝つほどスコアが上がる
bull 勝った相手のスコアが大きいほどスコアが上がる
bull 勝った相手の負け数 が小さいほどスコアが上がる
bull 負けの影響は直接は考慮されていない
bull PageRank と同じ
jiwin lose
0 lt q lt 1
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
FIFA Ranking
VS
Japan (19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
WIN LOSE
Introduction FIFA Ranking
VS
Japan (19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
WIN LOSE
1勝の重みが全く違う
スポーツランキング
bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい
(eg 自国の大陸との対戦が多くなる)
rarr 単純に勝敗数でランキングを決めるのは不適切
bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip
(eg 「強い」大陸の国ほど得られるスコアが大きい)
複雑でわかりにくい場合が多い
新たな不公平性を生むことも
bull rarr ネットワークを用いたランキング手法
ネットワークを用いたランキング手法
bull 頂点 = 選手 (or team)
bull 1試合の勝者と敗者を有向辺で結ぶ
bull 各頂点の中心性 = 選手のランキング
bull 計算方法
1 prestige score [Radicchi 2011]
2 win-lose score [Park amp Newman 2005]
rarr static ranking systems
Static and dynamic ranking
bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず
本研究の目的時間構造を導入し 実力の変動を考慮し
たランキング手法を提案する
Static ranking
Dynamic ranking
Prestige score
bull player i が player j に勝った回数
bull j が負けた総数
bull 多くの相手に勝つほどスコアが上がる
bull 勝った相手のスコアが大きいほどスコアが上がる
bull 勝った相手の負け数 が小さいほどスコアが上がる
bull 負けの影響は直接は考慮されていない
bull PageRank と同じ
jiwin lose
0 lt q lt 1
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Introduction FIFA Ranking
VS
Japan (19th)
Spain (1st)
Bhutan (198th)
Sweden (18th)
VS
WIN LOSE
1勝の重みが全く違う
スポーツランキング
bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい
(eg 自国の大陸との対戦が多くなる)
rarr 単純に勝敗数でランキングを決めるのは不適切
bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip
(eg 「強い」大陸の国ほど得られるスコアが大きい)
複雑でわかりにくい場合が多い
新たな不公平性を生むことも
bull rarr ネットワークを用いたランキング手法
ネットワークを用いたランキング手法
bull 頂点 = 選手 (or team)
bull 1試合の勝者と敗者を有向辺で結ぶ
bull 各頂点の中心性 = 選手のランキング
bull 計算方法
1 prestige score [Radicchi 2011]
2 win-lose score [Park amp Newman 2005]
rarr static ranking systems
Static and dynamic ranking
bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず
本研究の目的時間構造を導入し 実力の変動を考慮し
たランキング手法を提案する
Static ranking
Dynamic ranking
Prestige score
bull player i が player j に勝った回数
bull j が負けた総数
bull 多くの相手に勝つほどスコアが上がる
bull 勝った相手のスコアが大きいほどスコアが上がる
bull 勝った相手の負け数 が小さいほどスコアが上がる
bull 負けの影響は直接は考慮されていない
bull PageRank と同じ
jiwin lose
0 lt q lt 1
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
スポーツランキング
bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい
(eg 自国の大陸との対戦が多くなる)
rarr 単純に勝敗数でランキングを決めるのは不適切
bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip
(eg 「強い」大陸の国ほど得られるスコアが大きい)
複雑でわかりにくい場合が多い
新たな不公平性を生むことも
bull rarr ネットワークを用いたランキング手法
ネットワークを用いたランキング手法
bull 頂点 = 選手 (or team)
bull 1試合の勝者と敗者を有向辺で結ぶ
bull 各頂点の中心性 = 選手のランキング
bull 計算方法
1 prestige score [Radicchi 2011]
2 win-lose score [Park amp Newman 2005]
rarr static ranking systems
Static and dynamic ranking
bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず
本研究の目的時間構造を導入し 実力の変動を考慮し
たランキング手法を提案する
Static ranking
Dynamic ranking
Prestige score
bull player i が player j に勝った回数
bull j が負けた総数
bull 多くの相手に勝つほどスコアが上がる
bull 勝った相手のスコアが大きいほどスコアが上がる
bull 勝った相手の負け数 が小さいほどスコアが上がる
bull 負けの影響は直接は考慮されていない
bull PageRank と同じ
jiwin lose
0 lt q lt 1
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
ネットワークを用いたランキング手法
bull 頂点 = 選手 (or team)
bull 1試合の勝者と敗者を有向辺で結ぶ
bull 各頂点の中心性 = 選手のランキング
bull 計算方法
1 prestige score [Radicchi 2011]
2 win-lose score [Park amp Newman 2005]
rarr static ranking systems
Static and dynamic ranking
bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず
本研究の目的時間構造を導入し 実力の変動を考慮し
たランキング手法を提案する
Static ranking
Dynamic ranking
Prestige score
bull player i が player j に勝った回数
bull j が負けた総数
bull 多くの相手に勝つほどスコアが上がる
bull 勝った相手のスコアが大きいほどスコアが上がる
bull 勝った相手の負け数 が小さいほどスコアが上がる
bull 負けの影響は直接は考慮されていない
bull PageRank と同じ
jiwin lose
0 lt q lt 1
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Static and dynamic ranking
bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず
本研究の目的時間構造を導入し 実力の変動を考慮し
たランキング手法を提案する
Static ranking
Dynamic ranking
Prestige score
bull player i が player j に勝った回数
bull j が負けた総数
bull 多くの相手に勝つほどスコアが上がる
bull 勝った相手のスコアが大きいほどスコアが上がる
bull 勝った相手の負け数 が小さいほどスコアが上がる
bull 負けの影響は直接は考慮されていない
bull PageRank と同じ
jiwin lose
0 lt q lt 1
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Prestige score
bull player i が player j に勝った回数
bull j が負けた総数
bull 多くの相手に勝つほどスコアが上がる
bull 勝った相手のスコアが大きいほどスコアが上がる
bull 勝った相手の負け数 が小さいほどスコアが上がる
bull 負けの影響は直接は考慮されていない
bull PageRank と同じ
jiwin lose
0 lt q lt 1
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
bull 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
rarr 1 は 3 に間接的に勝利 (距離 2 )
bull 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1)
rarr 3 は 1 に間接的に敗北 (距離 2 )
1
2 3
間接勝利
win-lose score (1)
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi
A = j が i に勝った回数を (i j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
win-lose score (2)
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
bull 負けの影響も同様に考える
lose score
Player irsquos score
win-lose score (3)
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
例 1
1
2 3
Note 0 ≦ α lt 1
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
例 2
1
2 3
= A の最大固有値収束条件は
実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Static ranking の問題点
bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)
bull しかしプレイヤーの実力が変化するスポーツは多い
bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる
1
2
year 2000
year 2010
3
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Dynamic win-lose score (1)
bull win-lose score を以下のように拡張した dynamic win-lose score を提案する
1 間接的な勝ち負けは過去に遡るものしか考 えない
2 player のスコアは時間について指数関数的に減衰する
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
2 32
(αβは正の定数)
1
3
Example
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
2 32
(αβは正の定数)
1
3
Dynamic win-lose score (2)
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
1
332
(αは正の定数)
1
2
win-lose score
1
2
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき
Dynamic win-lose score (3)
j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score
時刻 tn-2 まで遡って得られる win score
時刻 t1 まで遡って得られる win score
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
lose score
Win score at time tn
( はすべての要素が1の列ベクトル)
Score の更新式
Update equations
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
テニスのデータの解析
bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する
bull 試合の内容や大会の大きさは考慮しない
bull 1 試合毎に各プレイヤーのスコアを更新
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
β の決め方
bull 公式ランキングでの 1 勝のスコアは 1 年間持続する
bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する
bull 1 勝の寄与の合計が両者で一致hArr β=1365
0
1
0 365 730
1勝
したと
きのスコア
経過時間 t [day]
y=1 (0≦t≦365)
y=exp(-βt) (t≧0)
28
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
bull A game between players i and j at time tn
bull 直前の両プレイヤーのスコアの大小から試合結果を予測
スコアが大きいプレイヤーの勝利 rarr 予測成功
スコアが小さいプレイヤーの勝利 rarr 予測失敗
同点 rarr 予測対象から外す
bull Prediction accuracy = (予測成功試合数) (予測対象試合数)
bull win-lose score および prestige score では 時刻 tn以前の試合
結果も全て含めたネットワークを用いてスコアを算出する
ランキングの予測性能
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Dynamic win-lose score
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
win-lose score
Note λmax = 000438
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Prestige score
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Prediction accuracy at the end of the data
bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems
Ranking 手法 Prediction accuracy
Dynamic win-lose score (α = 01 β = 1365)
0650
Dynamic win-lose score (α = 015 β = 1365)
0655
Dynamic win-lose score (α = 02 β = 1365)
0653
win-lose score (α = 0) 0602
Prestige score (q = 005) 0630
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
パラメータの感度分析
bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない
bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる
bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Rank correlation with two α values given β = 1365
Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Rank correlation with two β values(one β value = 1365)
Insensitive for small β ≦ 3365 or so (note β = 1365 included)
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
Sum of the scores
From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
相対スコアと公式ランクの比較
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228
結論
bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも
ndash Tennis の data で良好なパフォーマンス
ndash ランキング結果はパラメータの変動に対して安定
bull 計算コストとも小さいndash 様々な統計学習的手法は存在する
bull Ref Motegi amp Masuda arXIv12032228