sports ranking

39
ネットワークの中心性に基づ く個人スポーツの動的なラン キング 増田 直紀 東京大学大学院 情報理工学系研究科 With 茂木 (M2)

Upload: naoki-masuda

Post on 11-Jul-2015

625 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Sports ranking

ネットワークの中心性に基づく個人スポーツの動的なラン

キング増田 直紀

東京大学大学院 情報理工学系研究科

With 茂木 隼 (M2)

FIFA Ranking

VS

Japan (ranked 19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

FIFA Ranking

VS

Japan (19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

WIN LOSE

Introduction FIFA Ranking

VS

Japan (19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

WIN LOSE

1勝の重みが全く違う

スポーツランキング

bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい

(eg 自国の大陸との対戦が多くなる)

rarr 単純に勝敗数でランキングを決めるのは不適切

bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip

(eg 「強い」大陸の国ほど得られるスコアが大きい)

複雑でわかりにくい場合が多い

新たな不公平性を生むことも

bull rarr ネットワークを用いたランキング手法

ネットワークを用いたランキング手法

bull 頂点 = 選手 (or team)

bull 1試合の勝者と敗者を有向辺で結ぶ

bull 各頂点の中心性 = 選手のランキング

bull 計算方法

1 prestige score [Radicchi 2011]

2 win-lose score [Park amp Newman 2005]

rarr static ranking systems

Static and dynamic ranking

bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず

本研究の目的時間構造を導入し 実力の変動を考慮し

たランキング手法を提案する

Static ranking

Dynamic ranking

Prestige score

bull player i が player j に勝った回数

bull j が負けた総数

bull 多くの相手に勝つほどスコアが上がる

bull 勝った相手のスコアが大きいほどスコアが上がる

bull 勝った相手の負け数 が小さいほどスコアが上がる

bull 負けの影響は直接は考慮されていない

bull PageRank と同じ

jiwin lose

0 lt q lt 1

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 2: Sports ranking

FIFA Ranking

VS

Japan (ranked 19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

FIFA Ranking

VS

Japan (19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

WIN LOSE

Introduction FIFA Ranking

VS

Japan (19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

WIN LOSE

1勝の重みが全く違う

スポーツランキング

bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい

(eg 自国の大陸との対戦が多くなる)

rarr 単純に勝敗数でランキングを決めるのは不適切

bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip

(eg 「強い」大陸の国ほど得られるスコアが大きい)

複雑でわかりにくい場合が多い

新たな不公平性を生むことも

bull rarr ネットワークを用いたランキング手法

ネットワークを用いたランキング手法

bull 頂点 = 選手 (or team)

bull 1試合の勝者と敗者を有向辺で結ぶ

bull 各頂点の中心性 = 選手のランキング

bull 計算方法

1 prestige score [Radicchi 2011]

2 win-lose score [Park amp Newman 2005]

rarr static ranking systems

Static and dynamic ranking

bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず

本研究の目的時間構造を導入し 実力の変動を考慮し

たランキング手法を提案する

Static ranking

Dynamic ranking

Prestige score

bull player i が player j に勝った回数

bull j が負けた総数

bull 多くの相手に勝つほどスコアが上がる

bull 勝った相手のスコアが大きいほどスコアが上がる

bull 勝った相手の負け数 が小さいほどスコアが上がる

bull 負けの影響は直接は考慮されていない

bull PageRank と同じ

jiwin lose

0 lt q lt 1

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 3: Sports ranking

FIFA Ranking

VS

Japan (19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

WIN LOSE

Introduction FIFA Ranking

VS

Japan (19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

WIN LOSE

1勝の重みが全く違う

スポーツランキング

bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい

(eg 自国の大陸との対戦が多くなる)

rarr 単純に勝敗数でランキングを決めるのは不適切

bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip

(eg 「強い」大陸の国ほど得られるスコアが大きい)

複雑でわかりにくい場合が多い

新たな不公平性を生むことも

bull rarr ネットワークを用いたランキング手法

ネットワークを用いたランキング手法

bull 頂点 = 選手 (or team)

bull 1試合の勝者と敗者を有向辺で結ぶ

bull 各頂点の中心性 = 選手のランキング

bull 計算方法

1 prestige score [Radicchi 2011]

2 win-lose score [Park amp Newman 2005]

rarr static ranking systems

Static and dynamic ranking

bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず

本研究の目的時間構造を導入し 実力の変動を考慮し

たランキング手法を提案する

Static ranking

Dynamic ranking

Prestige score

bull player i が player j に勝った回数

bull j が負けた総数

bull 多くの相手に勝つほどスコアが上がる

bull 勝った相手のスコアが大きいほどスコアが上がる

bull 勝った相手の負け数 が小さいほどスコアが上がる

bull 負けの影響は直接は考慮されていない

bull PageRank と同じ

jiwin lose

0 lt q lt 1

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 4: Sports ranking

Introduction FIFA Ranking

VS

Japan (19th)

Spain (1st)

Bhutan (198th)

Sweden (18th)

VS

WIN LOSE

1勝の重みが全く違う

スポーツランキング

bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい

(eg 自国の大陸との対戦が多くなる)

rarr 単純に勝敗数でランキングを決めるのは不適切

bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip

(eg 「強い」大陸の国ほど得られるスコアが大きい)

複雑でわかりにくい場合が多い

新たな不公平性を生むことも

bull rarr ネットワークを用いたランキング手法

ネットワークを用いたランキング手法

bull 頂点 = 選手 (or team)

bull 1試合の勝者と敗者を有向辺で結ぶ

bull 各頂点の中心性 = 選手のランキング

bull 計算方法

1 prestige score [Radicchi 2011]

2 win-lose score [Park amp Newman 2005]

rarr static ranking systems

Static and dynamic ranking

bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず

本研究の目的時間構造を導入し 実力の変動を考慮し

たランキング手法を提案する

Static ranking

Dynamic ranking

Prestige score

bull player i が player j に勝った回数

bull j が負けた総数

bull 多くの相手に勝つほどスコアが上がる

bull 勝った相手のスコアが大きいほどスコアが上がる

bull 勝った相手の負け数 が小さいほどスコアが上がる

bull 負けの影響は直接は考慮されていない

bull PageRank と同じ

jiwin lose

0 lt q lt 1

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 5: Sports ranking

スポーツランキング

bull サッカーに限らず総当たり戦でないスポーツでは対戦相手の強弱による不公平性が生じやすい

(eg 自国の大陸との対戦が多くなる)

rarr 単純に勝敗数でランキングを決めるのは不適切

bull 実際のランキングには不公平性を是正するためのルールが設けられているがhellip

(eg 「強い」大陸の国ほど得られるスコアが大きい)

複雑でわかりにくい場合が多い

新たな不公平性を生むことも

bull rarr ネットワークを用いたランキング手法

ネットワークを用いたランキング手法

bull 頂点 = 選手 (or team)

bull 1試合の勝者と敗者を有向辺で結ぶ

bull 各頂点の中心性 = 選手のランキング

bull 計算方法

1 prestige score [Radicchi 2011]

2 win-lose score [Park amp Newman 2005]

rarr static ranking systems

Static and dynamic ranking

bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず

本研究の目的時間構造を導入し 実力の変動を考慮し

たランキング手法を提案する

Static ranking

Dynamic ranking

Prestige score

bull player i が player j に勝った回数

bull j が負けた総数

bull 多くの相手に勝つほどスコアが上がる

bull 勝った相手のスコアが大きいほどスコアが上がる

bull 勝った相手の負け数 が小さいほどスコアが上がる

bull 負けの影響は直接は考慮されていない

bull PageRank と同じ

jiwin lose

0 lt q lt 1

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 6: Sports ranking

ネットワークを用いたランキング手法

bull 頂点 = 選手 (or team)

bull 1試合の勝者と敗者を有向辺で結ぶ

bull 各頂点の中心性 = 選手のランキング

bull 計算方法

1 prestige score [Radicchi 2011]

2 win-lose score [Park amp Newman 2005]

rarr static ranking systems

Static and dynamic ranking

bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず

本研究の目的時間構造を導入し 実力の変動を考慮し

たランキング手法を提案する

Static ranking

Dynamic ranking

Prestige score

bull player i が player j に勝った回数

bull j が負けた総数

bull 多くの相手に勝つほどスコアが上がる

bull 勝った相手のスコアが大きいほどスコアが上がる

bull 勝った相手の負け数 が小さいほどスコアが上がる

bull 負けの影響は直接は考慮されていない

bull PageRank と同じ

jiwin lose

0 lt q lt 1

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 7: Sports ranking

Static and dynamic ranking

bull 時間構造を無視つまり「選手の実力は不変」と想定ndash 実際には選手の実力は時間に依存するはず

本研究の目的時間構造を導入し 実力の変動を考慮し

たランキング手法を提案する

Static ranking

Dynamic ranking

Prestige score

bull player i が player j に勝った回数

bull j が負けた総数

bull 多くの相手に勝つほどスコアが上がる

bull 勝った相手のスコアが大きいほどスコアが上がる

bull 勝った相手の負け数 が小さいほどスコアが上がる

bull 負けの影響は直接は考慮されていない

bull PageRank と同じ

jiwin lose

0 lt q lt 1

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 8: Sports ranking

Prestige score

bull player i が player j に勝った回数

bull j が負けた総数

bull 多くの相手に勝つほどスコアが上がる

bull 勝った相手のスコアが大きいほどスコアが上がる

bull 勝った相手の負け数 が小さいほどスコアが上がる

bull 負けの影響は直接は考慮されていない

bull PageRank と同じ

jiwin lose

0 lt q lt 1

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 9: Sports ranking

bull 1 は 2 に勝利 (距離 1)

2 は 3 に勝利 (距離 1)

rarr 1 は 3 に間接的に勝利 (距離 2 )

bull 2 は 1 に敗北 (距離 1)

3 は 2 に敗北 (距離 1)

rarr 3 は 1 に間接的に敗北 (距離 2 )

2 3

間接勝利

win-lose score (1)

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 10: Sports ranking

距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α lt 1)k = 1 2 hellip で和をとる rarr i の win score wi

A = j が i に勝った回数を (i j) 成分にもつ勝敗行列

i の距離 1 の勝利数 =

i の距離 2 の勝利数 =

i の距離 3 の勝利数 =

win-lose score (2)

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 11: Sports ranking

bull 負けの影響も同様に考える

lose score

Player irsquos score

win-lose score (3)

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 12: Sports ranking

例 1

2 3

Note 0 ≦ α lt 1

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 13: Sports ranking

例 2

2 3

= A の最大固有値収束条件は

実際には全試合終了まで は不明なので 上の条件を満たすように を十分小さくする必要がある

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 14: Sports ranking

Static ranking の問題点

bull Static ranking では対戦が行われた時刻に関する情報がないため 過去の対戦をたった今行われたかのように扱う(実力を不変と想定)

bull しかしプレイヤーの実力が変化するスポーツは多い

bull デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる

year 2000

year 2010

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 15: Sports ranking

Dynamic win-lose score (1)

bull win-lose score を以下のように拡張した dynamic win-lose score を提案する

1 間接的な勝ち負けは過去に遡るものしか考 えない

2 player のスコアは時間について指数関数的に減衰する

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 16: Sports ranking

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 17: Sports ranking

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 18: Sports ranking

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 19: Sports ranking

2 32

(αβは正の定数)

Example

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 20: Sports ranking

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 21: Sports ranking

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 22: Sports ranking

2 32

(αβは正の定数)

Dynamic win-lose score (2)

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 23: Sports ranking

2 32

(αβは正の定数)

Dynamic win-lose score (2)

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 24: Sports ranking

332

(αは正の定数)

win-lose score

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 25: Sports ranking

勝敗行列n 番目の試合でプレイヤー i と j が対戦し j が勝ったとき

Dynamic win-lose score (3)

j が i に勝つことで得られる win score を (i j) 成分にもつ行列を とすると時刻 tnで得られる win score時刻 tn-1 まで遡って得られる win score

時刻 tn-2 まで遡って得られる win score

時刻 t1 まで遡って得られる win score

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 26: Sports ranking

lose score

Win score at time tn

( はすべての要素が1の列ベクトル)

Score の更新式

Update equations

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 27: Sports ranking

テニスのデータの解析

bull 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会)のシングルス 381570 試合 14554人の対戦結果を使用する

bull 試合の内容や大会の大きさは考慮しない

bull 1 試合毎に各プレイヤーのスコアを更新

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 28: Sports ranking

β の決め方

bull 公式ランキングでの 1 勝のスコアは 1 年間持続する

bull Dynamic win-lose score では 1 勝のスコアは指数関数的に減衰しながら永久に持続する

bull 1 勝の寄与の合計が両者で一致hArr β=1365

0

1

0 365 730

1勝

したと

きのスコア

経過時間 t [day]

y=1 (0≦t≦365)

y=exp(-βt) (t≧0)

28

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 29: Sports ranking

bull A game between players i and j at time tn

bull 直前の両プレイヤーのスコアの大小から試合結果を予測

スコアが大きいプレイヤーの勝利 rarr 予測成功

スコアが小さいプレイヤーの勝利 rarr 予測失敗

同点 rarr 予測対象から外す

bull Prediction accuracy = (予測成功試合数) (予測対象試合数)

bull win-lose score および prestige score では 時刻 tn以前の試合

結果も全て含めたネットワークを用いてスコアを算出する

ランキングの予測性能

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 30: Sports ranking

Dynamic win-lose score

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 31: Sports ranking

win-lose score

Note λmax = 000438

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 32: Sports ranking

Prestige score

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 33: Sports ranking

Prediction accuracy at the end of the data

bull Dynamic win-lose score with α = 01~02 outperforms the other two ranking systems

Ranking 手法 Prediction accuracy

Dynamic win-lose score (α = 01 β = 1365)

0650

Dynamic win-lose score (α = 015 β = 1365)

0655

Dynamic win-lose score (α = 02 β = 1365)

0653

win-lose score (α = 0) 0602

Prestige score (q = 005) 0630

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 34: Sports ranking

パラメータの感度分析

bull パラメータの決め方によってランキングが大きく変動してしまうことは望ましくない

bull Dynamic win-lose score におけるパラメータの感度を 順位相関を用いて調べる

bull 全試合終了時点でランキング上位300人の順位相関を計算する (Fagin et al (2003) の方法)

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 35: Sports ranking

Rank correlation with two α values given β = 1365

Rank correlation of the top 300 players end of the data (ie May 2010) A modified Kendall rank corr (Fagin et al 2003) corr≧ 09 when α ≧ 015 Not robust only for small α

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 36: Sports ranking

Rank correlation with two β values(one β value = 1365)

Insensitive for small β ≦ 3365 or so (note β = 1365 included)

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 37: Sports ranking

Sum of the scores

From the top α = 015 01 008 10 -5 We set β = 1365 Exponential increases

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 38: Sports ranking

相対スコアと公式ランクの比較

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228

Page 39: Sports ranking

結論

bull win-lose score に時間構造を導入ndash 設計指針公平性の意味でより適切かも

ndash Tennis の data で良好なパフォーマンス

ndash ランキング結果はパラメータの変動に対して安定

bull 計算コストとも小さいndash 様々な統計学習的手法は存在する

bull Ref Motegi amp Masuda arXIv12032228