sabr metrics

Post on 22-Jul-2015

182 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

プロ野球を観るのが100倍面白くなる雑学~セイバーメトリクス入門~

西本佳弘

WESTERNPARK@HOTMAIL.CO.JP

2014/05/17(SAT)

本日の目的

セイバーメトリクスとはどういうものか皆さんに

知ってもらう。

セイバーメトリクスについて体系的に纏め、理解する。

※個人的な想い

上記関連データを「R言語」で分析する。

今回は断念!!

アジェンダ

セイバーメトリクスとは?

セイバーメトリクスの歴史

セイバーメトリクスの各種指標

セイバーメトリクスの応用事例

今後の展開

諸注意!

今回セイバーメトリクスについてやや説明を

端折っています。

もし興味を持ったら、ご自分でも調べて下さい。

セイバーメトリクスとは?

セイバーメトリクス概要①

セイバーメトリクス(SABRMetrics)とは野球においてデータを統計的

見地から客観的に分析し、選手の評価や戦略を考える分析手法のこと。

※”SABRMetrics”はアメリカ野球学会(Society forAmecica Baseball Research)と

測定基準(Metrics)を合わせた造語です。

??「私は関係ありませんよ」

セイバーメトリクス概要②

野球には「打率」「防御率」など様々な指標が存在しますが、セイバー

メトリクスではこれらの重要性を数値から客観的に分析しています。

セイバーメトリクスは本来、常識として考えられてきたバントや盗塁を

否定するなど野球の従来の伝統的価値観を覆すものとなっています。

野球と数理学①

野球には数字がたくさん出てきます。

プロ野球のサイトを見ても「打率」「防御率」「出塁率」など「率」が

つく数字がたくさん出てきます。

これは野球が「”静”のスポーツ」と言われていることと関係しています。

野球は『投手がボールを投げ、プレーが開始し、何らかの結果が出る』

スポーツであるため、一つのアクションを確率と結び付けやすいのです。

野球と数理学①

野球には数字がたくさん出てきます。

プロ野球のサイトを見ても「打率」「防御率」「出塁率」など「率」が

つく数字がたくさん出てきます。

これは野球が「”静”のスポーツ」と言われていることと関係しています。

野球は『投手がボールを投げ、プレーが開始し、何らかの結果が出る』

スポーツであるため、一つのアクションを確率と結び付けやすいのです。

野球と数理学②

しかし、得られた結果がそのまま選手の能力と直結するかといえば、

そう断言することはできません。

ex) ①芯でとらえた打球が相手のファインプレーに阻まれる。

②打ち取られた当たりが野手のいないところに飛び、ヒットになる。

そのため野球は「偶然」や「運」の影響を受けやすいスポーツであると

言えます。

①②

野球と数理学②

しかし、得られた結果がそのまま選手の能力と直結するかといえば、

そう断言することはできません。

ex) ①芯でとらえた打球が相手のファインプレーに阻まれる。

②打ち取られた当たりが野手のいないところに飛び、ヒットになる。

そのため野球は「偶然」や「運」の影響を受けやすいスポーツであると

言えます。

①②

野球と数理学③

ここで偶然と実力の区別をつけるため「統計学」を使用します。

「Aの作業をn回やってBという結果がm回出た」という現象について

「n回」の数(つまり分母数)を増やすことで偶然の要素を減らすとい

うのが統計学の考え方です。

セイバーメトリクスの理論は確率と統計を使った分析より成り立ってい

ます。

セイバーメトリクスの歴史

セイバーメトリクスの誕生

セイバーメトリクスは缶詰工場の警備員であった退役軍人である”ビ

ル・ジェームス”が夜間の暇つぶしに始めたことで誕生しました。

1977年にビル・ジェームスより「野球抄(Baseball Abstract)」が自

費出版されたことが、セイバーメトリクスが世に出た最初と言われてい

ます。

異端だったセイバーメトリクス

セイバーメトリクスは1980年代以降、PCの普及とともに少しずつ信奉

者が増えていきます。

しかし、MLBのデータ管理会社やMLBから異端の扱いを受け、データを

使用したビジネス展開がなかなか発展しませんでした。

そこでMLBのコアなファンに向けてデータを売ることで、セイバーメト

リクスはヒットしていきました。

マネーボール①

2000年代に入り、一冊の本が話題になり、セイバーメトリクスは海を越

え、日本でも普及するようになります。

その本こそ皆さんご存知(?)の「マネーボール」です。

「マネーボール」は2003年に出版され、2011年にはブラッド・ピッド主

演で映画化されました。

マネーボール①

「マネーボール」は、かつてドラフト一位でMLB選手としてデビューし

たものの、活躍できないまま引退を余儀なくされたビリー・ビーンが、

資金難の球団であるオークランド・アスレチックスのGMに就任し、セ

イバーメトリクスを球団経営に取り入れて、球団を強くしていくという

話です。

マネーボール②

ビリー・ビーンはこれまで球界で重視されてこなかった「出塁率」など

の指標を重視し、安価で勝利への貢献度の高い選手を発掘し、チームを

強くしました。俗に言う「選手ではなく勝利を買う」という考えです。

セイバーメトリクスの各種指標

セイバーメトリクスの各種指標

これよりセイバーメトリクスの各種指標について、

以下のアプローチから説明していきます。

・打者指標

・投手指標

・守備指標

主な打者指標

指標 説明

OPS OPS = 出塁率+長打率

出塁率や長打率そのものより得点相関が高い。0.8を超えると一流。

BABIP BABIP =(安打数 –本塁打数)/(打数 + 犠飛 –本塁打 –三振)

本塁打以外でフィールドに飛んだ打球の安打になる割合。

BB/K BB/K=四球/三振

四球と三振の割合から打者の選球眼を見る指標。

RC 計算がややこしいので割愛。http://ja.wikipedia.org/wiki/RC_(%E9%87%8E%E7%90%83)

得点を生み出す能力を評価する総合指標。得点でのチームへの貢献度を示す。

RCWIN 計算がややこしいので割愛。http://ja.wikipedia.org/wiki/RC_(%E9%87%8E%E7%90%83)

リーグの平均打者と比較してどれだけの勝利をもたらしたかを表す指標。

攻撃における出塁の重要性①

よく「打率3割」が打者としての合格点とされてますが、打率は四死球

を全て投手側の失敗とみなし、打者の能力とみなしていません。

しかし、四死球で出たランナーも当然、得点には関与します。

攻撃における出塁の重要性②

MLBによる分析結果によれば、出塁率の得点相関は

打率よりも高いことが明らかとなっています。

そのため「得点」に関係の深い「出塁」という

観点に立てば、より重要なのは、「出塁率」

ということになります。

Correlation with Runs ScoredTeam-Level Data ('00-'09)

Index Correlation

Strikeouts -.068

Stolen Bases +.057

Walks +.548

Home Runs +.685

Batting Avg +.779

Hits +.783

On-base pct +.859

Slug pct +.892

OPS +.947

主な投手指標

指標 説明

QS 先発投手が6イニング以上を投げ、自責点を3以内に抑えたときに記録される。

結果的にどれだけ試合を作れたかを表す指標。

WHIP WHIP =(安打+四球)/ 回数

1イニングあたり何人の走者を出したかを表す指標。1.2未満ならエース級。

FIP FIP =(被本塁打 × 13 +(与四球 + 与死球 - 敬遠四球)× 3 - 奪三振 × 2)/ 投球回数 + 3.12

野手による影響を受けない結果(被本塁打、三振、四死球など)のみで投手の能力を評価した指標。投手の能力が反映されやすい。

RSAA RSAA =(リーグ失点率 - 失点率)/ 9 ×投球回

リーグ平均の失点率と個人の失点率を比較し、リーグ平均に比べどれくらいの失点を防いでいるかを見る指標。プラスであればあるほど優秀。

LOB% LOB% =(安打 + 四死球 - 得点)/(安打 + 四死球 - 1.4 × 本塁打)

出塁した走者に得点を許さなかった割合。

先頭打者への四球はダメなの?①

打者編で述べた通り、四死球は得点に繋がるため、投手側からみれば失

点に繋がります。

ところで、よく「先頭打者への四死球は失点になる確率が高い」という

解説がいますが、これは本当でしょうか?

先頭打者への四球はダメなの?①

打者編で述べた通り、四死球は得点に繋がるため、投手側からみれば失

点に繋がります。

ところで、よく「先頭打者への四死球は失点になる確率が高い」という

解説がいますが、これは本当でしょうか?

実は、先頭打者を四球で出そうがヒットで出そうが、失点する確率には、

有意な差はありません。

先頭打者への四球はダメなの?②

実はこの格言は「レアケース記憶」によるものになります。

「レアケース記憶」というのは、人は特に印象に残ったことを強く感じ

てしまうということです。

※昔、テツ&トモが「カラオケボックスで間違って入れた曲が大体演歌なのなんでだろう。」というネタに対して、

『トータル楽曲では、やはりポップス系が主流なため、演歌が出る確率は極めて低い。レアケース記憶だろう。』とネタを

しっかり分析されちゃってました(笑)

先頭打者への四球はダメなの?③

先頭打者を出すということによる失点確率は安打であろうと、四死球で

あろうと統計的に差は出ません。40%前後になります。

ただしプロの投手は簡単には四死球を出さない(コントロールがいい)

ので、安打を打たれる場合に比べてレアケースとなるのです。

よって安打、四死球に関わらず、「出塁をさせない」ことが重要となっ

てきます。

主な守備指標

指標 説明

RF RF =(刺殺+補殺)/ 守備イニング数 × 9

9イニングでいくつアウトを奪えるかという指標。守備時における選手の貢献度を数値的に理解できる。

UZR ZR = (受け持ちのゾーンの打球処理数 + ゾーン外での処理数)/ 受け持ちのゾーンの打球総数

ボールが球場のどこに飛んだかを記録し、そのデータから守備範囲を含めた能力を評価する。※MLBのデータ統計会社によって算出される。

Plus/Minus

System

打球の性質をビデオ映像などで記録し、各ポジションの野手の平均的な守備範囲を算出し、平均値に対して個々の野手の打球処理率が高いか低いかを数値化した指標。※MLBのデータ統計会社によって算出される。

(参考)守備範囲の算出

あるショートストップの選手(T選手)の守備範囲を算出するとします。

zone“A”

zone“B”

(参考)守備範囲の算出

受け持ちのゾーン(その選手の担当範囲と定められているゾーン)を

zone”A”とします。

zone”A”外で打球処理したことの

あるゾーンをzone”B”とします。

zone“A”

zone“B”

(参考)守備範囲の算出

受け持ちのゾーン(その選手の担当範囲と定められているゾーン)を

zone”A”とします。

zone”A”外で打球処理したことの

あるゾーンをzone”B”とします。

zone“A”

zone“B”

(参考)守備範囲の算出

「zone”A”の打球処理数」と「zone”B”の打球処理数」を

受け持ちのゾーンの打球総数で

割ることで守備範囲を算出できます。

zone“A”

zone“B”

更に、エラー数や、 zone”B”に打球の定位置からの距離を元に複雑な処理を行い、その選手の総合的な守備力を算出することもできます。

セイバーメトリクスの応用事例

ケース①:オークランド・アスレチックス(2000)

前述のとおり、資金力のないアスレチックスは「セイバーメトリクス」

を元に、以下の観点から根本的なチーム改革を施しました。

・ドラフト

・トレード

・作戦

ケース①:オークランド・アスレチックス(2000)

【ドラフト】

⇒これまでドラフトの慣習となっていた「背の高さ」「球の速さ」など

の要素を全て無視し、セイバーメトリクスの指標が高く、その上で他

球団が取らない様な選手を会得。

(例)ジェレミー・ブラウンに代表される、成績はいいが、極端に

メタボ体型の選手をドラフト一巡目で指名。

ケース①:オークランド・アスレチックス(2000)

【トレード】

⇒セイバーメトリクスでは評価されない「打率は高いが、出塁率の低い

選手」を元手に、「打率は低いが、出塁率の高い選手」を金銭と合わせ

て会得するなど。トレードでできる限り利益を出す方法を模索。

(例)怪我明けの捕手、スコット・ハッテバーグを格安で会得。

一塁手にコンバート。

ケース①:オークランド・アスレチックス(2000)

【作戦】

⇒セイバーメトリクスの考えを元に、野手は四死球を多く取れるよう、

ボールをよく見るようにし、盗塁は厳禁とした。

投手は逆に四死球を減らすよう、できるだけストライクをとるような

配球を心がけた。

ケース①:オークランド・アスレチックス(2000)

結果、2000年から2003年までの4年間全てでプレーオフに出場する、

MLBを代表する強豪チームとなりました。

しかしセイバーメトリクスが他球団に知れ渡るようになり、以降の都市

は資金力の高い球団にノウハウが渡った影響からチーム成績が再び悪化

するようになりました。

ケース②:東京都立程久保高校野球部(2010)

弱小高校で知られる都立程久保高校野球部ですが、マネージャーの川島

さんによるチームマネジメントにより、 「ノーバント・ノーボール戦

術」の導入など、革新的なチーム作りにより甲子園進出を果たしました。

本校の快進撃については、以下の書籍、映画をご確認ください。

今後の展開

日本人選手の価値の見積もり

2014年現在、多くの日本人選手がMLBで活躍しているが、日本時代の実

績とMLBで残す成績に未だ相関性が見いだせていない。

そこで今後もMLBに挑戦する日本人の活躍前後の成績をプロットし、セ

イバーメトリクスの指標を中心に相関性を見出すことで、選手への投資

額を正しく見積もることができると考える。

日本人選手の価値の見積もり

ただし定性的観点からは、活躍する選手像が明確になっています。

以下、田中将大投手を例にとります。

FalkBall

communication

command

StrikeOut

Adaptability

married

【番外編】選挙戦予測

MLBではセイバーメトリクスを用いた成績予測システムが開発されてい

るが、そのロジックを選挙選にあてはめることも可能だといいます。

野球のゲームは極めて複雑に出来上がっているため、セイバーメトリク

スを用いたシステムの精度が上がれば、今後は他分野にも応用できる見

通しが立つでしょう。

References

メジャーリーグの数理科学(シュプリンガーフェアラーク東京)

マネー・ボール(ハヤカワ・ノンフィクション文庫)

セイバーメトリクス入門(http://www.sabrmetrics.info/)

Rによるやさしい統計学(オーム社)

top related