20130609 アイドルマスター解析

27
変態にRを与えた結果がこれだよ5 THE IDOLM@STER CINDERELLA GIRLSを弄り倒す YF@Med_KU

Upload: medku

Post on 11-Jul-2015

560 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 20130609 アイドルマスター解析

変態にRを与えた結果がこれだよ…5 THE IDOLM@STER CINDERELLA GIRLSを弄り倒す

YF@Med_KU

Page 2: 20130609 アイドルマスター解析

THE IDOLM@STER CINDERELLA GIRLS

データセットからの体重推定LASSO (Least Absolute Shrinkage and Selection Operator)

外れ値アイドルの推定LOF (Local Outlier Factor)FRaC (Feature Regression and Classification)

本日の紹介

Page 3: 20130609 アイドルマスター解析

某大学異学部

あるソーシャルゲームにはまっていた…

Page 4: 20130609 アイドルマスター解析

ポチポチ…

さて課金してレアカードでも当てるかな…

Page 5: 20130609 アイドルマスター解析

ポチポチ…

さて課金してレアカードでも当てるかな…

Page 6: 20130609 アイドルマスター解析

キタァァァァァァァアアアアアアアアブヒィィィィィィイイイイイイしぶりんキタァァァァ

Page 7: 20130609 アイドルマスター解析

けどこれ人が多すぎてコンプ無理だお…

Page 8: 20130609 アイドルマスター解析

@AntiBayesian

Page 9: 20130609 アイドルマスター解析

さすがしぶりんかわいいおっおっおwww

15y 165cm 44kg 80/56/81

Page 10: 20130609 アイドルマスター解析

働いたら負けな杏こいつだけ3サイズ非公開…??

17y 139cm 30kg ??/??/??

Page 11: 20130609 アイドルマスター解析

これだけアイドルがいてみんな3サイズを公表しているのに杏だけ非公開だぞ…これは何かある…

Page 12: 20130609 アイドルマスター解析

杏の3サイズがどうしても知りたいんだお…

他のメンバーの3サイズはわかるのに…どうすればいいんだお…?

そうだ!!機械学習を使って推定するお!!

Page 13: 20130609 アイドルマスター解析

プロフィールはそれぞれ関係が強そうだお…

Page 14: 20130609 アイドルマスター解析

まあ普通にLASSOっていう機械学習を使ってみればいいんじゃないか。常識的に考えて。

(1)の部分が普通の線形回帰にペナルティ項が入っているみたいだな。常識的に考えて。

なぜLASSOかって?そんなんこれをやったやつがLASSOしかできないからに決まっているじゃないか。常識的に考えて。他のやり方を知りたければ「きかいがくしゅう!」@Tsukuba.rでggrks.

Page 15: 20130609 アイドルマスター解析

結果

17y 139cm 30kg 68/52/72

交差検証による推定誤差Weight 2.07kgB/W/H 3.52/1.85/2.89 cm

16y 158cm 42kg 80/56/81

45kg 47kg 42kg 48kg 43kg

43kg 43kg 41kg44kg

Page 16: 20130609 アイドルマスター解析

ミクさんおっぱいデカすぎwww

16y 158cm 42kg 80/56/81

Page 17: 20130609 アイドルマスター解析

Page 18: 20130609 アイドルマスター解析

このBBAとかloliの集団ってアイドルとして必要なの…??

Page 19: 20130609 アイドルマスター解析

普通アイドルって10代半ば~後半の娘じゃないの…?

>30 や <12のアイドルってどう考えてもニッチな業界だろ…?

そうだ!!統計手法を使ってこいつらの外れ値っぷりを推定するお!!

Page 20: 20130609 アイドルマスター解析

他のアイドルたちと明らかにかけ離れた分布のアイドルを探すお…

Page 21: 20130609 アイドルマスター解析

まあ普通にLOFっていう機械学習を使ってみればいいんじゃないか。常識的に考えて。

N次元空間内での各点の近傍MinPts個からどれだけ近い(離れている)かでわかる。なぜLOFかって?そんなんこれをやったやつがLOFしかできないということもないけど、精度が一番よさそうだからだ。常識的に考えて。他のやり方を知りたければ外れ値検出(知識)でggrks.

Page 22: 20130609 アイドルマスター解析

LOFとか有名すぎんだろ!!もっと有益なことつぶやけよ!!

じゃあFRaCという別の手法を使ってみよう。常識的に考えて。だがしかしこれはRで実装されていなかっ

た。こういう場合は別の言語でググってみるぞ。常識的に考えて。

Page 23: 20130609 アイドルマスター解析

FRaC (Feature Regression and Classification)は、複数の機械学習・外れ

値検出法の特徴量を組み合わせて、外れ具合を算出する方法っぽい。デフォルトではSVM、決定木、決定株(?)の中から組み合わせて使うようになっていたので、とりあえずやってみた。

全ての手法を組み合わせて使った場合が、普通の集団と外れ値データとの分離具合が最も良い感じに見えないこともない。常識的に考えて。

Page 24: 20130609 アイドルマスター解析

結果

Normal15/165/44/80/56/81

Too large17/182/60/91/64/86

Too small10/137/30/63/47/65

Too small9/127/31/60/55/65

Too small9/128/29/61/57/67

Too large16/170/56/105/64/92

age/height/weight/B/W/H

Page 25: 20130609 アイドルマスター解析

やっぱりオレのしぶりんはかわいいwww

Page 26: 20130609 アイドルマスター解析

まとめ

アイマス集団をいろいろ弄った。

非実在青(性)少女たちはあまりにもボンキュッボンすぎ

て身長・オパーイの過大評価と体重・ウエストの過小評価になりがち。

外れ値アイドルは年齢よりむしろプロポーションの影響が大きい(3サイズに相関がありすぎ)。

初音ミクの3サイズは叩かれた。

Page 27: 20130609 アイドルマスター解析

〜完〜