統計勉強会lt 機械学習とは
DESCRIPTION
機械学習を数式なしでTRANSCRIPT
統計勉強会LT 機械学習とは
鈴木雄登
自己紹介
id: @moc_yuto
facebook: yutosuzu
CyberZの新卒エンジニア
大学では自然言語処理
機械学習!!!
機械学習!!!
もてはやされてるけど
機械学習ってなに?
機械に学ばせて
規則やルールを
見つける!
規則って?確率って?
サイコロ
1の目の出る確率は??
(全て等確率に出ると仮定します)
サイコロ
1の目の出る確率は??
(全て等確率に出ると仮定します)
もちろん
1/6
これって等確率って
わかってるからじゃね?
サイコロ
1の目の出る確率は??
(きれいなサイコロじゃない!)
サイコロ
1の目の出る確率は??
(きれいなサイコロじゃない!)
わからない!
じゃあどうやって確率を
出すの??
大きい面が出やすい
重心が近い面が出やすい
大きい面が出やすい
重心が近い面が出やすい
“規則”
“規則”
何回か振って
データからルールを求める
→これが学習
目の出方が
予測できる
新しいサイコロに対して
応用例 スパムフィルタリングの例
スパム!!!
スパムじゃない 集計
1,最初は人手でスパムかどうかを仕分ける
2,それぞれに使う特徴を決める
(メール文面とかタイトルとかリンクとか)
スパム!!!
スパムじゃない 集計
3,特徴に対するスパムの確率を集計する
4、集計結果を利用してスパム判定をする
スパムフィルタ
人手で仕分ける スパムかどうかを
分ける
特徴(規則)を決める メール文面とか
確率集計 メール文面に対する
スパムの確率
集計結果の適用 新しいメールがスパムかどうか
これがいわゆる
教師あり機械学習
教師あり機械学習
これって?
教師あり機械学習
最初に人手でラベルを付与すること
(スパムかどうか etc…)