unigram mixtures

21
Unigram Mixtures の話 @fmkz___

Upload: kazufumi-ohkawa

Post on 10-May-2015

493 views

Category:

Technology


1 download

DESCRIPTION

Unigram mixturesの簡単な紹介

TRANSCRIPT

Page 1: Unigram mixtures

Unigram Mixtures の話

@fmkz___

Page 2: Unigram mixtures

教師あり学習とは?

Page 3: Unigram mixtures

教師なし学習とは?

Page 4: Unigram mixtures

教師あり学習でのラベルを潜在変数として推定するのが

教師なし学習

Page 5: Unigram mixtures

•  教師あり学習: p(y|x)

•  教師なし学習: p(x) = Σyp(x|y)p(y)

Page 6: Unigram mixtures

K-means h"p://tech.nitoyon.com/ja/blog/2009/04/09/kmeans-­‐visualise/

Page 7: Unigram mixtures
Page 8: Unigram mixtures
Page 9: Unigram mixtures
Page 10: Unigram mixtures
Page 11: Unigram mixtures
Page 12: Unigram mixtures
Page 13: Unigram mixtures
Page 14: Unigram mixtures

•  距離の中心を計算して •  最も近いクラスに割り当てて

•  を繰り返す

Page 15: Unigram mixtures

EMアルゴリズム •  EMアルゴリズムは観測データの対数尤度を、E stepとM stepの繰り返しにより最大化するアルゴリズム

Page 16: Unigram mixtures

スパムとハムの話に戻る •  教師あり学習 – 事前にスパムとハムに分類していた

•  これをラベルを付与してない状態から2つのグループに分割できないか? – 教師なし学習

Page 17: Unigram mixtures

Unigram Mixtures

Page 18: Unigram mixtures

アルゴリズム •  このスライドが詳しい – http://www.ism.ac.jp/~daichi/lectures/ISM-2012-TopicModels-daichi.pdf

Page 19: Unigram mixtures

実装 •  R – https://github.com/ariddell/mixture-of-unigrams

•  C – http://www.ism.ac.jp/~daichi/lectures/H24-TopicModels.html

Page 20: Unigram mixtures

デモ 本当はいつものようにeしずおかのブログのデータを分類するつもりだったのだけど読書が急がしくてやる暇なかったw

Page 21: Unigram mixtures

まとめ •  入門機械学習のナイーブベイズの応用としてUnigram Mixturesの紹介とデモをしました