tokyonlp主催者からのメッセージをお読みください
TRANSCRIPT
TokyoNLP主催者からの メッセージをお読みください
About the presenter
• Name: Yoh Okuno / nokuno
• Software Engineer at Web Company
• Interest: NLP, Machine Learning, Data Mining
• Skill: C/C++, Python, Hadoop, and English.
• Website: http://yoh.okuno.name/
NLP系勉強会相関図
PRML読書会TokyoWebMining TokyoNLP
TokyoR
Hadoop Conf. DSIRNLP さくさくテキストマイニング
NLP TextMining
機械学習 DataMining
実装
理論
(アルゴリズム勉強会)
TokyoNLPを始めた経緯 PRML読書会 (@naoya_t)
CV勉強会(@takmin) TokyoNLP(@nokuno)
TokyoR (@yokkuns)
TokyoWebMining (@hamadakoichi)
さくテキ @Antibayes @toilet_lunch
DSIRNLP @overlast
第4回TokyoWebMining(@nokuno)
5
前処理
N-‐gram抽出
定型処理
• WikipediaからN-‐gram頻度などを集計
本文抽出
形態素解析
統計量の抽出
統計量の集計
頻度順にソート
第1回TokyoNLP(@nokuno) • タイトル「FSNLPの1章を読む」
• Zipの法則とかチョムスキー滅びろとか
第2回TokyoNLP(@y_benjo) • タイトルは釣りで,普通に論文紹介
第3回TokyoNLP(@echizen_tm) • うきうき☆Compressed Suffix Array
NIPS 2010 読み会 • 国際会議の論文を読む会を始める
第4回TokyoNLP (@nokuno) • KoehnのSMT本の紹介を始める(全3回)
第5回TokyoNLP(@sleepy_yoshi) • パーセプトロンからMP, VP, AP, PAまで導出
余談:Speller Challengeで 入賞しました
• TokyoNLPで発表したおかげ…かな?
第6回TokyoNLP(@y_shindoh)
• 音声認識の基礎から言語モデルの作り方まで
ICML 2011読み会 • 線形代数の奥深さを再認識するなど
第7回TokyoNLP(@hitoshi_ni)
• 文書要約の入門とILPによる解法とか
第8回TokyoNLP(@shuyo) • 言語判定ライブラリのTwitter対応
– ↓こんな感じ
• Αλφάβητοل ابجدية عربية •• ๐๑๒๓๔๕๖๗๘๙ • द"नागरी • 汉字
佐藤一誠先生,森先生の招待講演もありました
ACL 2011 読み会 • バラエティ豊かな発表がありました
EMNLP 2011 読み会 • 統計的機械翻訳・Transliteration祭り?
第9回TokyoNLP(予定)
• 2012年2月25日(土),会場:渋谷
発表者 発表内容(仮) ippei_ukaiさん 日英機械翻訳やってみた unnonounoさん Jubatusの新機能(レコメンド) s5yataさん CountMin Sketchの実装と評価 tkngさん 「日本語入力を支える技術」出版記念
宣伝:関わった書籍とか
TokyoNLP 発表者募集中!