prmu研究会の今後のあり方について(nlp分野での取り組み紹介)
TRANSCRIPT
⼩町先⽣に聞いてきました
内⽥祐介株式会社ディー・エヌ・エー
⼩町守先⽣• ⾸都⼤学東京システムデザイン学部准教授 • ⾃然⾔語処理分野の発展のために
問題意識を持って⾊々取り組まれている • 精⼒的な情報発信
– 武蔵野⽇記(旧⽣駒⽇記)
• ⾃然⾔語処理分野での 様々な取り組みについて 聞いてきました
2
⾔語処理学会第17回年次⼤会 (NLP2011) ワークショップ「⾃然⾔語処理における企業と⼤学と学⽣の関係」
http://nlp.cs.nyu.edu/gengo2011ws/
3
⾔語処理学会第17回年次⼤会 (NLP2011) ワークショップ「⾃然⾔語処理における企業と⼤学と学⽣の関係」
• 背景(上記HPより) – ⾃然⾔語処理に関係した企業と⼤学と学⽣の関係が変化しています。
• ⾃然⾔語処理に関する⼤学での研究内容と企業での応⽤が⾮常に近くなって来ています。
• 企業がデータを⼤学等に提供し、その研究成果が社会に還元される仕組みができつつあります。
• 多くの学⽣は⼤学での研究活動の後に企業に⼊り、研究所や事業部での活躍が期待されています。
• 企業はより優秀な頭脳を集めるために、これまでの枠に捕われない採⽤姿勢をとる傾向が強まっています。
• インターン制度により学⽣が企業の中⾝を事前に知ることができるようになっていますが、範囲は限定されています。
– 本ワークショップでは、企業、⼤学、学⽣の3者の間での相互理解を⽬的に、それぞれの ⽴場や⽬的を明確にし、お互いの期待や要求を話し合う場を⽤意します。
http://nlp.cs.nyu.edu/gengo2011ws/
4
⾔語処理学会第17回年次⼤会 (NLP2011) ワークショップ「⾃然⾔語処理における企業と⼤学と学⽣の関係」
• 学⽣→企業という観点から⾒たWS– 企業に就職するのは都落ちだと思う先⽣もいて、企業で研究開発す
るという観点が少なかった。企業と学⽣が出会う場所も少ない – インターンへの研究室の姿勢もまちまち
• 上記2つの問題意識がYANSにつながる ⼩町守, “若き⼤学院⽣の悩み - ⾃然⾔語処理の研究を続けるべきか,それが問題だ –.” http://nlp.cs.nyu.edu/gengo2011ws/papers/3-komachi.pdf
5
NLP若⼿の会, YANS(2006年〜)• 2泊3⽇の合宿形式のシンポジウム(2014年〜) • 多数の企業スポンサーによる宿泊費や懇親会費等のサポート
(2014年〜) – 2017年の学⽣の宿泊費:2泊3⽇ 6,000円(1泊2⽇ 3,000円)
• 「合宿を通じて密な議論を⾏う機会を設けるとともに,組織や研究室,業種を横断する幅広いつながりを醸成する機会を設けます.またそのためのレクリエーションも企画します」
6
NLP若⼿の会, YANS(2006年〜)• 当初
– 若⼿(科研費の「若⼿研究」くらいの年代)が喋る機会が欲しかった• それ以降(⼩町先⽣が委員⻑をしていたころ)
– 若⼿(⽚⼿、5ビットで表現できるくらい)よりにシフト、 企業の⼈も来始める
– 情報科学若⼿の会というのがあったのを参考に合宿化 • 主催:⼀般社団法⼈ 情報処理学会 プログラミングシンポジウム委員会
– ⾔語処理学会の下部組織になる話も→賞やスポンサーの⾃由度を取った• スポンサーとして⾔語処理学会がある形に落ち着いた
– 賞は国際会議等で発表済みのもの以外を対象とした奨励賞 • 学会としての賞ではないので学⽣から⾒ると弱いかも
– 研究会レベルの発表が多いがアイディアレベルのものを発表してほしい– メンター制度もあったが廃⽌
http://wakate.org/about/
7
NLP若⼿の会 (YANS)• スポンサーとか
– 3年前から積極的に募りだした:2017年で総額700万円くらい?• 2016年くらいから⾔語処理学会も積極的にスポンサー取り始めた
– 研究室によっては学⽣に旅費が出なかったり⼀部のみだったり • 研究室配属前の学⽣が来たりもする• スポンサー費⽤から旅費⽀援という名⽬で、発表予定の学⽣へ旅費を⽀援
– スポンサー観点でのメリット • 若⼿でなくてもスポンサー枠で参加できる • ライトニングトーク枠もある(研究発表でなくても良い)
– 学⽣観点でのメリット • 直接企業のエンジニアや研究者と交流できる
(←元々⼩町先⽣が持っていた問題意識)8
NLP DL勉強会• セミクローズドな深層学習に関する勉強会• 動機:もともとキャッチアップするだけでも個⼈の⼒では追
い切れなくなっている• これまで5回開催、〜40⼈くらい来ている。企業が4分の1• 過去現在未来に勉強会で発表する⼈が対象
9
NL研の取り組み1. 招待講演を毎回するようになった2. 回数を減らした
– 奇数⽉で、6回もあった→⼈が少ない回がある– 1⽉や3⽉が年次⼤会と被るのでやめた。– あまりに減らすと⼭下研究賞が情処から出なくなる
3. 優秀研究賞という賞を作った– 今まではNLP界隈で賞を出さな過ぎた– 3%→10%以上– 賞狙いが増えたので、質が上がり、件数も1.5倍くらいになった
10
NL研の取り組み• 2014年から中継はじめた
– Ustだったが情処の意向でニコ⽣に– CM等でお⾦とることも考えたが、放送に失敗すると補償しないといけない等の懸念があり今
のところは無料。– オンサイト参加者は増えている。もちろんブームのせいもあるだろうから因果関係は不明。
• 良いところ– 1週間で2000⼈くらい⾒る。– 参加費出せない学⽣も観れるし、忙しい⼈て現地に⾏けない⼈も⾒れる
• 悪いところ– 罵詈雑⾔でるときも– 運⽤⾯:いまは⼩町研で学⽣を継続的に充てている(SIGMUSは運営委員でやっている)
• 運営委員会もskypeになった– 参加率は上がった(盛り上がりはそんなに変わらない)
• 盛り上がり– オーラルは良い質問が出にくい→発表の質に相関しそう– ポスターは盛り上がる
11
最先端NLP勉強会• 8〜9⽉開催
– NLP系の国際学会が落ち着いたあたり (CV系ほどarXivに先⾏して出てこない)
– 皆が都合のいい時期に• 原則として参加者が投票して選ばれた論⽂を読む
– 個⼈が読みたいものではない
12
⼩町先⽣のコメント• ⾔語処理を志望する学⽣は増えてきている• 現在は教員から企業や研究所に出る⼈が増えてきていて、
研究室が分散しがち – 横のつながりを強化することが課題
• 学会の研究会は、地⽅開催をやめて東京のスタジオで撮って配信してオンサイトは合宿のみにするのはどうか– NLPは800⼈くらいくるけど、NL研は50⼈くらい
• 研究会の運営⽅針は主査が代わるタイミングで変わることが通例(e.g., 2年任期×2) – そのタイミングで新しいことに挑戦できる(例えば4年かけて) – 年次⼤会等、1年任期のようなイベントは継続的な改善がなかなか
難しい13
誰に何を?• ⼩町先⽣は、学⽣第⼀
– 学⽣⽣全員が就職後もNLPの道に進むとは限らない前提– 1/3がNLP続けて、1/3がNLPもやっている企業の別セクション、1/3が
まったく関係ないところ– 学⽣の優秀な⼈がスタートアップ>⼀流企業>アカポスという順に⾏く
流れが出てきている• 信学会の⾔語理解とコミュニケーション研究会 (NLC) は企業が
多い– 参加者が少なかったが、テキストマイニングシンポジウムを始めて企業
を取り込んで盛り上がってきた– 新規性より有⽤性を重視– 発表者側:発表しました、という実績になる– 聴講者側:枯れた技術の聴講を狙っている– 企業としては企業のアピールのために発表している部分も
• こういう研究してるのでwe are hiring!14
その他【議論】実はNLPとCVで企業の応⽤可能性がまだ差があるのでは
– NLP:実応⽤のサービスが広がっている→テキストマイニングシンポジウム意味ある
– CV:画像認識がようやくうまくいくようになってきたので、まだ企業の応⽤はそこまで広がってない
– ⾃然⾔語処理でDeep狙っているのは対話、機械翻訳、⽂章要約等【議論】学術系の研究会として発表や質疑の質を⾼めたい
– 賞を増やす– 招待講演
• NL研の招待講演はポスドクあたりを対象• 若⼿の会は隣接分野の⼈も来やすい環境をつくっている
– ⼩町先⽣としては⾃然⾔語処理がずっとブームに案っているとは思わないので、流動性を⾼めたい
• 情報処理学会がマッチングの依頼を企業から受け付けて、⼤学を紹介する試⾏をやっている
15
ヒアリングを終えて• 研究会のあり⽅ではなく、分野としてどうすべきか
– 研究会はあくまで1つのファンクションで、 研究会としてやるべきことはやるがその枠にとらわれる必要はない
– NLP分野でも、研究会を含む既存の枠ではない取り組みが 必要であり、⽴ち上げられてきた(YANS, 勉強会等)
• PRMU分野のポータルとしてのPRMU研究会 – 様々な取り組みへのポインタ – オンラインコミュニティがあってもよいのでは
• Slack:ML, 3D vision, Kaggle, Chainer等
– 最新技術のキャッチアップサポート
16