自然言語処理 2013

61
自自自自自自 2013 自自 25 自 12 自 9 自 ( 自自自自自自自 自自自自自自自自自自自自自 自自自自

Upload: selma

Post on 08-Jan-2016

67 views

Category:

Documents


0 download

DESCRIPTION

自然言語処理 2013. 平成 25 年 12 月 9 日 ( 月) 東京工科大学 コンピュータサイエンス学部 亀田弘之. 今までやってきたこと. 思い出して見てください。 キーワードだけでもいいですので! たくさんのことを学びましたよね。. 今までやってきたこと. 思い出して見てください。 キーワードだけでもいいですので! たくさんのことを学びましたよね。. 今日の課題  思いつく キーワードを10個ほど 書き出してみてください。. 今までやってきたこと. 自然言語処理とは 自然言語処理(理解)過程の概要 形態素解析(各種手法とツール) 構文解析 - PowerPoint PPT Presentation

TRANSCRIPT

自然言語処理 2013

平成 25 年 12 月 9 日 ( 月)東京工科大学コンピュータサイエンス学部 亀田弘之

2

今までやってきたこと

思い出して見てください。 キーワードだけでもいいですので! たくさんのことを学びましたよね。

Tokyo University of Technology ( 思考と言語研究室 )

3

今までやってきたこと

思い出して見てください。 キーワードだけでもいいですので! たくさんのことを学びましたよね。

Tokyo University of Technology ( 思考と言語研究室 )

今日の課題 思いつくキーワードを10個ほど書き出してみてください。

4

今までやってきたこと

自然言語処理とは 自然言語処理(理解)過程の概要 形態素解析(各種手法とツール) 構文解析 言語獲得(未知語獲得・文法獲得)

Tokyo University of Technology ( 思考と言語研究室 )

5

自然言語処理とは 自然言語 (Natural Languages)

言語 思考のための道具 情報・知識を記述・蓄積するための道具 コミュニケーションのための道具

言語=自然言語+人工言語 自然言語=文字言語+音声言語+視覚言語 処理=理解+生成 処理の主体(機械 or 人間)

本授業は主として「文字言語+理解」を取り扱う本授業は主として「文字言語+理解」を取り扱う

Tokyo University of Technology ( 思考と言語研究室 )

6

自然言語処理(理解)過程の概要

形態素解析 (Morpheme analysis) 構文解析 (Syntactic analysis) 意味解析 (Semantic analysis) 談話解析 (Discourse analysis) 状況解析 (Situation analysis)  など

Tokyo University of Technology ( 思考と言語研究室 )

7

形態素解析の手法

文字種法 最長一致法 文節数最少法 接続表を利用する方法 遷移確率を用いる方法 コスト最小法 (Juman) 隠れマルコフモデル法 (Chasen) その他 (Kabocha 等は SVM を利用 )

SVM: Support Vector Machine( 機械学習法の1つ )SVM: Support Vector Machine( 機械学習法の1つ )

Tokyo University of Technology ( 思考と言語研究室 )

8

形態素解析のツール

Juman Chasen (茶筌) MeCab Kobako/J その他いろいろあります

( Internet などで調べてみましょう。)

自作のソフトウェア

Tokyo University of Technology ( 思考と言語研究室 )

9

統語解析(構文解析)

言語と文法( Language and Grammar )言語=文法的に適格な文の集合文法= <Vn, Vt, s, P>

Vn: 非終端記号の集合Vt: 非終端記号の集合s: 開始記号P : 書き換え規則群

(チョムスキーの文法理論に準拠)

Tokyo University of Technology ( 思考と言語研究室 )

10

統語解析

言語と文法( Language and Grammar ) 言語=文法的に適格な文の集合文法= <Vn, Vt, s, P>

Vn: 非終端記号の集合(構文構造記述用文法用語集)

Vt: 終端記号の集合(語彙)s: 開始記号P : 書き換え規則群

(チョムスキーの文法理論に準拠)

Tokyo University of Technology ( 思考と言語研究室 )

11

Tom broke the cup with the hammer.

この例文で構文解析の話しをしました。 他の例ではどうなるか挑戦してみてくだ

さい。 その結果として、自力で構文解析システ

ムを作るために必要な知識や技術が何であるか理解できれば OK です。

後は、挑戦あるのみです。   Good Luck!

Tokyo University of Technology ( 思考と言語研究室 )

12

言語獲得(文法獲得)

未知語獲得( Vt の拡張) 統語規則獲得 (Vn およびPの拡張 )

Tokyo University of Technology ( 思考と言語研究室 )

13

未知語獲得

定義( コメント:研究を進める上での前提 )

分類(コメント:研究目的に応じて決まるもの)

Tokyo University of Technology ( 思考と言語研究室 )

14

未知語の定義

人間にとっての未知語:初見の単語?(定義困難?)

機械にとっての未知語:システム辞書に登録されていない単語(未登録語)

Tokyo University of Technology ( 思考と言語研究室 )

15

未知語の分類(概要)

第1種の未知語(異表記未知語) 第2種の未知語(未知複合語) 第3種の未知語(その他)

Tokyo University of Technology ( 思考と言語研究室 )

16

第1種(異表記未知語)1. 東京大学付属病院

  東京大學附属病院2. 組合せ 

  組み合せ 組み合わせ 組み合わせ3. 飛び込む

  飛びこむ4. コンピュータ

  コンピューター etc.

Tokyo University of Technology ( 思考と言語研究室 )

17

第 2 種(未知複合語)

1. 数学辞典2. 見学旅行3. 個人旅行4. 月旅行5. 温泉旅行6. 積み立て旅行 etc.

これらの単語を辞書で調べてみよう.このうちの幾つかは通常の辞書には載っていない.そのような語は他にもあり得る.どうすればいいのだろうか?

これらの単語を辞書で調べてみよう.このうちの幾つかは通常の辞書には載っていない.そのような語は他にもあり得る.どうすればいいのだろうか?

Tokyo University of Technology ( 思考と言語研究室 )

18

第3種(本当の未知語)

例: のだめ rlgg  (専門用語) モー娘 りあじゅう (若者語)

Tokyo University of Technology ( 思考と言語研究室 )

19

未知語処理

処理プロセス 処理モード 処理方略 (strategy)

Tokyo University of Technology ( 思考と言語研究室 )

20

未知語処理の処理プロセス

1. 未知語存在の検出2. 未知語候補の切り出し3. 内部構造の解析4. 品詞推定5. 意味推定6. 意味整合性の確認7. 辞書処理(追加・削除・更新 など)

Tokyo University of Technology ( 思考と言語研究室 )

21

未知語処理の処理モード

処理モード 未知語 未知統語規則

モード1 無 無

モード2 有 無

モード 3 無 有

モード 4 有 有

Tokyo University of Technology ( 思考と言語研究室 )

22

今日の内容

より深い自然言語処理 他者理解感情・意図理解(・社会認知)

心のモデル(・認知機能モデル) など (Theory of Mind)

Tokyo University of Technology ( 思考と言語研究室 )

23

今日の内容(再)

より深い自然言語処理 他者理解感情・意図理解(・社会認知)

心のモデル(・認知機能モデル) など (Theory of Mind)

Tokyo University of Technology ( 思考と言語研究室 )

それでは始めましょう!

心のモデルとそれに基づく感情・意図推測方法

2006 年 10 月 20 日

東京工科大学亀田弘之・小澤朋之・難波創

電子情報通信学会思考と言語研究会平成 19 年 10 月 20 日発表資料

於 NHK基礎研究所

電子情報通信学会思考と言語研究会平成 19 年 10 月 20 日発表資料

於 NHK基礎研究所

25

はじめに( 1/5 )

いじめ 引きこもり心の問題

社会の高度化・複雑化

「癒し」を切実に求めているTokyo University of Technology ( 思考と言語研究室 )

26

はじめに( 2/5 )

癒し心理的効果

人を元気づけることや動機づける

生理的効果ストレスを低減し血圧や脈拍を正常にさせる

現代社会に必要とされている

Tokyo University of Technology ( 思考と言語研究室 )

27

はじめに( 3/5 )

PaPeRo ifbot

人との共存を目的として開発されているロボット

人に安らぎや癒しを与えることができるTokyo University of Technology ( 思考と言語研究室 )

28

はじめに( 4/5 )

ふれあい

癒される~

円滑で自然な意思疎通が必要不可欠

Tokyo University of Technology ( 思考と言語研究室 )

29

コミュニケーションによる癒しの実現人とふれあう癒し系ロボット PDDIN

PDDIN ですよろしく~♪

はじめに( 5/5 )

Tokyo University of Technology ( 思考と言語研究室 )

30

従来の心・感情モデル( 1/5 )

“人の心”という概念を扱う場合に,まさにその心自体を記述・表現するためのものである

心のモデル

心のモデルに関するさまざまな提案がされている

Tokyo University of Technology ( 思考と言語研究室 )

31

従来の心・感情モデル( 2/5 )

図 1 :心の計算機モデル(岡田直之)Tokyo University of Technology ( 思考と言語研究室 )

効果器

32

従来の心・感情モデル( 3/5 )

図 2 :意識の外にある無意識の自律分散計算結果にボトムアップに注意を払う受動的な意識を仮定する心のモデル(前野隆司)

Tokyo University of Technology ( 思考と言語研究室 )

33

従来の心・感情モデル( 4/5 )

図 3 :感情の立体モデル( P.Plutchik )Tokyo University of Technology ( 思考と言語研究室 )

34

The Theory of Mind (心の理論)

Premack & Wooddruff(1978) Baron-Cohen(1995)

Tokyo University of Technology ( 思考と言語研究室 )

35

心の理論とは

Tokyo University of Technology ( 思考と言語研究室 )

36

The Theory of Mind

ID (Intentionality Detector)意図検出器

EDD (Eye-Direction Detector)視線方向検出器

SAM (Shared Attention Mechanism)共有注意の機構

ToMM (Theory of Mind Mechanism)心の理論の機構

Tokyo University of Technology ( 思考と言語研究室 )

37

従来の心・感情モデル( 5/5 )

1 .処理のためのデータ構造やアルゴリズムが明確に示してはいない

2 .工学的に応用するまでに至っていない

従来のモデルの問題点

人とふれあう癒し系ロボット PDDIN の研究・開発による心のモデルの考案

Tokyo University of Technology ( 思考と言語研究室 )

<参考情報>感性情報科学の研究室

東京工科大学で感情関連の研究をしている研究室はいろいろとあります。 亀田研究室(癒し系ロボット・認知機能モデ

ル) 大野研究室(感情音声の認識・合成) 長名研究室(感情のニューラルネットモデル)岩下研究室(音声対話システム)千種研究室(感性語検索)菊池研究室(感性科学・精神物理学) など飯田研究室(メディア学部・感情音声)

Tokyo University of Technology ( 思考と言語研究室 ) 38

39

PDDIN

2002 年度から開発されている

1 .感情モデルの提案2.感情モデルをもちいた,感情システムの構築

研究内容

4 .ロボット本体の作製

3 .対話処理システムの構築

Tokyo University of Technology ( 思考と言語研究室 )

40

PDDIN2005 デモムービー

Tokyo University of Technology ( 思考と言語研究室 )

41

考察

モデルの意義の一つは「システムの設計図」である。

従来の心・感情のモデルは設計図としては不十分。

というのも…

Tokyo University of Technology ( 思考と言語研究室 )

42

ソフトウェア工学の分野では、「大規模化・複雑化した情報システム」に対して、様々な観点から分析・記述・設計

人間の心(脳)も同様ではないのか?

Tokyo University of Technology ( 思考と言語研究室 )

43

ソフトウェア工学で使用する図(UML)

1. ユースケース図2. クラス図3. オブジェクト図4. シーケンス図5. ステートマシン図

(ステートチャート図)

6. アクティビティ図7. コンポーネント図

8. コミュニケーション図(コラボレーション図)

9. 配置図10. コンポジット図11. タイミング図12. 相互作用概念図

こんなにたくさんある!Tokyo University of Technology ( 思

考と言語研究室 )

44

UML での各種ビュー

ユースケース図 アクティビティ図シーケンス図

コミュニケーション図(コラボレーション図)

ステートマシン図(ステートチャート)

クラス図

オブジェクト図

コンポーネント図

配置図

ユースケースビュー

論理ビュー

配置ビュー並行性ビュー

コンポーネントビュー

こんなにたくさんの視点がある!

Tokyo University of Technology ( 思考と言語研究室 )

45

人間の心(脳)に対しても、 UML (Unified Modeling Language) を参考にしてモデルを記述するべきであろう。(1つの方針)

( もしかしたら、 SysML の方がいいかも... )

Tokyo University of Technology ( 思考と言語研究室 )

46

心のモデル

計算論的なモデル (computational model) が必要 (基本的主張)

Tokyo University of Technology ( 思考と言語研究室 )

47

記憶のモデル(従来のモデルの例)

銘記 保持 想起

感覚貯蔵庫 短期記憶 長期記憶

Tokyo University of Technology ( 思考と言語研究室 )

Baddeley の working memory 理論も計算論的ではない

Baddeley の working memory 理論も計算論的ではない

48

心のモデル

データ構造+アルゴリズム

知識表現+プログラム(オブジェクト指向)

Tokyo University of Technology ( 思考と言語研究室 )

心のモデルの概要図

Tokyo University of Technology ( 思考と言語研究室 ) 49

( 次ページ参照 )

Tokyo University of Technology ( 思考と言語研究室 ) 50

51

心のモデルの知識表現

フレーム形式を採用 理由:オブジェクト指向を意識しているた

め)

Tokyo University of Technology ( 思考と言語研究室 )

52

心のモデルのプログラム

Tokyo University of Technology ( 思考と言語研究室 )

53

心のモデルのプログラム

理解と生成 生成はシステム設計者依存 理解は相手がある->この解決方法は?

Tokyo University of Technology ( 思考と言語研究室 )

54

心のモデルのプログラム

理解と生成 生成:生成関数 F を利用 理解:生成関数 F の逆関数で推定

逆関数の存在は? 逆関数の同定(作成)方法は? 逆関数の計算は?

解決すべき問題はたくさんある!どうすればいいのか!?

Tokyo University of Technology ( 思考と言語研究室 )

55

刺激 A

反応 B

Tokyo University of Technology ( 思考と言語研究室 )

56

D: 心の状態A: 発話+仕草F: D → A

D: 心の状態A: 発話+仕草F: D → A

同一視

図6.心のモデルの共通仮説

心のメカニズムは共通

Tokyo University of Technology ( 思考と言語研究室 )

57

生成関数 F の定義

刺激 X 心の状態 Y 反応

F(X,Y)

α A F1

α B F2

β A F3

β B F4

γ A F5

γ B F6

Tokyo University of Technology ( 思考と言語研究室 )

58

まとめ

癒しを実現するためには心のモデルが重要(他者理解なくしては癒しなし!)

計算論的心のモデルが必要 計算論的とは、

知識表現+プログラム 心のモデルの提案

知識表現+プログラム 他者理解の方法

( IbS: Inference by Synthesis )

Tokyo University of Technology ( 思考と言語研究室 )

59

The Theory of Mind

ID (Intentionality Detector)意図検出器

EDD (Eye-Direction Detector)視線方向検出器

SAM (Shared Attention Mechanism)共有注意の機構

ToMM (Theory of Mind Mechanism)心の理論の機構

Tokyo University of Technology ( 思考と言語研究室 )

最後に授業評価アンケート

忌憚のないコメントをお願いします。

60

おまけ

寒くなってきました,またインフルエンザの流行時期になりました.手洗い,うがいをしましょう.

インフルエンザに罹ったら,病院へ行くとともに,他人にうつさないためにも,自宅で療養してください.

その際には,大学・先生に連絡すること.

病院で診断書をもらうことを忘れずに!

61

以上