watson discoveryの活用とr&rからの移行

21
Watson Discoveryの活用と R&Rからの移行 2017123IBM Cloud (Bluemix) 冬の大勉強会 井上 研一/小倉 実咲

Upload: kenichi-inoue

Post on 24-Jan-2018

1.239 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Watson Discoveryの活用とR&Rからの移行

Watson Discoveryの活用とR&Rからの移行

2017年12月3日 IBM Cloud (Bluemix) 冬の大勉強会

井上 研一/小倉 実咲

Page 2: Watson Discoveryの活用とR&Rからの移行

井上 研一

合同会社井上研一事務所 代表・ITコーディネータ・ ITエンジニア

「超初心者」専門 ITスクール TECH GARDEN SCHOOL 講師

Watsonをコールセンター等に導入したり、本を書いたり、

AIやIoT関連の研修・セミナーをやったりしています。

最近「北九州で IoT」というビジネスコンテストで採択されて、

3月のデモデイに向けていろいろやっています。( Watson IoT採用?)

https://inoccu.comTwitter: @inoccuFacebook: kenichi.inoue

Page 3: Watson Discoveryの活用とR&Rからの移行

小倉 実咲

慶應義塾大学経済学部 3年

「超初心者」専門 ITスクール TECH GARDEN SCHOOL 塾生スタッフ

大学1年時より所属する「 TECH GARDEN SCHOOL 」で、井上先生をはじめ

とするエンジニアの方々からプログラミング等を学びつつ、スタッフとして運

営や講師活動に携わっております。

その中でWatson APIを用いた開発に興味を持ち、只今勉強中です。

大学では経済学を専攻しており、経済学の中でも特に「行動経済学」という

分野を日々学んでおります。

Page 4: Watson Discoveryの活用とR&Rからの移行

アジェンダ

1. Discoveryとは何か(井上)

2. TGS BotのR&RからDiscoveryへの移行(小倉)

3. エンタープライズシステムのR&RからDiscoveryへの移行(井上)

Page 5: Watson Discoveryの活用とR&Rからの移行

1.Discoveryとは何か

(井上)

Page 6: Watson Discoveryの活用とR&Rからの移行

R&R/DoCの廃止とDiscoveryへの移行

現在、Amazonでは取り扱い中止になっています。(中古本のみ)

改訂版執筆中!!

Page 7: Watson Discoveryの活用とR&Rからの移行

Discoveryの機能

● Word/PDF/HTML/JSON文書の蓄積とエンリッチメント○ Watson Knowledge Studio(WKS)と連携したカスタムエンリッチメント

● コグニティブ検索○ 自然言語検索

○ Discovery Query Languageによる検索

● トレーニングデータによる自然言語検索の精度改善(機械学習)

● クローラーの提供

Page 8: Watson Discoveryの活用とR&Rからの移行

Discoveryの構造(1)

Page 9: Watson Discoveryの活用とR&Rからの移行

Discoveryの構造(2)

Page 10: Watson Discoveryの活用とR&Rからの移行

Ingestionのステップ

Page 11: Watson Discoveryの活用とR&Rからの移行

2.TGS Botの

R&RからDiscoveryへの移行

(小倉)

Page 12: Watson Discoveryの活用とR&Rからの移行

TGS Botとは?

<コンセプト>・ターゲット ⇒ 当スクールの生徒様

         学習中の塾生スタッフ

・解決したい課題 ⇒ 多くの人が陥いるようなエラーであれば、

           簡単に1人で解決したい。していただき

           たい。

<ユースケース>

生徒様・塾生スタッフが、原因のわからないエラー内容を入力するだけで、その解決方

法が提示される。

Page 13: Watson Discoveryの活用とR&Rからの移行

移行前の構造Watson API

ブラウザ

DBCakePHP

質問

回答

質問データ

検索結果

collection , doc_no

Body(回答)

Page 14: Watson Discoveryの活用とR&Rからの移行

移行前のWatson API ←Node-REDを用いて開発

NLC質問者・ブラウザ

setting

common

R&R

検索結果をブラウザへ

setting.collecion

common.collection

Page 15: Watson Discoveryの活用とR&Rからの移行

移行後の構造

Watson APIブラウザ

質問

回答

質問データ

検索結果

Page 16: Watson Discoveryの活用とR&Rからの移行

移行後の構造 ←引き続きNode-REDを用いて開発

NLC質問者・ブラウザ

setting

common

Discovery

検索結果をブラウザへ

setting.collecion

common.collection

Page 17: Watson Discoveryの活用とR&Rからの移行

作業手順

① Discovery内にコレクションを作成する。

② R&Rの学習に使用していたJSONデータを、Discoveryに学習させる。(この際、  JSON

データ1つにつき、 1ファイルで保存する必要がある。 ’id’は使用不可。 )

③Node-RED上でR&RをDiscoveryに置き換え、HTMLを書き換える。

               ↓

・訓練データファイルの編集等、多少の改変作業はあったものの、予想より非常にス

ムーズに移行することができた。

Page 18: Watson Discoveryの活用とR&Rからの移行

3.エンタープライズシ

ステムの移行Tips

(井上)

Page 19: Watson Discoveryの活用とR&Rからの移行

エンタープライズシステムでのコスト感

● 某製造業のコールセンターに導入したR&Rからの移行

● 160コレクション○ R&R → 20インスタンスで稼働(8Ranker/1インスタンスのため)

○ Discovery → 文書数 最多 3,400文書 最少 60文書 /コレクション

Retrieve and Rank (R&R)

● インスタンス料金● Ranker料金● Rnakerトレーニング料金● API Call

763,200円/月※API Callを除く

Discovery Standard Plan

● 文書数(1,000文書単位)

249,000円/月※API Call 課金なし

Page 20: Watson Discoveryの活用とR&Rからの移行

移行作業で困ったこととノウハウ

● CollectionへのDocument追加は非同期で行われる(R&Rは同期だった)○ 非同期の同時処理数を超えた場合、追加がエラーになるので、制御が必要

○ List Collection Details APIでprocessing(処理中)の文書数が分かる

● どのようなTraining Dataなら精度が上がりやすいのか?○ 公式ドキュメントには言及あり  →要確認!

● 日本語のエンリッチはいまのところWatson Knowledge Studio(WKS)頼み○ WKSで思ったようなエンリッチの結果を出すのは結構大変・・・

○ 「超辛い」が「結構大変」になったらしい・・・

○ エンリッチの日本語対応( NLUの日本語対応)を積極的にお願いしたい・・・  →IBMさん

● Discovery Toolから日本語が選べないかもしれない○ CurlなどからAPIを使うと一応、大丈夫

Page 21: Watson Discoveryの活用とR&Rからの移行

まとめ

Discoveryは恐れるに足りず。つつがなく移行を!