semantic search20101026

10
高品質キーワード検索 ソリューションパッケージ Semantic Search 株式会社データクラフト データクラフト 検索ソリューション《セマンティック検索編》

Upload: datacraft-semantic-search

Post on 24-Jun-2015

1.005 views

Category:

Business


1 download

DESCRIPTION

SemanticSearchとは、株式会社データクラフトによる高品質のキーワード検索技術の総称です。 お客様のWebサイトに高品質なキーワード検索機能を提供し、商品検索、画像・動画検索、投稿コンテンツ検索、サイト内検索などにご活用いただけます。 高品質キーワード検索エンジンを活用するためには、検索対象への正確で豊富なキーワード付けが欠かせません。Semantic Searchでは、効率的なキーワード付け作業を実現するための環境を提供します。

TRANSCRIPT

Page 1: Semantic search20101026

高品質キーワード検索 ソリューションパッケージ

Semantic Search

株式会社データクラフト

データクラフト 検索ソリューション《セマンティック検索編》

Page 2: Semantic search20101026

概要・特長

高品質キーワード検索エンジン(特許取得済み)お客様のWebサイトに高品質なキーワード検索機能を提供します。商品検索、画像・動画検索、投稿コンテンツ検索、サイト内検索などにご活用いただけます。その検索品質は当社運営ストックフォトサービス『イメージナビ*1』で実証済みです。*1 http://imagenavi.jp/

正確で豊富なキーワード付け「高品質キーワード検索エンジン」を最大限に活用するためには、検索対象への「正確で豊富なキーワード付け」が欠かせません。『Semantic Search』では、効率的なキーワード付け作業を実現するための環境を提供します。(当社専任オペレーターによるキーワード付与作業も請け負います)

高品質検索を実現する語彙体系辞書キーワード検索時、キーワード付与時の双方で登録語数約30万語*2の辞書データを活用します。『Semantic Search』が備える辞書は、単なる同義語・類義語辞書ではありません。単語同士の関係性が表現された語彙体系辞書であり、単純な文字列比較に留まらない、意味重視の検索を実現します。*2 2010年10月現在

2

Page 3: Semantic search20101026

導入のメリット

ファインダビリティの向上SEO対策やリスティング広告でサイトへの誘導を図ったものの、サイト内で必要な情報にたどり着けなければ、そのサイト価値は大きく低減することになります。『Semantic Search』が提供する高品質なキーワード検索機能を導入することで、今までリーチされにくかった商品、コンテンツが探されやすくなり、商品購入などコンバージョン率の向上や埋没コンテンツの再活用が図られます。

サイト内回遊率の向上検索結果0件や的外れな検索結果は、サイトからの離脱率を高めます。高品質な検索機能はもちろんのこと、関連コンテンツ表示機能も併せて提供することで、サイト内回遊率を高め、ユーザー満足度の向上やコンバージョン率の向上を図ります。

発見・気づきの提供ユーザーは、いつも明確な検索要求を持っているわけではありません。『Semantic Search』は単なる検索文字列の比較ではなく、語彙体系辞書に基づいた意味重視の幅広い検索結果を提供するため、ユーザーに思いがけない発見や気づきをもたらします。

3

Page 4: Semantic search20101026

高品質キーワード検索エンジンによる検索改善例

“東京都“はヒットしません※部分一致 → 完全一致

京都 検索

アクセサリー 検索 “アクセサリ”もヒットします※同義語(表記ゆれ)

椅子 検索 “チェアー”もヒットします※同義語(外来語)

料理 検索 “スパゲティ” “生春巻き”もヒットします※上位語・下位語

イタリア 検索 “マルゲリータ” “スパゲティ”もヒットします※関連語

はし 検索 “橋” “箸” “端”のどれを探しているのかヒントを表示※同音異義語

色紙 検索 “色紙(いろがみ)” “色紙(しきし)”のどちらを探しているのかヒントを表示 ※同形異義語

4

Page 5: Semantic search20101026

正確で豊富なキーワード付与の概念イメージ

東京タワー

鉄塔通信施設

電波塔

東京都

港区

芝公園観光名所

ランドマーク

観光 東京タワー

ハヤブサ

動物鳥類鳥

タカ科

生き物絶滅危惧種

猛禽類

隼 ハヤブサ

5

Page 6: Semantic search20101026

一般的なサイト内検索システムとの違い

検索精度の限界サイト内検索などで利用される全文検索システムの多くは、索引(インデックス)作成型と呼ばれる方式を採用しており、その索引文字列の抽出手法としては以下の2種類がよく知られています。

① 形態素解析:検索結果のノイズは少ないが辞書の整備が必要なため検索漏れが生じやすい② N-Gram :辞書が不要で検索漏れは少ないが検索結果にノイズが生じやすい

いずれの手法も長所短所を持ちあわせており、両者の長所を組み合わせたハイブリッド検索システムも登場してきていますが、クローラを用いた全自動の索引作成システムでは、検索精度の面で少なからず限界があります。また、いずれの手法も単なる文字列比較の域を出ていません。『Semantic Search』は、当エンジンが持つ語彙体系辞書によって、単なる文字列比較に留まらない、意味重視の検索を実現します。

テキスト情報以外の検索一般的なサイト内検索システムは、WebページやPDFなど、テキストで表現されているものがその索引作成対象(=検索対象)となりますが、画像や動画など、そもそもテキスト情報が存在しないデータについては検索対象とすることができません。『Semantic Search』は、検索対象への「キーワード付け」をベースにしているため、基本的にはどのような対象物であっても検索対象とすることができます。

6

Page 7: Semantic search20101026

機能・仕様

1.リレーショナルキーワードシステム(語彙体系辞書)・同義語、上位語、関連語など、語彙体系が整備された辞書です。・登録語数(約30万語*1)

- マスター: 65,000語- 同義語 : 229,000語

・辞書の語彙数は日々増加しているため、定期的に辞書の更新を行ないます。・特定分野の語彙の追加・整備作業も承ります。(オプション)

*1 2010年10月現在

2.キーワード付与・キーワードサジェスト機能・同義語・上位語・関連語の自動付与機能・同音/同形異義語の選択機能・商品説明、ページ文書などからキーワードを自動抽出(オプション)

3.検索・閲覧・キーワードサジェスト機能・絞り込みキーワード候補の提示機能・同音/同形異義語の選択機能・検索結果表示順のチューニング・「もしかして...」機能(オプション)・関連コンテンツ表示機能(オプション)

7

Page 8: Semantic search20101026

機能・仕様

4.WebAPI・キーワード補完系API・キーワード登録系API・キーワード抽出系API・キーワード検索系API

5.オプション5-1.既存キーワードの移行と充実化・既に付与されているキーワードをリレーショナルキーワードシステムに適用することで、

キーワードの充実化を図ります。

5-2.初期キーワード抽出と充実化・既に大量の商品・コンテンツが登録されているが、それぞれにキーワードが付与されて

いない場合には、それらの付帯情報(商品説明文、ページ文書等)から初期キーワードを生成します。

・画像や動画など、付帯情報自体が存在していない場合は、当社専任オペレーターによる手動付与作業も請け負います。

8

Page 9: Semantic search20101026

サービス提供形態/導入費用

1.クラウドタイプ①辞書DB、付与キーワードDB共にASP側で管理

- WebAPI方式(キーワード補完系API、登録系API、検索系API)- 画面提供方式(キーワード付与・登録画面、検索結果画面)

②辞書DBはASP側で管理/付与キーワードDBは御社側でご用意- WebAPI方式(キーワード補完系API)

初期費用:お問い合わせください月額使用料:お問い合わせください

2.アプライアンスサーバータイプ・辞書DB、付与キーワードDB共に御社側にて運用管理

- WebAPI方式(キーワード補完系API、登録系API、検索系API)- 画面提供方式(キーワード付与・登録画面、検索結果画面)

標準価格:お問い合わせください保守費用:お問い合わせください

3.個別カスタマイズ開発・上記以外の個別カスタマイズも承ります。お気軽にお問い合わせください。

費用:個別お見積り

9

Page 10: Semantic search20101026

■お問い合わせ先

株式会社データクラフトソリューション事業推進室担当: 斎藤、田附(タヅケ)

〒060-0807札幌市北区北7条西1丁目1-2 SE山京ビル13F(直通)TEL: 011-707-7750(代表)TEL: 011-707-7780 FAX: 011-707-7790

Email: [email protected]

高品質キーワード検索ソリューションパッケージ

Semantic Search

10