20130708 「架站前一定要上的10堂課」之第5課

18
5 課:搜尋就會找到 Conrad Peng [email protected] 2013.7.8 5

Upload: conrad-peng

Post on 12-Nov-2014

653 views

Category:

Technology


4 download

DESCRIPTION

有關資訊架構學裡面網站使用到搜尋系統相關的概念。

TRANSCRIPT

Page 1: 20130708 「架站前一定要上的10堂課」之第5課

第5課:搜尋就會找到

Conrad [email protected]

2013.7.8

5

Page 2: 20130708 「架站前一定要上的10堂課」之第5課

搜尋的基本部分 (p101、p105)

•查全(recall)、召回率:絲毫不差的找出一切你所搜尋的東西的厲害程度。Recall is how good it is at finding absolutely everything you were searching for.

•查準(precision)、精度:根據與你所查找內容的相關程度,加以整理前述結果的厲害程度。Precision is how good it is at organizing these results by how relevant they are to your query.

Page 3: 20130708 「架站前一定要上的10堂課」之第5課

查全(recall)與查準(precision)

有些檢索原理是將各種不同相關程度的結果全部都檢索出來,有些則只檢索出少部分高度相關的結果。這個概念就是查全(recall)與查準(precision) 。

• 查全(recall)=檢得的相關文件筆數/資料庫中或網站中所有相關文件筆數

• 查準(precision) =檢得的相關文件筆數/資料庫中或網站中所有文件筆數

比如說網站中有1000篇文件,搜尋結果是100篇;事實上網站中相關的文件共有200篇。

查全率是:100/200=0.5,而查準率是:100/1000=0.1。

搜尋系統設計應該強調查全還是查準呢?取決於網站的使用者!

參考資料:http://goo.gl/bq0Vt

Page 4: 20130708 「架站前一定要上的10堂課」之第5課

搜尋相關性設計 (p105)

•詞彙表 word list

•停止詞 stop words (p104) : “the”, “a”, “and”, “to”, “的”, “和”, …

• Google PageRank

•標題標籤 <h1>

•略過詞組偵測功能快速

•搜尋功能非一次性設定,需不斷調整引擎和演算法

Page 5: 20130708 「架站前一定要上的10堂課」之第5課

搜尋應該要快速、容易、神奇

•解決查全與查準部分

•「呈現層次」

•快速、容易、神奇

Page 6: 20130708 「架站前一定要上的10堂課」之第5課

搜尋一定要快速

1.一定要能快速取得結果不必宣告運算結果來炫耀多快,但是非快不可。

2.一定要快速載入結果“快而醜”勝過“慢而美”。

3.一定要能粗略審視結果使用者能夠快速挑出值得點閱的結果。

Page 7: 20130708 「架站前一定要上的10堂課」之第5課
Page 8: 20130708 「架站前一定要上的10堂課」之第5課

搜尋一定要讓大家容易使用

•如何問要找的東西?很難?

•讓搜尋變「容易」:1. 用搜尋建議(Query Suggester)等構詞工具來協助克服「查詢瓶頸」。

2. 利用垂直搜尋(Vertical search)和首選(Best bets)等消除歧義工具。

3. 最後要給予答案,不要只是連結到可能擁有答案的頁面。

Page 10: 20130708 「架站前一定要上的10堂課」之第5課
Page 11: 20130708 「架站前一定要上的10堂課」之第5課
Page 12: 20130708 「架站前一定要上的10堂課」之第5課

垂直搜尋 Vertical search

•垂直搜尋用於僅搜尋寬廣文件世界中特定子集的搜尋引擎。Vertical search is used by a search engine that explicitly only searches within a particular subset of the vast world of documents.

Page 13: 20130708 「架站前一定要上的10堂課」之第5課
Page 14: 20130708 「架站前一定要上的10堂課」之第5課

人工消除歧義

•首選

•你要怎麼提供首選?(長尾理論)

•分析頭部:蒐集最熱門的搜尋、按照查詢類型進行分類、為其設計首選。

Page 15: 20130708 「架站前一定要上的10堂課」之第5課

搜尋一定要神奇

•個人化搜尋1.著眼於你的過往歷史,從你做過的事來進一步了解你。2.著眼於你此刻所處的任務情境,期盼能從中理出你在找什麼的線索。

3.從對你有點了解,知道你一些的社交、地理、人口統計資料情境等相關資訊,期盼在該情境內的思考具有某種相似性或者至少在談到共同利益和意圖時如此。(EX:推薦有興趣的文章、你也許有興趣看的文章…)

Page 16: 20130708 「架站前一定要上的10堂課」之第5課

One More Thing

•網站直接使用「Google自定搜尋」,好不好?

Page 17: 20130708 「架站前一定要上的10堂課」之第5課

參考或補充資料

•資訊架構學(北極熊)第8章搜尋系統http://www.slideshare.net/readbook2tw/ch8-5302879

• Google 搜尋主頁http://www.google.com/insidesearch/

• Google 網站管理員工具https://support.google.com/webmasters/

• Google 搜尋引擎最佳化初學者指南(PDF)http://goo.gl/9Tn3J

Page 18: 20130708 「架站前一定要上的10堂課」之第5課

下課~~