"Анализ неявных предпочтений пользователей" — Михаил...

Download "Анализ неявных предпочтений пользователей" — Михаил Агеев, Яндекс, МГУ

If you can't read please download the document

Upload: yandex

Post on 16-Jun-2015

504 views

Category:

Technology


3 download

DESCRIPTION

Анализ неявных предпочтений пользователей, выраженных в переходах по ссылкам и длительности просмотра страниц, является важнейшим фактором ранжирования документов в результатах поиска или, например, показа рекламы и рекомендации новостей. Алгоритмы анализа кликов хорошо изучены. Но можно ли узнать что-то ещё об индивидуальных предпочтениях человека, используя больше информации о его поведении на сайте? Оказывается, траектория движения мыши позволяет узнать, какие фрагменты просматриваемого документа заинтересовали пользователя. В докладе речь пойдёт о методах сбора данных и алгоритмах анализа поведения пользователя по движениям мыши, а также о применении этих методов на практике. Они позволяют существенно улучшить формирование сниппетов (аннотаций) документов в результатах поиска. Будут представлены свободно доступный программный код, а также коллекция данных о поведении пользователей с привязкой к поисковому запросу. Мы надеемся, они вдохновят исследователей на создание новых методов анализа неявных поведенческих сигналов. Работа с описанием этих алгоритмов была отмечена дипломом «Best Paper Shortlisted Nominee» на международной конференции ACM SIGIR в 2013 году.

TRANSCRIPT

  • 1. 1

2. 2 3. 3 Emory Intelligent Information Access Lab Mikhail Ageev Dmitry Lagun Eugene Agichtein 4. 4 : ! Readability ! Representativeness , ! Judgeability , 5. 5 ! ! , ! ! 6. 6 : ! How many pixels must be dead on a iPad 3 before Apple will replace it? ! [how many dead pixels ipad 3 replace] ! iPad: 3 Dead Pixel -> Apple will replace a new LCD for you ! 7. 7 Q. Guo and E. Agichtein. Towards predicting web searcher gaze position from mouse movements. // CHI, 2010. ! : Find the worst drought that happened in the history of the US ! : [worst drought in US] The worst droughts in the history of the United States occurred during the 1930s and 1950s, periods of time known as 'Dust Bowl' years ! 8. 8 : ! (scroll, ) , ! JavaScript browser API ! 9. 9 ! ? SERP ! , ? : 400 ! ? 10. 10 ! ! , ! , ! () ! Web ! 11. 11 UFindIt: ! : ! URL ! Amazon Mechanical Turk HIT = 12 ! $1 25% ! ! ! : ReCaptcha + 12. 12 : Proxy + JavaScript ! HTTP reverse proxy HTML- JavaScript 13. 13 EMU.js: ! , ! 14. 14 ! ! URL ! ! : , , ! ( ) ! , 15. 15 ! http://ir.mathcs.emory.edu/intent/ 109 12 1,175 3,295 2,997 662 URL 1,454,257 707 -URL () 16. 16 ! ! , ! , ! () ! Web ! 17. 17 ! HTML- ! 6 (100px) (scrollbar) ! ! : GBRT 18. 18 ! , ! : , ! : Which metals float on water? : lithium, sodium, potassium 19. 19 (BScore), (ROUGE) 20. 20 ! DispMiddleTime , ! MouseOverTime , 21. 21 ! ! , ! , ! () ! Web ! 22. 22 : baseline D. Metzler and T. Kanungo. Machine learned sentence selection strategies for query-biased summarization. In SIGIR Learning to Rank Workshop, 2008. ! 22 (3 ) BM25-like (4 ) (3 ) : , , (9 ) 23. 23 ! baseline- TextScore(f) BScore(f) ! = baseline = ! : 24. 24 ! : Representativeness ? . Readability , ? Judgeability , ? 25. 25 ! Fraction improved: , ! Coverage: , baseline ! =0.7 26. 26 Baseline BeBS 27. 27 ! ! , ! , ! () ! Web ! 28. 28 - ! ! QA (IR Approach) (POS Tagging, NER), , 29. 29 ! Baseline algorithm: QANUS: open-source QA system from National University of Singapore (Min Yen Kan, 2010) ! BeQA: behavior-based QA QANUS fragment score TextScore(f) BScore(f) 30. 30 : ! rank - ! All: Clicked: , Relevant: , , 31. 31 ( ) ! : ! ! 32. 32 References ! Mikhail Ageev, Dmitry Lagun, Eugene Agichtein. Improving Search Result Summaries By Using Searcher Behavior Data // SIGIR 2013 ! Mikhail Ageev, Dmitry Lagun, Eugene Agichtein. The Answer is at your Fingertips: Improving Passage Retrieval for Web Question Answering with Search Behavior Data // EMNLP 2013 ! : http://ir.mathcs.emory.edu/intent/ 33. 33 34. 34 - +7(916)607-5072 [email protected] ..-..