电影推荐算法大赛

9

Yue Lin ([email protected]) NetEase, Guangzhou (2010.9 – 2013.3) Computer Science Department, Zhejiang University 电电电电电电电电

Upload: illiana-avila

Post on 01-Jan-2016

61 views

Category:

Documents

1 download

Report

Download

Embed Size (px):

DESCRIPTION

电影推荐算法大赛. Yue Lin ( [email protected] ) NetEase , Guangzhou (2010.9 – 2013.3) Computer Science Department, Zhejiang University. 经典算法. Item Based User Based SVD SVD++ AFM …. 效果并不理想，最好的只能达到 0.6170 左右。原因是没有挖掘数据中的一些潜在的规律。. 通用的推荐工具. LibFM ( Steffen Rendle ) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 电影推荐算法大赛

Yue Lin ([email protected])

NetEase, Guangzhou(2010.9 – 2013.3) Computer Science Department, Zhejiang University

电影推荐算法大赛

Page 2: 电影推荐算法大赛

经典算法Item BasedUser BasedSVDSVD++AFM…

效果并不理想，最好的只能达到 0.6170左右。原因是没有挖掘数据中的一些潜在

的规律。

Page 3: 电影推荐算法大赛

通用的推荐工具LibFM (Steffen Rendle)SVDFeature ( 上海交通大学 Apex 实验室 )Gibhub 中的一些开源代码…

经过测试，决定使用较方便的 LibFM 工具。

Page 4: 电影推荐算法大赛

LibFM 的特征构造方法

From Steffen’s KDDCup 2012 ppt

Page 5: 电影推荐算法大赛

LibFM 基本原理

From Steffen’s KDDCup 2012 ppt

Page 6: 电影推荐算法大赛

LibFM 使用的 Feature Feature 1: 用户 id Feature 2 ：电影 id Feature 3 ：用户在看这部电影之前看过的几部电影的评分 ( 猜测

user_history 是按时间排序的，可以从 user_history 中获得 ) Feature 4: 用户在看这部电影之后看过的几部电影的评分 Feature 5 ：电影所对应的 tag Feature 6 ：与当前用户最相似的 K 个用户，衡量标准是 Jaccard 相似

系数 ( 用户共同看过的电影与两者看过电影的并集的比例 ) Feature 7 ：与当前电影最相似的 K 部电影，衡量标准是 Jaccard 相似

系数 ( 同时看过这两部电影的用户数与看过两部电影中至少一部的用户数的比例 )

Feature 8 ：用户最喜欢的一些 tag ，统计用户看过的所有电影的tag ，取出现频率最高的几个 tag

Feature 9 ：用户看当前电影时，连续看了多少部电影。用户可能会一次连续看几部电影，这个长度也影响用户的评分

Feature 10 ：用户评分的分布。用户的评分在 1 ， 2 ， 3 ， 4 ， 5 的比率

Feature 11 ：电影评分的分布。用户对电影的评分在 1 ， 2 ， 3 ， 4 ， 5 的比率

Page 7: 电影推荐算法大赛

后续提升 - Classifier用前面的 Feature ，然后 LibFM 迭代 200

次， dim 用” 1,1,32” ，可以达到 0.6030 的结果。

所有的分数均为整数，并且 4 分的结果占了一半，根据 4 和非 4 ，我们可以训练出一个分类器，从时间上考虑，我们用了 LibLinear 工具中的Logistic Regression 的分类器方法进行训练，然后对于概率大于 85% 的判断为 4 分的数据，把LibFM 中对应的结果直接修改为 4 。 0.6030 -> 0.6023

Page 8: 电影推荐算法大赛

后续提升 - Ensemble最简单也相对合理的做法是离线做 Cross

Validation ，用 Linear Regression 的办法得到各个算法的结果所占的系数。

时间比较仓促，最后选择了人工 Ensemble ，最后用了 SVD ， SVD++ ， AFM ， LibFM 的结果进行了 Ensemble ，结果提升： 0.6023 -> 0.5977 ，可以看到即使是简单的人工Ensemble ， performance 都有了很大的提升。

Page 9: 电影推荐算法大赛

Thank You!

保荐人（主承销商）static.sse.com.cn/stock/information/c/202009/571bb384fbf...国网浙江省电力有限公司专利权维持变电站智能辅助系统、变电站智

投资评级：推荐（首次）增长动力：传统产品持续升级，电动化、pg.jrj.com.cn/acc/Res/CN_RES/STOCK/2019/11/19/bd05... · 品。赛科利模具一方面布局轻量化铝构件，斩获国产特斯拉铝合金电池托

2013“ 市长杯”创意杭州工业设计大赛 ----- 惠宝机电分赛场惠宝杯

第六届“博导前程杯” 全国电子商务运营技能竞赛省区 …resource.ibodao.com/race2018/...第1页第六届“博导前程杯” 全国电子商务运营技能竞赛省区赛规程

· Web view2016年全国职业院校技能大赛高职组 “ 风光互补发电系统安装与调试 ”赛项. 规程. 一、赛项名称. 赛项编号：GZ-047. 赛项名称：风光互

电影推荐算法 - USTChome.ustc.edu.cn/~tangao/downloads/MRS.pdf · "The bellkor solution to the netflix grand prize." Netflix prize documentation (2009). Title: 电影推荐算法

第35 届天津市青少年科技创新大赛区级推荐项目数量汇总表tianjin.xiaoxiaotong.org/AttachFile/2019/9/... · 2 . 第. 35 届天津市青少年科技创新大赛

电子竞赛之 C 语言应用

数据挖掘竞赛经验分享 -- 个性化推荐，搜索广告，RTB

数据挖掘比赛入门以去年阿里天猫推荐比赛为例

2019 年西安电子科技大学程序设计新生赛网络赛acm.xidian.edu.cn › download › 2019freshmen-online.pdf · 2019年西安电子科技大学程序设计新生赛网络赛

2020 年全国职业院校技能大赛改革试点赛赛项规程...2020/09/30 · 2020年全国职业院校技能大赛改革试点赛 ZZ-2020002汽车机电维修赛项竞赛赛卷

jyt.jiangxi.gov.cnjyt.jiangxi.gov.cn/.../28/6C9927452D6CB333734CC2F920C… · Web view2019. 8. 26. · 电话：0792-8366140，13635977883. 竞赛用QQ群：高职学前教育技能大赛QQ群，821679198

外语赛场我是冠军全能 A820 电子辞典

保荐机构（主承销商）static.sse.com.cn/stock/information/c/202006/a38824df5ca44c1089… · 电对接机构保护充电头，不易短路；充电完成，自动封闭，自动化程度较高。

业余无线电测向竞赛规则 - sports.cnxhimg.sports.cn/Image/soft/190710/6-1ZG022561D61.pdf1 业余无线电测向竞赛规则（中国无线电和定向运动协会2019年2月修订）

2018年全国青少年无线电通信锦标赛应急通信营地设立赛小组赛 …xhimg.sports.cn/Image/soft/190402/6-1Z40211092N61.pdf · 2018年全国青少年无线电通信锦标赛

IP6806 - INJOINIC · 保护温度70 度电阻推荐如下：RNTC=100K@25 度 B=3950，R _ Setpoint1=7.5K 欧姆，R _ Setpoint2 NC；保护温度50 度电阻推荐如下：RNTC=100K@25

电子资源推荐 - hs.lib.tsinghua.edu.cnhs.lib.tsinghua.edu.cn/sites/default/files/20160510-电子资源推介.pdf · 电子资源推荐共享智慧，傳承文明！中华经典古籍库再次开通试用(2016年5月6日-2016年12月31日)

2012 年湖北省电子竞赛培训

2012 年全国大学生光电设计大赛赛题介绍

2017 年 NESO 全国电子竞技公开赛盛大举行jrwh.cdwh.gov.cn/Upload/doc/2017/12/21/1513826805.pdf · 2017 年 neso 全国电子竞技公开赛盛大举行我区连续承办

bj.bcebos.com · Web view室外电磁赛道铺设补充说明第十四届智能车竞赛室外电磁组比赛，比赛没有赛道，只有电磁引导线。赛道元素包括有直道、弯道、坡道、十字路口以及横断路障等。

2017年1~3月中国电竞产业报告 · DXRacer 参赛俱乐部特别邀请队伍 EG、Wings、 OG、Newbee 中国区预选赛胜者 iG、VGJ、 iG.V、LFY 其他区预选赛胜者

TechShanghai2016 - 赛普拉斯无电池能量收集解决方案

第二届（2020eda.icisc.cn/file/cacheFile/78e137caced24dd1b6279dc3a832245b.pdf · 第二届（2020年）集成电路EDA设计精英挑战赛赛题指南一、赛题一：基于虚拟原型平台探索软硬件协同设计

hbszjs.hebtu.edu.cnhbszjs.hebtu.edu.cn/jnds/upload/2020/2020-11/1e1f... · Web view2021年. 河北省职业院校学生技能大赛. 赛项申报表. 赛项名称：跨境电商技能大赛

定向猎狐无线电测向竞赛 ( 方法 )

€¦ · Web view附件一：管理学院赛项规程. 2019安徽工商职业学院“电子商务技能”赛项规程. 一、赛项名称. 赛项名称：电子商务技能. 赛项

每周推荐猛虎和蔷薇...2009/10/23 · 主编：宋鸽电话：010-82296728 编辑：崔斌斌电话：010-82296572 投稿邮箱：[email protected] 美编：孙东电话：010-82296729

{,N]SUrGg: ºW[ 全书共8章,内容包括:微控制器电路模块制作,微控制器外围电路 ... 训练(第2版)》、《全国大学生电子设计竞赛制作实训(第2版)》、《全国大学生电子设计竞赛常

中国大学生跨境电商创新创业大赛参赛手册cy.dgut.edu.cn/__local/3/AA/8E/2F31AC57DD7E9F547E... · 内容为跨境电商平台运营能力，如阿里巴巴国际站、敦

· Web viewWord文档 1 电子教材赛后3个月技能训练指导书 Word文档 1 电子教材赛后3个月大赛作品集 ... a）在ZX垂直平面内 b）在XY垂直平面内

ELECRAFT KX3 超便携 - HELLOCQ · 11/16/2012 · 惯左手，将kx3 顺时针转动。电源对于固定电台使用，推荐低噪声12-14v 直流电源或电池。（见49

中国科学院院士增选被推荐人附件材料...南京市江苏路172号 210009 单位电话 02583759984 住宅电话 0255*****55 电子邮箱 [email protected] 传真 02583759310