基于回归分析的 vod 视频流行度预测的研究

18
基基基基基基基 VoD 基基基基基基 基基基基 刘刘 刘刘 刘刘刘刘刘刘刘 刘刘 刘刘刘 刘刘刘刘 刘刘刘

Upload: giacomo-allen

Post on 01-Jan-2016

153 views

Category:

Documents


1 download

DESCRIPTION

基于回归分析的 VoD 视频流行度预测的研究. 刘源 专业:计算机应用技术 导师:王宗敏 指导老师:李润知. 主要内容. 背景介绍 回归分析 方法 流行度预测 方法 实验数据采集 数据处理与分析 缓存替换算法 总结与下一步工作. 背景介绍. 现状 当前网络视频流量约占互联网总流量的八成 网络 视频占用存储空间大,支持视频 VOD 对带宽、延迟要求高 当视频服务遇见云 服务 可 灵活调整 的 存储空间 可 灵活 调度的视频数据. 背景 介绍( 2 ). 问题 :在分布式云存储中,各站点为它所处在域的用户提供 服务,而站 点 的储存空间和带宽资源 有限 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 基于回归分析的 VoD 视频流行度预测的研究

基于回归分析的 VoD视频流行度预测的研究

刘源 专业:计算机应用技术 导师:王宗敏 指导老师:李润知

Page 2: 基于回归分析的 VoD 视频流行度预测的研究

背景介绍回归分析方法流行度预测方法实验数据采集数据处理与分析缓存替换算法总结与下一步工作

主要内容

2

Page 3: 基于回归分析的 VoD 视频流行度预测的研究

现状当前网络视频流量约占互联网总流量的八成网络视频占用存储空间大,支持视频 VOD 对带宽、延迟

要求高当视频服务遇见云服务

可灵活调整的存储空间可灵活调度的视频数据

背景介绍

3

Page 4: 基于回归分析的 VoD 视频流行度预测的研究

问题:在分布式云存储中,各站点为它所处在域的用户提供服务,而站点的储存空间和带宽资源有限需要预取可能会流行的视频需要对视频流行度的研究需要缓存替换算法,替换掉“过时的”视频

背景介绍( 2)

4

Page 5: 基于回归分析的 VoD 视频流行度预测的研究

衰减函数法 [5]:回归分析法

统计学上分析数据的方法,主要是希望探讨数据之间是否有一种特定关系 , 目的在于找出一条最能够代表所有观测资料的函数

回归模型:将因变量和一个关于自变量和未知参数的函数关联起来。

参数估计 : 最小化残差平方和

回归分析方法 (1)

5

Page 6: 基于回归分析的 VoD 视频流行度预测的研究

几种常见的回归模型线性:指数型:幂型:相加型:

指数和指数相加型: 指数和幂相加型:

回归分析方法 (2)

6

Page 7: 基于回归分析的 VoD 视频流行度预测的研究

预测视频流行度的几种策略固定的回归模型 (FRS) :可以更新的回归模型 (CRU) :参考历史数据的固定回归模型 (HU[3]) :

其中参考历史数据的可以更新的回归模型 (CRHU[3]) :

流行度预测

7

Page 8: 基于回归分析的 VoD 视频流行度预测的研究

土豆网的视频开放平台可以通过 URL 命令来获取返回结果

通过查询,获得视频的 Codes 集 获取视频信息

http://api.tudou.com/v3/gw?method=item.info.get&appKey=myKey&format=xml&itemCodes=oR16C1xZDRM&ceiling=10

通过 Tiny XML 解析器的接口提取播放次数按时间与播放次数对应的格式存入文本文件

获取了土豆网 20 个分类 2000 多个视频两个月的播放次数(每天两次)

数据采集

8

Page 9: 基于回归分析的 VoD 视频流行度预测的研究

Getplaytime (for VideoObject V i)While(not finished){//从文本文档中读取需要获取的土豆网的视频 code列表,生成请求命令sreq=ReadCodeSet( V i);//建立 socket,与土豆网 API服务器建立链接,发送请求命令,获得返回的 xml结果resultdata=Send(sreq);if(resultdata不为空 ){//在返回的 xml结果中查找视频的播放次数playtime=Findplaytime(resultdata);//在文本文档中存储当前时间和视频的播放次数 StoreCodeSet(playtime);}}

数据采集 (2)

9

Page 10: 基于回归分析的 VoD 视频流行度预测的研究

用 MATLAB 对数据文本文件进行处理、分析获取新增请求次数:总播放次数相减

数据处理 (1)

10

Page 11: 基于回归分析的 VoD 视频流行度预测的研究

数据去周期化:

数据处理 (2)

11

Page 12: 基于回归分析的 VoD 视频流行度预测的研究

由数据计算出几种不同类型的回归模型函数计算出标准化残差平方和选出回归模型

数据分析

12

线性

指数型 幂型 指指加型

指幂加型

最优模型

剧情 1 0.3898 2.7700

0.0580

0.0472

指幂加型

喜剧 1 0.7002 0.5302

2.8056

2.8064

幂型

动作 1 0.6815 0.3524

1.9134

1.9134

幂型

卡通 1 0.6178 3.1320

0.1545

0.1980

指指加型

爱情 1 0.4158 8.1511

1.0083

1.0561

指数型

恐怖 1 0.6169 2.7038

1.9438

0.8400

指数型

Page 13: 基于回归分析的 VoD 视频流行度预测的研究

数据分析 (2)

13

Page 14: 基于回归分析的 VoD 视频流行度预测的研究

基于流行度增益的缓存替换算法考虑当前流行度 考虑流行度变化趋势总缓存增益

替换算法流程计算给定媒体对象的缓存增益能容纳下要缓存的文件时,删除缓存中增益最小的文件将要缓存的文件存入缓存

缓存替换算法

14

Page 15: 基于回归分析的 VoD 视频流行度预测的研究

几种回归模型对流行度预测的几种策略获取视频网站上视频播放次数信息的一种方法对播放次数数据进行处理、分析一种基于流行度预测的缓存替换算法

总结

15

Page 16: 基于回归分析的 VoD 视频流行度预测的研究

改进缓存替换算法计算其复杂度与其他算法进行对比优劣进行模拟验证

验证缓存替换算法是否能在线动态预测

下一步工作

16

Page 17: 基于回归分析的 VoD 视频流行度预测的研究

[1]B.Hayes,Cloud computing[J].Communications of the ACM,2008,51(7):9-17[2]郭红方 , 视频点播内容分发关键技术研究 [D],郑州大学 ,2012:83-85[3] http://zh.wikipedia.org/wiki/ 回归分析[4]Ng, D.M.P.; Wong, E.W.M.; Ko, K.T.; Tang, K.S.,"Trend analysis and prediction in multimedia-on-demand systems,"Communications, 2001. ICC 2001. IEEE International Conference on, vol.4, no., pp.1292-1298 vol.4, 2001 [5]“tudou”,http://www.tudou.com[6]Jin S, Bestavros A. Popularity-aware Greedy Dual-size Web ProxyCaching Algorithms[C]//Proceedings of ICDCS. 2000-06.

参考文献

17

Page 18: 基于回归分析的 VoD 视频流行度预测的研究

请各位老师、同学提问!感谢您提出的宝贵意见!

Q&A

18