多媒体搜索引擎

15
多多 多多多多 多多

Upload: micah-mercado

Post on 31-Dec-2015

29 views

Category:

Documents


2 download

DESCRIPTION

多媒体搜索引擎. 复习. 期末考试. 时间 6 月 27 号 15:30-17:30 地点 数学馆西 113 考场纪律 手机关机 不使用计算器 没有复杂计算 不使用除电子钟外的任何电子设备. 考试内容. 传统搜索引擎 数据压缩 多媒体内容理解 多媒体搜索引擎. 4. 输入. 2. 理解. 5. 显示. 3. 索引. 1. 获取 / 存储. 传统搜索引擎. 五大部分及其相互关系、功能. 信息. 传统搜索引擎. 布尔检索 关键字检索概念 关键字的布尔运算 倒排文件 基于倒排文件的快速布尔运算 关键字的索引结构 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 多媒体搜索引擎

多媒体搜索引擎

复习

Page 2: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 2

期末考试时间

6 月 27 号 15:30-17:30地点

数学馆西 113考场纪律

手机关机 不使用计算器

没有复杂计算 不使用除电子钟外的任何电子设备

Page 3: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 3

考试内容传统搜索引擎数据压缩多媒体内容理解多媒体搜索引擎

Page 4: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 4

传统搜索引擎五大部分及其相互关系、功能

信息

1. 获取 / 存储

2. 理解3. 索引

4. 输入

5. 显示

Page 5: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 5

传统搜索引擎布尔检索

关键字检索概念 关键字的布尔运算 倒排文件

基于倒排文件的快速布尔运算 关键字的索引结构

二叉树, Hash , Trie

Page 6: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 6

传统搜索引擎词典建立

分词 正则式匹配 词典分词

正向最大匹配,反向最大匹配,双向匹配 禁用词表 归一化 拼写矫正与近音替换

Page 7: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 7

传统搜索引擎查询结果处理

排序 词频,非线性词频 tf-idf

SEO SPAM 基于链接的排序

PageRank HITS

Page 8: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 8

传统搜索引擎相关反馈

原理,实现方法 优点,缺点

性能评价 性能指标

精度、查全率、 F-score 相互关系

Page 9: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 9

数据压缩多媒体信息表示

文字 codepage

声音、图像 采样:时域 / 空域 / 频域,信号带宽,采样定理 量化:量化噪声,信噪比,非均匀量化

Page 10: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 10

数据压缩多媒体数据压缩

数据可压缩的原理:冗余 信息论

熵:定义,计算方法 熵编码

霍夫曼编码 霍夫曼树:构造,使用 计算平均码长

算术编码 原理

Page 11: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 11

数据压缩多媒体数据压缩

字典编码 原理: LZ77, LZ78 优点,缺点

预测编码:原理,优点,缺点 变换编码

DCT ,小波 原理,优点,缺点 心理视 / 听觉模型

Page 12: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 12

多媒体内容理解步骤

分割,特征提取,分类分割

图像分割 前 / 背景分割:最大熵,松弛算法 对象分割:边缘检测,聚类 (MeanShift)

视频分割镜头分割

Page 13: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 13

多媒体内容理解特征提取

颜色 平均颜色,颜色矩,各种颜色直方图

纹理灰度共生矩阵, Tamura颜色特征, Gabor 特

征形状

面积、周长、圆度……傅立叶描述子

Page 14: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 14

多媒体内容理解特征提取

特征降维目的,方法(主分量分析,分组降维)

分类 线性分类器

原理,做法训练方法:方程组求解, SVM

概率分类器: GMM , EM

Page 15: 多媒体搜索引擎

2023年4月19日 星期三

Multimedia Search Engine 15

多媒体搜索引擎高维索引

目的,概念,原理 最近邻查询,范围查询

K-d-b树, R- 树,基于空间分割的高维索引多媒体查询输入

关键字, QBE ,草图,…… 可视化推荐 各自的优缺点