多媒体搜索引擎
DESCRIPTION
多媒体搜索引擎. 复习. 期末考试. 时间 6 月 27 号 15:30-17:30 地点 数学馆西 113 考场纪律 手机关机 不使用计算器 没有复杂计算 不使用除电子钟外的任何电子设备. 考试内容. 传统搜索引擎 数据压缩 多媒体内容理解 多媒体搜索引擎. 4. 输入. 2. 理解. 5. 显示. 3. 索引. 1. 获取 / 存储. 传统搜索引擎. 五大部分及其相互关系、功能. 信息. 传统搜索引擎. 布尔检索 关键字检索概念 关键字的布尔运算 倒排文件 基于倒排文件的快速布尔运算 关键字的索引结构 - PowerPoint PPT PresentationTRANSCRIPT
多媒体搜索引擎
复习
2023年4月19日 星期三
Multimedia Search Engine 2
期末考试时间
6 月 27 号 15:30-17:30地点
数学馆西 113考场纪律
手机关机 不使用计算器
没有复杂计算 不使用除电子钟外的任何电子设备
2023年4月19日 星期三
Multimedia Search Engine 3
考试内容传统搜索引擎数据压缩多媒体内容理解多媒体搜索引擎
2023年4月19日 星期三
Multimedia Search Engine 4
传统搜索引擎五大部分及其相互关系、功能
信息
1. 获取 / 存储
2. 理解3. 索引
4. 输入
5. 显示
2023年4月19日 星期三
Multimedia Search Engine 5
传统搜索引擎布尔检索
关键字检索概念 关键字的布尔运算 倒排文件
基于倒排文件的快速布尔运算 关键字的索引结构
二叉树, Hash , Trie
2023年4月19日 星期三
Multimedia Search Engine 6
传统搜索引擎词典建立
分词 正则式匹配 词典分词
正向最大匹配,反向最大匹配,双向匹配 禁用词表 归一化 拼写矫正与近音替换
2023年4月19日 星期三
Multimedia Search Engine 7
传统搜索引擎查询结果处理
排序 词频,非线性词频 tf-idf
SEO SPAM 基于链接的排序
PageRank HITS
2023年4月19日 星期三
Multimedia Search Engine 8
传统搜索引擎相关反馈
原理,实现方法 优点,缺点
性能评价 性能指标
精度、查全率、 F-score 相互关系
2023年4月19日 星期三
Multimedia Search Engine 9
数据压缩多媒体信息表示
文字 codepage
声音、图像 采样:时域 / 空域 / 频域,信号带宽,采样定理 量化:量化噪声,信噪比,非均匀量化
2023年4月19日 星期三
Multimedia Search Engine 10
数据压缩多媒体数据压缩
数据可压缩的原理:冗余 信息论
熵:定义,计算方法 熵编码
霍夫曼编码 霍夫曼树:构造,使用 计算平均码长
算术编码 原理
2023年4月19日 星期三
Multimedia Search Engine 11
数据压缩多媒体数据压缩
字典编码 原理: LZ77, LZ78 优点,缺点
预测编码:原理,优点,缺点 变换编码
DCT ,小波 原理,优点,缺点 心理视 / 听觉模型
2023年4月19日 星期三
Multimedia Search Engine 12
多媒体内容理解步骤
分割,特征提取,分类分割
图像分割 前 / 背景分割:最大熵,松弛算法 对象分割:边缘检测,聚类 (MeanShift)
视频分割镜头分割
2023年4月19日 星期三
Multimedia Search Engine 13
多媒体内容理解特征提取
颜色 平均颜色,颜色矩,各种颜色直方图
纹理灰度共生矩阵, Tamura颜色特征, Gabor 特
征形状
面积、周长、圆度……傅立叶描述子
2023年4月19日 星期三
Multimedia Search Engine 14
多媒体内容理解特征提取
特征降维目的,方法(主分量分析,分组降维)
分类 线性分类器
原理,做法训练方法:方程组求解, SVM
概率分类器: GMM , EM
2023年4月19日 星期三
Multimedia Search Engine 15
多媒体搜索引擎高维索引
目的,概念,原理 最近邻查询,范围查询
K-d-b树, R- 树,基于空间分割的高维索引多媒体查询输入
关键字, QBE ,草图,…… 可视化推荐 各自的优缺点