第 3 章 音频信息及处理

42

Upload: summer-dean

Post on 01-Jan-2016

74 views

Category:

Documents


5 download

DESCRIPTION

第 3 章 音频信息及处理. 音频信号 数字音频原理 电子合成音乐 音频卡及音频播放 数字音频编辑与处理. 分类. 规则声音. 音效. 指人类熟悉的其他声音, 如动物发声、机器产生的声音、自然界的风雨雷电等。. 音乐. 规范的符号化了的声音. 注释. 视听效果. 不规则声音. 一般指不携带信息的噪声. 语音. 是指具有语言内涵和人类约定俗成的特殊媒体. 一、音频信号. 音频信号的分类. 一 . 音频信号. 1. 音频信号的特征. 音调与基频. 音阶与基频的对应关系. 音色与谐波 音强与幅度 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第 3 章   音频信息及处理
Page 2: 第 3 章   音频信息及处理

第 3 章 音频信息及处理

• 音频信号• 数字音频原理• 电子合成音乐• 音频卡及音频播放• 数字音频编辑与处理

Page 3: 第 3 章   音频信息及处理

一、音频信号

分类 注释 视听效果

不规则声音 一般指不携带信息的噪声

语音 是指具有语言内涵和人类约定俗成的特殊媒体

规则声音 音乐 规范的符号化了的声音

音效

指人类熟悉的其他声音,如动物发声、机器产生的声音、自然界的风雨雷电等。

音频信号的分类

Page 4: 第 3 章   音频信息及处理

一 . 音频信号1. 音频信号的特征

Page 5: 第 3 章   音频信息及处理

•音调与基频

音阶 C D E F G A B

简谱符号 1 2 3 4 5 6 7

频率( Hz ) 261 293 330 349 392 440 494

频率(对数) 48.3 49.3 50.3 50.8 51.8 52.8 53.8

o音阶与基频的对应关系

n

nnAf nnSin

0t )()t( o0

Page 6: 第 3 章   音频信息及处理

•音色与谐波•音强与幅度 用动态范围来定义音频信号的相对强度: 动态范围= 2 0×lg (信号的最大强度 / 最小强度( d

B )

n

nnAf nnSin

0t )()t( oo0

onnA

Page 7: 第 3 章   音频信息及处理

音宽与频带

语 音 ( Speech ) 带宽

音 频 ( Audio ) 带宽

次声带 超声带

20 300 3K 20K f(Hz)

Page 8: 第 3 章   音频信息及处理

2. 音频信号的指标•频带宽度 声音质量等级与信号带宽

电话

AM 广播

FM 广播

CD - DA

10 20 50 200 3.4K 7K 15K 22K f( Hz )

Page 9: 第 3 章   音频信息及处理

•动态范围 2 0×lg (信号的最大强度 / 最小强度)( dB )•信噪比

噪声的平均功率有用信号的平均功率SNR

Page 10: 第 3 章   音频信息及处理

声音质量 MOS 标准

分数 质量级别 失真级别

5 优 ( Excellent ) 察觉不到

4 良 ( Good ) (刚)察觉但不讨厌

3 中 ( Fair ) (察觉)及有点讨厌

2 差 ( Poor ) 讨厌而不反感

1 劣 ( Bad ) 极讨厌(令人反感)

Page 11: 第 3 章   音频信息及处理

二、 数字音频原理

1. PCM (脉冲编码调制)编码原理

模拟声波的数字化示意图

tt t

Page 12: 第 3 章   音频信息及处理

t

模拟输入

t0

t0

采样时钟

量化,编码

0

t

X(0) X(1)… X(n)…

Page 13: 第 3 章   音频信息及处理

2. 数字音频的技术指标

• 采样频率 1 秒钟内采样的次数 , 标准频率 : 44.1kHz , 22.05kHz, 11.025kHz

• 声道数:单声道,双声道

Page 14: 第 3 章   音频信息及处理

• 量化位与动态范围

量化位数 幅值 动态范围 (dB ) 效果

8 256 48 数字电话

16 64K 96 CD-DA

60 FM 广播

40 AM 广播

Page 15: 第 3 章   音频信息及处理

• 音频数据率未经压缩的数字音频数据率( bit/s )= 采样频率( Hz ) × 量化位数 ( bit ) × 声道数音频数据量( Byte )= 数据率( bit/s ) × 持续时间( s ) / 8

例:采样率 11.025KHz 、量化位 8 位,采集 1 分钟, 则:音频数据率= 11.025 ( KHz ) ×8 ( bit )

= 88.2 (Kbit/s)音频数据量= 11.025 ( KHz ) ×8 ( bit ) ×1 ×60 ( s ) /8 = 0.66 (MByte)

Page 16: 第 3 章   音频信息及处理

• 编码算法与音频数据压缩比

压缩前的音频数据量压缩后的音频数据量音频数据压缩比

Page 17: 第 3 章   音频信息及处理

不同的采样指标与容量和效果的关系

采样率(kHz)

量化位(bit)

声道 编码算法 容量 (M

B/min)等效音质

11.025

8 单 PCM 0.66 语音

22.05 16 双 PCM 5.292 FM 广播

44.1 16 双 PCM 10.584 CD 唱盘

Page 18: 第 3 章   音频信息及处理

3. 音频的压缩与文件格式

PCM :一种最通用的无压缩编码, CD-DA 采用的方式ADPCM :一种通用的有损压缩编码 压缩比达 1 : 4 WAV 文件:一种通用的音频数据文件, 采用 PCM,ADPCM 编码

• PCM 编码与 WAV 文件格式

Page 19: 第 3 章   音频信息及处理

编码算法: MPEG Audio Layer 3 压缩比: 1:10 ~ 1:12

音质失真很小,适合网络传播

• MP3 编码与 MP3 文件

Page 20: 第 3 章   音频信息及处理

Real networks 推出的一种音乐压缩格式,压缩比达 1 : 96 ,效果一般

流媒体控制(边下载边播放 ),适合低速网传播

• Real Audio 编码与 RA 文件

Page 21: 第 3 章   音频信息及处理

4. 不同的参数与压缩效果比较

播放长度 /s

采样率 /kHz

量化位/bit

声道数 编码算法 文件

格式压缩

比文件容量 /

KB 视听

61 44.1 16 双 PCM wav 10759

61 22.05 16 单 PCM wav 2689

61 11.025 8 单 PCM wav 673

61 ADPCM wav 1:4 2697

61 mp3 mp3 977

61 ram ra 383

126 mp3 mp3 2026

126 ram ra 791

Page 22: 第 3 章   音频信息及处理

三 . 电子合成音乐1. 电子合成音乐( MIDI )的原理

MIDI ( Musical Instrument Digital Interface ) 采用音乐符号记录和解释乐谱,并合成相 应的音乐。 MIDI 不是把音乐的波形进行数字化采样和 编码,而是将数字式电子乐器的弹奏过程记录 下来,如按键、力度、时间多度等等。当需要 播放这首乐曲时,根据记录的乐谱指令,通过 音乐合成器生成音乐声波,经放大后由扬声器 播出。

Page 23: 第 3 章   音频信息及处理

2. 计算机上合成音乐的产生过程

MIDI 乐器 MIDI 接口

音序器

合成器 扬声器

MIDI 文件

MIDI 指令

模拟音频信号

PC机

音频卡

Page 24: 第 3 章   音频信息及处理

3. MIDI 音乐合成器

FM ( Frequency Modulation ) 合成 通过硬件产生正弦信号,再经处理合成音乐。 一般声卡采用的方式,音色与硬件有关,音 色较单薄

波形表( Wavetable )合成 专业声卡采用的方式。在声卡的 ROM 中预 存各种实际乐器的声音采样,通过调用相应的 实际声音数据合成乐音。 ROM 存储器的容量越 大,合成的效果越好。

Page 25: 第 3 章   音频信息及处理

4. WAVE 与 MIDI 文件的比较

MIDI WAVE文件内容 MIDI 指令 数字音频数据

音 源 MIDI 乐器 Mic ,磁带, CD 唱盘,音响

容 量 小 与音质成正比效 果 与声卡质量有关 与编码指标有关

适用性 易编辑,声源受限,数据量很小

不易编辑,声源不限,数据量大

实例 1

实例 2

容量 37KB , 2 分钟

容量 2MB , 1 分钟容量 3.6MB , 42 秒

容量 5KB , 53秒

Page 26: 第 3 章   音频信息及处理

四 . 音频卡及音频播放

1. 音频卡的功能– 音频信号的播放– 录制生成 WAVE 和 MIDI 文件– 声音信号的混合和处理

Page 27: 第 3 章   音频信息及处理

2. 音频卡的接口

Page 28: 第 3 章   音频信息及处理

3. 音频播放的控制

静音控制垂直滑键控制

水平滑键

Page 29: 第 3 章   音频信息及处理

五 . 数字音频编辑与处理

1. CoolEdit PRO 的功能– 声音文件的录制– 音频数据的简单编辑– CD 音乐提取– 音频的修复– 声音效果处理– 音频文件的格式转换– 声音文件的合成

Page 30: 第 3 章   音频信息及处理

2.界面与窗口

设备控制窗口

Page 31: 第 3 章   音频信息及处理
Page 32: 第 3 章   音频信息及处理

音频录制控制

Page 33: 第 3 章   音频信息及处理

六、提高数字录音质量 1 、选择一支合适的话筒• 按传输方式分类:有线和无线• 按能量转换方式分类: 动圈话筒 电容话筒

Page 34: 第 3 章   音频信息及处理

• 动圈话筒:由磁场中运动的导体产生电信号的话筒。是由振膜带动线圈振动,从而使在磁场中的线圈感应出电压。

电容话筒:这类话筒的振膜就是电容器的一个电极,当振膜振动,振膜和固定的后极板间的距离跟着变化,就产生了可变电容量,这个可变电容量和话筒本身所带的前置放大器一起产生了信号电压。

驻极体话筒:价廉物美的电容话筒。驻极体话筒不需要两块外加极化电压的极板,它使用的电容器在厂家制造时己进行了极化,并能保持永久性电荷。驻极体话筒需要—个放大 /阻抗变换器来代替低压电源。

• 电容话筒中有前置放大器,当然就得有一个电源,由于体积关系,这个电源一般是放在话筒之外的。除了供给电容器振膜的极化电压外,也为前置放大器的电子管或晶体管供给必要的电压。我们称它为幻象电源。

• 附属设备有:防震架、防风罩、防喷罩、话筒架

Page 35: 第 3 章   音频信息及处理

话筒的指向:心型、过心型、超心型、全向指向型、 8 字形、半球型

Page 36: 第 3 章   音频信息及处理

• 心形(单指向形)话筒:使用这种话筒时,应将它们直接指向你要拾取的声音所在的位置。心形话筒对于声乐演唱及其他近距离拾音效果很好,因为它们不受其后面声音的影响。因此在扩声和声增强应用中,心形话筒是一个较好的选择。那些对来自后面的声音也敏感的话筒不适用于舞台演出,因为它们会接收来自扬声器的反馈声音而产生自激和其他不利影响。

• 过心形话筒:保留了心形话筒的前方偏向性,它的后方灵敏度增加了。这种话筒在拾取需要通过后方反射音获得的乐器声和室内气氛声时效果很好。

• 超心形话筒:这个指向特性使话筒在前方的拾音范围很宽,呈稍微前倾的 180 ,而后方拾音范围只是窄窄的一束。超心形话筒适合于拾取管号类演奏或仅用一个话筒的合唱。

Page 37: 第 3 章   音频信息及处理

• 全向形话筒:对各个方向都同等响应。其指向特性图在二维坐标中是—个圆,在三维坐标中是一个球。这类话筒在有回声的室内大合唱和大合奏中拾音效果很好,让你有身临卡内基音乐厅的感觉。

• 8 字形 ( 双向性话筒 ) :前面和后面的灵敏度高 ;左面和右面的灵敏度很低,选用 8 字形话筒拾取师生对话,两排乐队演奏,会议双方讨论的声音

• 半球话筒:对平板一侧整个半球区域内声压的响应特性都一样。

Page 38: 第 3 章   音频信息及处理

频率响应特性:话筒对不同音高信号的灵敏度

Page 39: 第 3 章   音频信息及处理

2 、保证良好的录音环境:

•隔音与吸音•混响时间在 0.2-0.5s之间•混响时间:当室内声场达到稳态 , 声源停止发声后 , 声压级降低 60dB所经历的时间。

Page 40: 第 3 章   音频信息及处理

演播室混响时间设计准则:“短”、“平”、”均”

• “短”:混响时间短;也绝非越短越好,就是供语言用的小演播室,混响时间不宜少于 0•30 秒。

• “平”:频率特性曲线平。• “均”.传声器拾音的好坏与传声器位置混响特性密切相关,故要求演播室混响声场均匀。这样可根据剧种 , 乐队等不同条件合理安排话筒的远近。

• 小型演播室吸声系数大致是 0.45 ~ 0.5 ,若地面铺设化纤地毯,对高频有一定吸音量,这就要求用复合结构来获得频带宽,效率高的吸声量。

• 电视演播室内有光滑平整的天幕,平顶上有庞大的空调设备和装有大量演出用的照明灯具,在演播过程中布景、道具摄象机、监视设备和演员,工作人员的活动,都会影响混响频率特性。故混响设计虽要求考虑多方因素,但重要的首先控制好低频混响。

Page 41: 第 3 章   音频信息及处理

3 、选择一块好声卡

Page 42: 第 3 章   音频信息及处理

Digi 002 Rack 音频接口 :一个功能完备的集成式制作系统,可工作在Window XP Home及 Mac OS9.x 系统的电脑上。 提供制作MIDI和音频各种必备的工具和功能。它由一个单个的控制单元构成,其中包含了综合控制台, 带模拟、数字和 MIDI输入 /输出接口。 Digi 002通过一条 FireWire火线连接电脑并传送数据。 控制台与 Pro Tools LE软件共同组成了系统,软件提供 32个音轨的录音和播放能力, 128个MIDI轨并支 持实时插件处理及其他功能。