§7 语音信号的同态滤波和倒谱分析

79
§7 语语语语语语语语语语语语语语 语语语语语语语语语语语 一、 语语语语语语 语语语语语语语语语语语语语语 语语语语语语 MEL 语语语语语语 (MFCC)

Upload: drew-hoover

Post on 13-Mar-2016

255 views

Category:

Documents


10 download

DESCRIPTION

§7 语音信号的同态滤波和倒谱分析. 一、同态信号处理的基本原理 二、复倒谱和倒谱 三、语音信号两个卷积分量的复倒谱 四、语音信号倒谱 五、 MEL 频率倒谱参数 (MFCC). 一、同态信号处理的基本原理. 1. 同态信号处理的作用. 同态信号处理也称为同态滤波,实现将 卷积关系和乘积关系变换为求和关系的分离处理。 × ,* +, 将非线性信号处理变为线性信号处理的过程。. 语音信号 x(n) 可视为声门激励信息 u(n) 及声道响应脉冲响应 h(n) 的卷积 :x(n)=u(n)*h(n) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: §7   语音信号的同态滤波和倒谱分析

§7 语音信号的同态滤波和倒谱分析

一、同态信号处理的基本原理

二、复倒谱和倒谱

三、语音信号两个卷积分量的复倒谱

四、语音信号倒谱

五、MEL频率倒谱参数 (MFCC)

Page 2: §7   语音信号的同态滤波和倒谱分析

一、同态信号处理的基本原理

1.同态信号处理的作用

同态信号处理也称为同态滤波,实现将卷积关系和乘积关系变换为求和关系的分

离处理。 ×, * +,将非线性信号处理变为线性信号处理的过程。

Page 3: §7   语音信号的同态滤波和倒谱分析

语音信号 x(n)可视为声门激励信息 u(n)及声道响应脉冲响应 h(n)的卷积 :x(n)=u(n)*h(n)

通过处理可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基

音周期。解卷积。

Page 4: §7   语音信号的同态滤波和倒谱分析

清 / 浊开关

基音周期

冲激序列发生器

随机噪声发生器

增益 G

u(n)

输出

语音

x(n)LPC系数a1,a2,… ap

声道模拟滤波器 H(z)

线性预测滤波器Hl(z)

u(n)

线性预测滤波器Hl(z) x(n)

Page 5: §7   语音信号的同态滤波和倒谱分析

2.同态信号处理的基本原理

进行如下处理:)()()( 21 nxnxnx

)(ˆ)(ˆ)(ˆ)](ˆ)(ˆ[)](ˆ[)3(

)(ˆ)(ˆ)(ˆ)(ln)(ln)(ln)2(

)()()()]([)1(

212111

2121

21

nxnxnxzXzXZzXZ

zXzXzXzXzXzX

zXzXzXnxZ

( 1)特征系统D*[] 完成将卷积信号转化为加性信号的运算。

Page 6: §7   语音信号的同态滤波和倒谱分析

( 2)逆特征系统D*-1[] ,恢复为卷积性信

号。进行如下处理:)(ˆ)(ˆ)(ˆ 21 nxnxnx

)()()]()([)()3(

)()()())(ˆexp()2(

)(ˆ)(ˆ)(ˆ)](ˆ[)1(

21211

21

21

nxnxzXzXZnx

zXzXzXzX

zXzXzXnxZ

Page 7: §7   语音信号的同态滤波和倒谱分析

a.第一步和第三步的运算相同。

b.第二步不同,前者是对数运算,后者是指数

运算。

( 3)特征系统 D*[]和逆特征系统 D*-1[]的区

Z exp Z-1

Z ln Z-1x(n)

x(n)

x(n)

x(n)

Page 8: §7   语音信号的同态滤波和倒谱分析

特征系统特征系统DD**[][]

逆特征系统逆特征系统DD**

-1-1[][]x(n)

x(n)

)()]([)6(

)()}(exp{ln)5(),(ln)]}([ln{)4(

)]([ln)3(),(ln)2(),()]([)1(

1

1

1

nxzXZ

zXzXzXzXZZ

zXZzXzXnxZ

验证一个时域信号经过同态处理,是否回到时域?

)()]]([[ *1

* nxnxDD

Page 9: §7   语音信号的同态滤波和倒谱分析

线性系统线性系统特征系统D*[]

逆特征系统逆特征系统DD**

-1-1[][]x(n)

*

y(n)

*

3.常见的同态信号处理系统

+ +

Page 10: §7   语音信号的同态滤波和倒谱分析

进行如下处理:)()()( 21 nxnxnx

)(ˆ)(ˆ)(ˆ)](ˆ)(ˆ[)](ˆ[)3(

)(ˆ)(ˆ)(ˆ)(ln)(ln)(ln)2(

)()()()]([)1(

212111

2121

21

nxnxnxzXzXZzXZ

zXzXzXzXzXzX

zXzXzXnxZ

( 1)第一个子系统特征系统D*[] 完成将卷积信号转化为加性信号的运算。

Page 11: §7   语音信号的同态滤波和倒谱分析

( 2)第二个子系统对加性信号进行所需要的线性处理(满足线性叠加原理等)

)](ˆ)(ˆ[)](ˆ[)(ˆ 21 nxnxLTInxLTIny

( 3)第三个子系统是逆特征系统D*-1[],使其

恢复为卷积性信号。

进行如下处理:)(ˆ)(ˆ)(ˆ 21 nynyny

)()()]()([)()3(

)()()())(ˆexp()2(

)(ˆ)(ˆ)(ˆ)](ˆ[)1(

21211

21

21

nynyzYzYZny

zYzYzYzY

zYzYzYnyZ

Page 12: §7   语音信号的同态滤波和倒谱分析

二、复倒谱和倒谱

1.复倒频谱域和复倒谱

和 信号也均是时域序列,可以

证明,实序列的复倒谱是一个实的时间序列,又

称之为复倒频谱域。 是 x(n)的复倒频谱,简称为复倒谱,有时也称为对数复倒谱。同

样 是 y(n)的复倒谱。

x(n)

y(n)

x(n) y(n

)

1 1 ˆˆ lnx(n) Z [ Z(x(n))] Z [X(z)]

Page 13: §7   语音信号的同态滤波和倒谱分析

一般的, X(z)、 Y(z) 和 、 的

收敛域包含单位圆,则可将 Z变换和反 Z变换用 傅立叶变换或离散傅立叶变换来代替,有:

☆复倒谱的傅立叶变换定义

X(z)

Y(z)

)](ˆ[))](([ln)(ˆ jweXIFTnxFTIFTnx

dweeXeXIFTnx

enxnxFTeX

jwnjwjw

N

n

jwnjw

)(21))(()(

)())(()(1

0

Page 14: §7   语音信号的同态滤波和倒谱分析

)](ˆ[)(ˆ)(ln)(ˆ)()]([

:[]*jw

jwjw

jw

eXIFTnxeXeXeXnxFT

D 特征系统

)]([)()](ˆexp[)(

)](ˆ[)(ˆ

:[]1*

jw

jwjw

jw

eXIFTnxeXeXnxFTeX

D逆特征系统

Page 15: §7   语音信号的同态滤波和倒谱分析

)](ˆ[))](([ln)(ˆ kXIDFTnxDFTIDFTnx

1

0

1

0

)(1))(()(

)())(()(

N

k

nkN

N

n

nkN

WkXN

kXIDFTnx

WnxnxDFTkX

☆复倒谱的离散傅立叶变换定义

Page 16: §7   语音信号的同态滤波和倒谱分析

特征系统

逆特征系统

)](ˆ[)(ˆ)(ln)(ˆ

)()]([:[]*

kXIDFTnxkXkXkXnxDFT

D

)]([)()](ˆexp[)()](ˆ[)(ˆ

:[]1*

kXIDFTnxkXkXnxDFTkX

D

Page 17: §7   语音信号的同态滤波和倒谱分析

FT ln IFT

Z ln Z-1x(n)

x(n)

x(n)

x(n)

求复倒谱

DFT

ln IDFTx(n)

x(n)

Page 18: §7   语音信号的同态滤波和倒谱分析

2. 复倒谱分析中的相位卷绕

ˆˆ( ) [ln ( )] [ ( )]

ln ( ) ln arg( ( ))| ( ) 2| j

j j

j j

x n IFT X e IFT X e

X e X Xj ke e

相位多值问题

)( jeX )(ˆ jeXOne to many

)(ˆ nx不确定

Page 19: §7   语音信号的同态滤波和倒谱分析

)(arg)(arg)(arg)(ln)(ln)(ln

)(ln)(ln)(ln

)()()(

)(*)()(

jjj

jjj

jjj

jjj

eHeUeXeHeUeX

eHeUeX

eHeUeX

nhnunx

)()()( hu )2,0()( u

)2,0()( h

( ) (0,2 ) ( ) ( ) 2

在求复倒谱时,限制

( ) (0,2 )

( ) ( ) (0, 2 )

由于语音是随机信号,这种限制不合理。解决的方法引入一个新的量倒谱来求复倒谱。

Page 20: §7   语音信号的同态滤波和倒谱分析

3. 倒谱)](arg[|)(|)(

jweXjjwjw eeXeX 取对数有:

)](arg[|)(|ln)(ˆ jwjwjw eXjeXeX

)(ˆ jweX 仍然是复数,只考虑其实部。令:

( ) [ln | ( ) |]( ) [ln ( ) ]

jwc n IFT X ec n IDFT X k

Page 21: §7   语音信号的同态滤波和倒谱分析

|])(|[ln)( jweXIFTnc

c(n)是序列 x(n)对数幅度谱的傅立叶逆变换,称为倒频谱,简称为倒谱,有时也称为对数倒频

谱,其量纲为时间。 c(n)就是要求取的语音信号倒谱特征。

FT ln|.|

IFTx(n)

c(n)

Page 22: §7   语音信号的同态滤波和倒谱分析

3.复倒谱和倒谱的关系

(1)复倒谱进行复对数运算,而倒谱只进行实对数运算。

(2)倒谱中丢失了信号原有的相位信息,因此序列 x(n)经过倒谱的特征系统和逆特征系统后,一般不能还原其自身。

FT ln|.|

IFTx(n)

c(n) FT ln IFTx(n

)x(n)

Page 23: §7   语音信号的同态滤波和倒谱分析

任何一个序列可写成偶对称序列和奇对称序列之和

)(ˆ)(ˆ)(ˆ 0 nxnxnx e

)](ˆ)(ˆ[21)(ˆ)],(ˆ)(ˆ[

21)(ˆ

)(ˆ)(ˆ),(ˆ)(ˆ

0

00

nxnxnxnxnxnx

nxnxnxnx

e

ee

)](ˆ[))](([ln)(ˆ jweXIFTnxFTIFTnx

(4)已知一个实数序列 x(n) 的复倒谱 ,可以由其求出倒谱 c(n)。

x(n)

Page 24: §7   语音信号的同态滤波和倒谱分析

)(ˆ)(ˆ21)(

)(|])(|[ln)]}(ˆ{Re[)(ˆ

)]}({Re[)(

nxnxnc

nceXIFTeXIFTnx

eXIFTnxjwjw

e

jwe

)](ˆ[))](([ln)(ˆ jweXIFTnxFTIFTnx

偶对称序列是序列频谱的实部的傅立叶反变换

Page 25: §7   语音信号的同态滤波和倒谱分析

才是一个因果稳定序列。)(ˆ nx

是一个最小相位序列)(nx

(5)已知一个实数序列 x(n)的倒谱 c(n) , 可以由其求出复倒谱 。x(

n)

X(z)的零极点都应该在单位圆内)(ˆ)(ln zXzX

X(z) 的零极点都是 的极点,因此只有 当它们都在单位圆内,才能使 的极点全

部在单位圆内。

)(ˆ zX

)(ˆ zX

Page 26: §7   语音信号的同态滤波和倒谱分析

0)(ˆ21

0)(ˆ

0)(ˆ21

)(ˆ)(

)](ˆ)(ˆ[21)(ˆ

nnx

nnx

nnx

nxnc

nxnxnx

e

e

000)(0)(2

)(ˆnnncnnc

nx 复倒谱和倒谱具有线性关系。

Page 27: §7   语音信号的同态滤波和倒谱分析

)()()( Nnannx 10 a

NazzX 1)( )1ln()(ln NazzX 1

1 1

( 1) ( )ˆ ( ) ln ( )k k k

Nk Nk

k k

a aX z X z z zk k

1

)()(ˆk

k

Nknkanx

)(ˆ nx

设序列求其复倒谱,大致画出其图形。

时域为有限长周期序列,复倒谱为无限长同周期衰减序列。

N 2N 3N 4N n

Page 28: §7   语音信号的同态滤波和倒谱分析

三、语音信号两个卷积分量的复倒谱 语音信号可看着声门激励信号和声道冲激响应信号的卷积。

进行如下处理:)()()( nhnunx

)(ˆ)(ˆ)(ˆ

)](ˆ)(ˆ[)](ˆ[)3(

)(ˆ)(ˆ)(ˆ)(ln)(ln)(ln)2(

)()()()]([)1(

nxnhnu

eHeUIFTeXIFT

eXeHeUeHeUeX

eHeUeXnxFT

jwjwjw

jwjwjwjwjwjw

jwjwjw

)(ˆ)(ˆ)(ˆ nhnunx 复倒谱关系式

Page 29: §7   语音信号的同态滤波和倒谱分析

时变数字滤波器( h(n))

x(n)

speech

u(n)

excitation

)()()( nhnunx

)(ˆ)(ˆ)(ˆ nhnunx

Page 30: §7   语音信号的同态滤波和倒谱分析

(1)发清音时,声门激励是频谱均匀的白噪声。(2)发浊音时,声门激励是以基音为周期的冲激序列。

主要考察浊音时的声门激励信号的复倒谱。

1.声门激励信号的复倒谱

Page 31: §7   语音信号的同态滤波和倒谱分析

M,r均为正整数

M

rpr rNnanu

0

)()(

ra 为幅度因子

pN 为用样点数表示的基音周期

n

u(n)

0 Np 2Np MNp

u(n)的幅度呈衰减趋势

Page 32: §7   语音信号的同态滤波和倒谱分析

(1)对 u(n)进行 Z变换

0

'

11

'0

0

2

0

2

0

10

0

11

1

)()(

aaa

zazaa

zaaz

aaz

aaa

zaznuzU

rr

M

r

Nr

M

r

Nr

MNMNN

M

r

rNr

n

n

pp

ppp

p

求 u(n)的复倒谱

M

rpr rNnanu

0

)()(

Page 33: §7   语音信号的同态滤波和倒谱分析

(2)对 U(z)取对数,并进行泰勒级数展开

M

r k

kNkr

M

r

Nr

p

p

zkaa

zaazUzU

1 10

10

ln

1lnln)(ln)(ˆ

rN

kN

k

krN

r

az

zkaza

p

pp

)())(1ln(1

1

Page 34: §7   语音信号的同态滤波和倒谱分析

(3) 对 进行逆 Z变换,求得 u(n)的复倒谱

00

110

1 10

1

ln)(

1)()(ln

)(1)(ln)](ˆ[)(ˆ

0akNn

ak

kNnna

kNnak

nazUZnu

kpk

M

r

krk

kpk

k

M

rp

kr

)(ˆ zU

Page 35: §7   语音信号的同态滤波和倒谱分析

结论:一个有限长的周期冲激序列,其复倒谱也是一个周期冲激序列,其周期不变,只是序列

变为无限长。同时其振幅随着 k的增大而衰减,衰减速度比原序列要快。

M

rpr rNnanu

0

)()(

0

)()(ˆk

pk kNnnu

Page 36: §7   语音信号的同态滤波和倒谱分析

n0 Np 2Np MNp

u(n)的幅度呈衰减趋势

n0Np 2Np MNp

)(ˆ nu

)(nu0a

00 ln a

M

r

krk a

k 1

1

Page 37: §7   语音信号的同态滤波和倒谱分析

2.声道冲激响应序列(1)对声道响应 h(n)用零极点来描述

oi

oi

p

kk

p

kk

m

kk

m

kk

zdzc

zbzaAzH

11

1

11

1

)1()1(

)1()1(||)(

ii pm , 分别为单位圆内的零、极点个数

00 , pm 分别为单位圆外的零、极点个数

1111 kkkk dcba

Page 38: §7   语音信号的同态滤波和倒谱分析

0

0

11

1

11

1

11

1

11

1

)1ln()1ln(

)1ln()1ln(||ln)(ln)(ˆ

)1()1(

)1()1(||)(

p

kk

p

kk

m

kk

m

kk

p

kk

p

kk

m

kk

m

kk

zdzc

zbzaAzHzH

zdzc

zbzaAzH

i

i

oi

oi

Qzz

nQ

Qz

QzznQ

Qz

n

n

n

n

n

n

1)1ln(

)1ln(

1

1

1

(2)对 H(z)取对数,并进行泰勒级数展开

Page 39: §7   语音信号的同态滤波和倒谱分析

kkkk

p

k n

nnk

p

k n

nnk

m

k n

nnk

m

k n

nnk

dz

bzczaz

zndz

nc

znbz

naAzHzH

oi

oi

11

||ln)(ln)(ˆ

1 11 1

1 11 1

Page 40: §7   语音信号的同态滤波和倒谱分析

(3) 对 进行逆 Z变换,求得 h(n)的复倒谱)(ˆ zH

)1()1()1(

)1()(ln)](ˆ[)(ˆ

00

111

1

1

nundnu

ncnu

nb

nunanAzHZnh

p

k

nk

p

k

nk

m

k

nk

m

k

nk

i

i

||||)1(1

1||)1(1

1

1

kn

nnkn

k

n

n

aznzanua

n

znznu

n

Page 41: §7   语音信号的同态滤波和倒谱分析

0

0

0||ln

)(ˆ

0

1 1

1 1

nnd

nb

nna

nc

nA

nhm

k

p

k

nk

nk

p

k

m

k

nk

nk

o

i i

结论 :(1)h(n)为有限长实序列,则其复倒谱是双边实序列

(2)由于 |ak|、 |bk|、 |ck|和 |dk|均小于

1,故复倒谱是衰减序列,随着 n的增大而衰减。

Page 42: §7   语音信号的同态滤波和倒谱分析

(3)复倒谱衰减速度快,更集中于原点附近,具 有短时性 ,用短时窗函数提取声道响应序列的复倒

谱是很有效的。

(4)如果 h(n)是最小相位序列,即 bk= 0和 dk

= 0,则复倒谱序列为因果稳定序列。因此,最小相位序列的复倒谱是因果稳定序列。

Page 43: §7   语音信号的同态滤波和倒谱分析

四、语音信号的倒谱

)()()( nhnunx

)()()( ncncnc hux 倒谱关系式

)()()(|])(|ln|)(|[ln|])(|[ln)3(

|)(|ln|)(|ln|)(|ln)2(

)()()()]([)1(

ncncnceHeUIFTeXIFT

eHeUeX

eHeUeXnxFT

hu

jwjwjw

jwjwjw

jwjwjw

|])(|[ln)( jweXIFTnc

Page 44: §7   语音信号的同态滤波和倒谱分析

由于倒谱和复倒谱之间的线性关系,因此有:

( 1) ch(n)的性质与 h(n)的复倒谱性质一

致,主要集中于原点附近。

( 2) cu(n)的性质与 u(n)的复倒谱性质一致,

呈现周期性 ,并且逐渐衰减。

( ) ( ) ( )x u hc n c n c n

Page 45: §7   语音信号的同态滤波和倒谱分析

0 50 100 150 200 250 300-1

-0.5

0

0.5

1

0 50 100 150 200 250 3000

0.2

0.4

0.6

0.8

Np 2Np

Page 46: §7   语音信号的同态滤波和倒谱分析

0 50 100 150 200 250 300-1

-0.5

0

0.5

1

0 50 100 150 200 250 3000

0.2

0.4

0.6

0.8

浊音信号

倒谱

Page 47: §7   语音信号的同态滤波和倒谱分析

0 50 100 150 200 250 300-1

-0.5

0

0.5

1

0 50 100 150 200 250 3000

0.2

0.4

0.6

0.8

1

图为一帧浊音信号的倒谱。一般人的基音周期的变化范围为 2.2ms至 20ms之间。若采样频率为 22.05kHz,则对应的样点数为: 49~441。

浊音信号

倒谱

周期

周期

基音

周期

Page 48: §7   语音信号的同态滤波和倒谱分析

0 50 100 150 200 250 300-0.4

-0.2

0

0.2

0.4

0 50 100 150 200 250 3000

0.05

0.1

0.15

0.2

清音信号

倒谱

Page 49: §7   语音信号的同态滤波和倒谱分析

0 50 100 150 200 250 300-0.2

-0.1

0

0.1

0.2

0.3

0 50 100 150 200 250 3000

0.1

0.2

0.3

0.4

0.5

图为一帧清音信号的倒谱

清音信号

倒谱

Page 50: §7   语音信号的同态滤波和倒谱分析

语音

分帧

LPC

e(n)DFT ln|.| IDFT

高频

置零

基音

频率

Page 51: §7   语音信号的同态滤波和倒谱分析

由于 ch(n)随 n增大而迅速递减,在 n的间

隔很少的值之外已经非常小,如采样频率 10kHz ,

ch(n)在间隔为 [-25,25]之外的值已经很小,可

忽略。因此,基音信息和声道信息可以认为是分离

的。

Page 52: §7   语音信号的同态滤波和倒谱分析

FT ln|.|

IFT FTx(n)

X(ejw) c(n)

加短时窗

Ln|H(ejw)|

共振峰估计的方法

采用低时窗,取出原点附近的一部分信号,经过 DFT得到的频谱就是声道的谱包络,经过峰值检测,来估计共振峰。

( ) [ln | ( ) |]jwhc n IFT H e

ch(n)

Page 53: §7   语音信号的同态滤波和倒谱分析

0 50 100 150 200 250 3000

0.2

0.4

0.6

0.8

0 10 20 30 40 50 60 700

1

2

3

4

倒谱

声道响应的谱包络

共振峰位置

加短时窗

Ln|H(ejw)|

ch(n)

Page 54: §7   语音信号的同态滤波和倒谱分析

Ln|H(ejw)|

Ln|X(ejw)|

Page 55: §7   语音信号的同态滤波和倒谱分析

如果 h(n)是最小相位序列,即 bk=

0和 dk= 0 ,则复倒谱 序列为因果稳定序

列。如果已知 ch(n) ,可以求出 。

000)(0)(2

)(ˆ

nnncnnc

nh h

h

)(ˆ nh

)(ˆ nh

Page 56: §7   语音信号的同态滤波和倒谱分析

)]([)()](ˆexp[)()](ˆ[)(ˆ

kHIDFTnhkHkHnhDFTkH

逆特征系统D*

-1[]h(n)

)(ˆ nh

Page 57: §7   语音信号的同态滤波和倒谱分析

倒谱的作用:

( 1)区分清 /浊音

( 2)求浊音的基音周期 , 可以得到浊音的激励信号。

( 3)得到声道的冲激响应 h(n)

Page 58: §7   语音信号的同态滤波和倒谱分析
Page 59: §7   语音信号的同态滤波和倒谱分析

同态声码器:

DFT ln|.|

IDFT 量化xn(n)

X(k)

c(n)

加短时窗

ch(n) 码字

基音估计

清浊音判决

激励参数码字

c^h(n)

c^h(n)DFT EXP(

.)IDFT解码

基音周期

清 /浊音激励信号发生器

卷积运算

)(ˆ nh h(n)

解码u(n) 合成

语音

原始语音

Page 60: §7   语音信号的同态滤波和倒谱分析

Exercises

1.画出语音生成的数学模型,给出相应的表达式,并简单阐述。

2.结合窗函数,说明语音的短时分析技术。

3.常用的基音周期检测的方法有哪些?它们的基本原理是什么?

4.常用的清 /浊音判别方法有哪些?它们的基本原理是什么?

5. 设序列

(1)求 x(n)的复倒谱;( 2)大致画出 x(n)的倒谱。

)()()( pNnannx

Page 61: §7   语音信号的同态滤波和倒谱分析

FT ln|.|

IFT FTx(n)

X(ejw

)c(n)

加短时窗

Ln|H(ejw)|ch(n)

exp

|H(ejw)|

生物医学信号处理中倒谱的作用

时变数字滤波器 h(n)

x(n)u(n)

Page 62: §7   语音信号的同态滤波和倒谱分析
Page 63: §7   语音信号的同态滤波和倒谱分析

0 50 100 150 200 250 300-1

-0.5

0

0.5

1

0 50 100 150 200 250 3000

0.2

0.4

0.6

0.8

根据倒谱中,幅值在 0附近波动的特点,采用统计均值调制的方法,在倒谱域中嵌入水印,具有良好的不可感知和鲁棒性。

Page 64: §7   语音信号的同态滤波和倒谱分析

音频水印音频水印

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5x 104

0

50

100

150

200

250 幅度

采样点数

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5x 104

0

50

100

150

200

250 幅度

采样点数

Page 65: §7   语音信号的同态滤波和倒谱分析

嵌入嵌入原始艺术品原始艺术品

水印水印

抽取抽取

可疑艺术品可疑艺术品

““ ”攻击”攻击

??

发布发布

不可见地隐藏其中不可见地隐藏其中 !!

含水印艺术品含水印艺术品

检测的水印检测的水印

Page 66: §7   语音信号的同态滤波和倒谱分析

可见水印

Page 67: §7   语音信号的同态滤波和倒谱分析

不可见水印

Page 68: §7   语音信号的同态滤波和倒谱分析

五、 LPC复倒谱

1 1

1

1

1

1

1( )1 1

ˆ ˆ(0) 0 (1)

ˆ ˆ( ) (1 / ) ( ) 1

ˆ ˆ( ) (1 / ) ( )

p pk k

k kk k

n

n kk

p

kk

GH za z a z

h h a

h n a k n a h n k n p

h n k n a h n k n p

Page 69: §7   语音信号的同态滤波和倒谱分析

六、MEL频率倒谱参数 (MFCC

mel-frequency cepstral coefficients )

Mel频率倒谱参数 (MFCC),着眼于人耳的听觉特性。人耳所听到的声音的高低与声音的频率并不成线性正比关系,而 Mel频率尺度则更符合

人耳的听觉特性。 Mel(f)=2595lg(1+f/700)

类似于临界频带的划分,可以将语音频率划分成一系列三角形的滤波器序列,即 Mel滤波器组。

1.Mel频率尺度

Page 70: §7   语音信号的同态滤波和倒谱分析

0 500 1000 1500 2000 2500 30000

200

400

600

800

1000

1200

1400

1600

1800

2000

线性频率 f

Mel频率

Mel(f)

Page 71: §7   语音信号的同态滤波和倒谱分析

Mel频率带宽随频率的增长而变化,在1000Hz以下,大致呈线性分布,带宽为 100Hz左右,在 1000Hz以上呈对数增长。将频谱通过 24个三角滤波器,其中中心频率在 1000Hz以上和以下的各 12个。滤波器的中心频率间隔特点是在1000Hz以下为线性分布, 1000Hz以上为等比数列分布。

2.Mel频率带宽的划分

Page 72: §7   语音信号的同态滤波和倒谱分析

ml ml ml

Mel频率尺度

f

f

C(l)=h(l-1)=o(l+1)

ll-1 l+1

Page 73: §7   语音信号的同态滤波和倒谱分析
Page 74: §7   语音信号的同态滤波和倒谱分析

( 1)三角滤波器的输出则为此频率带宽内所有信号幅度谱加权和。

3.求MFCC的方法

)(

)(

)(

)(

|)(|)()(

)(|)(|)()(

)()(lh

lckn

lc

lokn kX

lclhklhkX

lolcloklY

l = 1,2,....,24

( 2)对所有滤波器输出作对数运算

))(ln( lY l = 1,2,....,24

Page 75: §7   语音信号的同态滤波和倒谱分析

( 3)作离散余弦变换( DCT)得到 Mel频率倒谱参数 (MFCC)。

24

1

]24

)21(cos[))(ln(

li lilYC

i = 1,2,...,P, P为 MFCC参数的阶数,取 P=12。

Page 76: §7   语音信号的同态滤波和倒谱分析

DFT 三角滤波器组 ln(.

)

x(n)

X(k) DCT

MFCCY(l)

求MFCC的过程

Page 77: §7   语音信号的同态滤波和倒谱分析

4. MFCC的应用

现有语音识别系统采用的最主要的两种语音特征包括:( 1)线性预测倒谱参数( 2) MFCC参数 预处理

模型库

特征提取

后处理测度估计

语音识别系统框图

输入 输出

Page 78: §7   语音信号的同态滤波和倒谱分析

MFCC系数考虑到了人耳的听觉特性,具有较好的识别性能。但是,由于它

需要进行快速傅立叶变换,将语音信号由

时域变换到频域上处理,因此其计算量和

计算精度要求高,必须在 DSP上完成。

Page 79: §7   语音信号的同态滤波和倒谱分析

THANKS