バイアス付きmmse-stsa推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張...

26
付き MMSE-STSA 推定器の理論解析 お雑音抑圧の拡張 ☆中井駿介,宮崎亮一,猿渡洋,中村哲(奈良先端大情報) 近藤多伸()

Upload: naistis

Post on 26-Dec-2014

469 views

Category:

Technology


5 download

DESCRIPTION

古典的な雑音抑圧手法であるMMSE短時間振幅スペクトル推定法では,人工的な音の歪み(ミュージカルノイズ)が発生しユーザに不快感を与えるという問題がありました. 今回の学会発表では,MMSE短時間振幅スペクトル推定法に改良を加えることで, ミュージカルノイズを発生させない「ミュージカルノイズフリー雑音抑圧」を達成できることを数学的な解析により明らかにしました.

TRANSCRIPT

Page 1: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

バイアス付き MMSE-STSA 推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

☆中井駿介,宮崎亮一,猿渡洋,中村哲(奈良先端大・情報)

近藤多伸(ヤマハ)

Page 2: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

研究背景

�近年,音声通信に関するアプリケーションが増加している

�テレビ会議システム,携帯電話 etc.�周囲の雑音の影響により音声品質が劣化

� 1ch 非線形音声強調法– Spectral subtraction (SS) [Boll, 1979]– Wiener filter (WF) [Wiener, 1949]– Minimum mean-square error short-time spectral amplitude estimator

(MMSE-STSA 推定器) [Ephraim, 1984]�雑音抑圧性能が高いが,ミュージカルノイズが発生して利用者に

不快感を与える.

� ミュージカルノイズフリー音声強調 [Miyazaki, 2012]�SS の内部パラメータを高次統計量に基づいて導出�ミュージカルノイズを全く発生させずに雑音抑圧が可能

2

Page 3: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

ミュージカルノイズフリー音声強調

� ミュージカルノイズフリー状態

�カートシス不動条件:信号処理によりミュージカルノイズが発生し

ていないことを示す

�NRR 増加条件:信号処理により SNR が改善することを示す

ミュージカルノイズフリー状態ミュージカルノイズフリー状態ミュージカルノイズフリー状態ミュージカルノイズフリー状態

Kurtosis ratioKurtosis ratioKurtosis ratioKurtosis ratio・値が大きいほどミュージカルノイ

ズ発生量が多い

・値が 1.0 のときはミュージカルノイズは発生しない

Noise reduction rate (NRR)Noise reduction rate (NRR)Noise reduction rate (NRR)Noise reduction rate (NRR)・SNR の改善量を表す評価尺度・値が正のとき SNR が改善されていることを示す

3

従来の音声強調

ミュージカルノイズフリー音声強調

雑音抑圧量の増加するが

ミュージカルノイズが発生

Page 4: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

研究目的

�これまで SS および WF におけるミュージカルノイズフリー状態が確認されている.

�しかし,MMSE-STSA 推定器におけるミュージカルノイズフリー音声強調については検討がなされていない.

�また,MMSE-STSA 推定器は SS と比較して音声品質が高いことが知られている.

�より高品質なミュージカルノイズフリー音声強調を目的とし

て,MMSE-STSA 推定器においてミュージカルノイズフリー状態が存在することを明らかにする.

4

Page 5: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

MMSE-STSA 推定器 [Ephraim, 1984]

5

( ) ( )( )

( ) ( )( ) ( ) ( ) ( ) ( )   ττυ

τυτυ

τυτυ

τγτυπ

τ ,2

,,

2

,,1

2

,exp

,

2, 10 fX

fIf

fIf

f

f

ffY ⋅

+

+

−=

( ) ( ) ( ) ( )( )τξτγτξτυ ,1,,, ffff += :0次と1次の変形ベッセル関数( ) ( )xIxI 10 ,

:推定音声( )τ,fY :観測信号( ) ( ) ( )τττ ,,, fNfSfX +=

:真の音声成分と雑音成分( ) ( )ττ ,,, fNfS

MMSEMMSEMMSEMMSE----STSA STSA STSA STSA 推定器による推定音声振幅スペクトル推定器による推定音声振幅スペクトル推定器による推定音声振幅スペクトル推定器による推定音声振幅スペクトル

( ) ( )[ ] ( )[ ]22 , , , τττξ fNEfSEf = : 事前 SNR ( ) ( ) ( )[ ]22

, ,, τττγ fNEfXf = : 事後 SNR

�音声の振幅スペクトルの誤差を最小とする音声強調法

真の音声成分は得ることができない

Page 6: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

MMSE-STSA 推定器 [Ephraim, 1984]� Decision directed法による事前 SNR の推定を行う.

� MMSE-STSA 推定器の性能は,忘却係数 αに関係している.

6

( ) ( ) ( ) ( ) ( )τξαττγατξ ,11,1,ˆ,ˆml

2 ffGff −+−−=

Decision directed Decision directed Decision directed Decision directed 法による事前法による事前法による事前法による事前 SNR SNR SNR SNR 推定推定推定推定

10 <<α : 忘却係数 ( ) ( )[ ]1,ˆ,0max,ml −= τγτξ ff

Page 7: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

MMSE-STSA 推定器 [Ephraim, 1984]

7

�忘却係数と MMSE-STSA 推定器の性能

HarmfulHarmfulHarmfulHarmful

NaturalNaturalNaturalNatural

BadBadBadBad GoodGoodGoodGood忘却係数忘却係数忘却係数忘却係数 ααααの値を変化させてもの値を変化させてもの値を変化させてもの値を変化させても

ミュージカルノイズフリー状態にならないミュージカルノイズフリー状態にならないミュージカルノイズフリー状態にならないミュージカルノイズフリー状態にならない

1≈α

Page 8: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

( ) ( ) ( ) ( ) ( )τξαττγατξ ,11,1,ˆ,ˆbias

2 ffGff −+−−=

バイアス付き MMSE-STSA推定器�本研究では,バイアス付き事前 SNR 推定を導入する.

�バイアス付き事前 SNR 推定を導入した MMSE-STSA 推定器をバイアス付き MMSE-STSA 推定器とする.

�バイアス値 ε とミュージカルノイズ発生量,雑音抑圧性能

の関係を理論解析により明らかにする.

バイアス付き事前バイアス付き事前バイアス付き事前バイアス付き事前 SNR SNR SNR SNR 推定推定推定推定

( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff

8

Page 9: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

� ミュージカルノイズ発生量の評価尺度

�雑音抑圧性能の評価尺度

客観評価値

9

カートシス比カートシス比カートシス比カートシス比

org

proc

kurt

kurtratio kurtosis =

prockurt : 信号処理後のカートシス orgkurt : 信号処理前のカートシス

2

4kurtµµ

=

雑音抑圧量雑音抑圧量雑音抑圧量雑音抑圧量

1

110inout log10SNRSNRNRRµµ′

≈−=

11,µµ ′:信号処理前後の雑音パワースペクトルの1次モーメント

mµ :雑音パワースペクトルの m次モーメント

理論解析には非音声区間における信号処理後の理論解析には非音声区間における信号処理後の理論解析には非音声区間における信号処理後の理論解析には非音声区間における信号処理後の

パワースペクトルの1次,2次および4次モーメントが必要パワースペクトルの1次,2次および4次モーメントが必要パワースペクトルの1次,2次および4次モーメントが必要パワースペクトルの1次,2次および4次モーメントが必要

Page 10: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

バイアス付き MMSE-STSA 推定器の解析�事前 SNR 推定において無限の再帰処理を含む.

�信号処理後のモーメントを解析的に表すことは困難

�近似 [Breithaupt, 2010] を用いたモーメント計算法を導入する.

�モーメント計算の準備

1.雑音パワースペクトルのモデリング

2.バイアス付き MMSE-STSA 推定器への近似の適用3.キュムラントの導入

10

Page 11: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

1.雑音パワースペクトルのモデリング

�雑音パワースペクトルがガンマ分布に従うと仮定する.

�形状母数は雑音の種類を表しており,値が1.0のとき白色ガウス雑音に相当する.

11

:形状母数 :尺度母数

ガンマ分布ガンマ分布ガンマ分布ガンマ分布

( ) ( )( )ηθ

θη

η

Γ−

=− xx

xpexp1

η θ

Page 12: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

2.バイアス付き MMSE-STSA推定器の近似� 2つの近似を適用する.

�非音声区間を仮定したゲイン関数の近似

�事前 SNR を畳みこみ演算を用いて近似 (再帰処理を含まない)

– 本研究では実データとの整合をとるため ρ = 2.0 とした

バイアス付きバイアス付きバイアス付きバイアス付き MMSE-STSA 推定器の近似推定器の近似推定器の近似推定器の近似

( ) ( )[ ]ετγτξ ,1,max,bias −= ff

( ) ( ) ( )τξττξ ξ ,,ˆbias fhf ∗≈

( ) ( ) ( )τλατ ξξ −−= exp1h

⋅=πα

ρλξ

4ln

ρ : スムージングパラメータ

( ) ( )ηθτξπ

τ ,ˆ4

,2

bias ffY ≈ 

12

Page 13: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

3.キュムラントの導入 [1/2]�近似式を用いてモーメント計算を行う.

�モーメントには加法性がないため,近似式にある畳みこみ演算

(積和演算) を扱うことが困難

キュムラントを導入

�キュムラントには加法性があるため,積和演算を含む処理

でも容易に計算できる.

�モーメントとキュムラントは一意に変換可能

13

キュムラントの加法性キュムラントの加法性キュムラントの加法性キュムラントの加法性

: 確率信号 Xの m次キュムラント[ ]Xmκ : 独立な確率変数YX , : 定数ba,

[ ] [ ] [ ]Ymm

Xm

m

bYaXm ba κκκ +=+

Page 14: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

�バイアス付き MMSE-STSA 推定器のキュムラントを求めてから,モーメントへの変換を行う.

� のキュムラントを直接求めることはできない

�モーメントを求めてからキュムラントへ変換

�モーメントは確率密度関数 (PDF) から導出可能

3.キュムラントの導入 [2/2]

14

][ biasξκm : のキュムラント( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff

( ) ( ) [ ]bias2

bias

14]|[| ξκαηθπ

κ m

m

YmmZ

−=

バイアス付きバイアス付きバイアス付きバイアス付きMMSE-STSA推定器のキュムラント推定器のキュムラント推定器のキュムラント推定器のキュムラント

]|[| 2biasYm

κ : バイアス付きMMSE-STSA 推定器のキュムラント( ) ( )

( )ξξ

λ

λ

m

mmZ

−−

−=

exp1

exp

( )τξ ,bias f

Page 15: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

バイアス付き MMSE-STSA 推定器のモーメント計算

�モーメント計算の手順

1. の PDF を求める.2. のモーメント を計算する.

3. をキュムラントへ変換する.

4. バイアス付き MMSE-STSA 推定器の出力パワースペクトルのキュムラント を求める.

5. をモーメントへ変換する.

15

( )τξ ,bias f

[ ]biasξµm

]|[| 2biasYm

κ

( )τξ ,bias f

[ ]biasξµm

]|[| 2biasYm

κ

カートシス比,NRR

1. PDF 2. モーメント 3.キュムラント

4.キュムラント

( )τξ ,bias f

( ) 2

bias ,  τfY 5. モーメント

Page 16: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

� の PDF 変形

�非音声区間を仮定しているため,事後 SNR は正規

化された雑音パワースペクトルとなる.

�雑音パワースペクトルはガンマ分布を仮定

1. のPDFの導出 [1/3]

( )τγ ,ˆ f

[ ]( )( )

( ) ( )ηηη

η

η

γΓ

−=

1

exp1

ˆ

xxxp

( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff

( )τξ ,bias f

モーメント計算の流れ

1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント

4.4.4.4.キュムラントキュムラントキュムラントキュムラント

( )τξ ,bias f

( ) 2

bias ,  τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント

Page 17: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

1. のPDFの導出 [2/3]

� の PDF 変形

�減算により p.d.f. は負の方向へ平行移動する.

17

[ ]( )( ) ( )( )

( ) ( )ηηη

η

η

γΓ

+−+=

−1

1exp11

xxxp

( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff

( )τξ ,bias f

モーメント計算の流れ

1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント

4.4.4.4.キュムラントキュムラントキュムラントキュムラント

( )τξ ,bias f

( ) 2

bias ,  τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント

Page 18: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

1. のPDFの導出 [3/3]

� の PDF 変形

� max 演算ではバイアス値 ε より小さい成分が全て εの位

置に積み上げられる.

[ ]( )( )

[ ]( ) ( )[ ]( ) ( )

>

=

<

=

− −∫εε

ε

γ

ε

γξ

xxp

xdxxp

x

xp

     

   

 

11ˆ

bias

0

( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff

( )τξ ,bias f

モーメント計算の流れ

1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント

4.4.4.4.キュムラントキュムラントキュムラントキュムラント

( )τξ ,bias f

( ) 2

bias ,  τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント

Page 19: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

� のモーメントを計算する.

� 求めた PDF の式をモーメントの定義式へ代入

2. のモーメント計算

19

[ ] [ ]( )

[ ]( ) [ ]( )

( )( ) ( )

( ) ( )( )( )

( )( )( )1,

1

1,11

11

1

0

2

11ˆ1ˆ

biasbias

+ΓΓ

+

+−+Γ⋅+−Γ+Γ

+Γ−

Γ=

+=

=

∫∫

=

− −

∞−

εηηη

ε

εηηηηη

ε

µε

γε γ

ξξ

m

m

l

l

m

mm

m

m

lmlml

m

dxxpdxxpx

dxxpx

   

   

   

( )ba,1Γ : 第一種不完全ガンマ関数 ( )ba,2Γ : 第二種不完全ガンマ関数

( ) ( )[ ]1,ˆ,max,bias −= τγετξ ff

( )τξ ,bias f

モーメント計算の流れ

1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント

4.4.4.4.キュムラントキュムラントキュムラントキュムラント

( )τξ ,bias f

( ) 2

bias ,  τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント

Page 20: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

3. モーメント-キュムラント変換

�モーメント-キュムラント変換により のキュムラン

ト が得られる.

20

( )τξ ,bias f

[ ]biasξκm

−+

−−=

+−=

−=

=

4

][1

2

][1][2

2

][2][1][3][4][4

3

][1][1][2][3][3

2

][1][2][2

][1][1

biasbiasbias

biasbiasbiasbiasbias

biasbiasbiasbiasbias

biasbiasbias

biasbias

612

34

23

ξξξ

ξξξξξ

ξξξξξ

ξξξ

ξξ

µµµµµµµκµµµµκ

µµκµκ

モーメント計算の流れ

1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント

4.4.4.4.キュムラントキュムラントキュムラントキュムラント

( )τξ ,bias f

( ) 2

bias ,  τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント

Page 21: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

4. バイアス付き MMSE-STSA推定器のモーメント

� のキュムラントを用いて,バイアス付き MMSE-STSA 推定器のキュムラントを求める.

21

( ) ( ) [ ]bias2

bias 41

]|[| ξκηθπ

ακ m

m

YmmZ

−=

バイアス付きバイアス付きバイアス付きバイアス付きMMSE-STSA推定器のキュムラント推定器のキュムラント推定器のキュムラント推定器のキュムラント ((((再掲再掲再掲再掲) ) ) )

( )τξ ,bias f

モーメント計算の流れ

1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント

4.4.4.4.キュムラントキュムラントキュムラントキュムラント

( )τξ ,bias f

( ) 2

bias ,  τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント

Page 22: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

騀 ֩◌

5. キュムラント-モーメント変換

� をモーメントへ変換すると,バイアス付き MMSE-STSA 推定器による信号処理後のモーメントが得られる.

�カートシス比および NRR の理論値が計算できる.

22

++

++=

+=

=

       

        

            

4

]|[|1

2

]|[|1]|[|2

2

]|[|2]|[|1]|[|3]|[|44

2

]|[|1]|[|22

]|[|11

2bias

2bias

2bias

2bias

2bias

2bias

2bias

2bias

2bias

2bias

46

34

YYY

YYYY

YY

Y

κκκ

κκκκµ

κκµ

κµ

]|[| 2biasYm

κ

モーメント計算の流れ

1. PDF1. PDF1. PDF1. PDF 2. 2. 2. 2. モーメントモーメントモーメントモーメント 3.3.3.3.キュムラントキュムラントキュムラントキュムラント

4.4.4.4.キュムラントキュムラントキュムラントキュムラント

( )τξ ,bias f

( ) 2

bias ,  τfY 5. 5. 5. 5. モーメントモーメントモーメントモーメント

Page 23: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

評価実験

�先に導出した式を用いてカートシス比および NRR の理論値を求め,ミュージカルノイズフリー状態が存在するか検

証を行う.

�また実音源を用いた信号処理実験を行い,実際にミュー

ジカルノイズフリー状態が存在しているか確認する.

�実験条件

�DD 法の忘却係数 α = 0.98�雑音パワースペクトルの形状母数 η = 1.0 (白色ガウス雑音)�推定雑音 : 非音声区間の雑音パワースペクトルの平均

23

Page 24: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

◌֝

理論解析結果

24

Conventional MMSE-STSA estimator

Musical-noise-free condition

カートシス不動条件および NRR 増加条件を満たす点が存在している

HarmfulHarmfulHarmfulHarmful

NaturalNaturalNaturalNatural

Page 25: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

実音源を用いた信号処理実験結果

25

Conventional MMSE-STSA estimator

Musical-noise-free condition

ミュージカルノイズフリー状態を達成している

HarmfulHarmfulHarmfulHarmful

NaturalNaturalNaturalNatural

Page 26: バイアス付きMMSE-STSA推定器の理論解析およびミュージカルノイズフリー雑音抑圧への拡張

薰 ◌֜

まとめ

� MMSE-STSA 推定器におけるミュージカルノイズフリー雑音抑圧を目的として,バイアス付き MMSE-STSA 推定器を提案した.

�理論解析および実音源を用いた評価実験の結果,バイア

ス付き MMSE-STSA 推定器においてミュージカルノイズフリー状態が存在することが確認できた.

26