公開鍵暗号(7): データ圧縮
DESCRIPTION
実験数学3 (大阪大学理学部数学科 3年・4年) 鈴木 譲 2014年6月26日TRANSCRIPT
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
実験数学 3(大阪大学理学部数学科 3年・4年)
第 7回: データ圧縮
鈴木 譲
大阪大学
2014年 6月 26日
.
.
.
.
1 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
あらまし
.
..
1 一意復号可能性
.
..
2 エントロピーと平均符号長
.
.
.
.
2 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
符号化
A: 有限集合{0, 1}∗: 有限の長さの 2進列の集合φ : A → {0, 1}∗ (符号化)
.
lφ : A → Nが符号化 φの長さ
.
.
.
. ..
. .
x ∈ Aに φ(x) ∈ {0, 1}l なる l ∈ N (長さ)を対応させる写像
.
φn : An → {0, 1}∗が n次の符号化
.
.
.
. ..
.
.
xn = (x1, · · · , xn) ∈ Anに φ(x1), · · · , φ(xn)を連結した長さn∑
i=1
lφ(xi )の 2進列 φ(x1) · · ·φ(xn) ∈ {0, 1}∗を対応させる写像
.
.
.
.
3 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
一意復号可能性
.
φが一意復号可能
.
.
.
. ..
.
.
各 n = 1, 2, · · · と各 un, vn ∈ Anについて、
φn(un) = φn(vn) =⇒ un = vn
.
r ∈ {0, 1}∗は s ∈ {0, 1}∗の語頭 (r ≺ s)
.
.
.
. ..
.
.
r が s の最初の部分の 2進列
.
φが瞬時復号可能
.
.
.
. ..
.
.
u, v ∈ Aについて、
φ(u) ≺ φ(v) =⇒ u = v
.
.
.
.
4 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
例: A = {α, β, γ, δ}
φa, φb, φc は一意復号可能
φa, φb は瞬時復号可能
φc は瞬時復号可能ではない。
φ6d(α, γ, α, δ, β, α) = φ6
d(δ, β, α, γ, α, α) = 011001100
x φa(x) φb(x) φc(x) φd(x)
α 00 0 0 0β 01 10 01 10γ 10 110 011 11δ 11 111 111 01
(α, γ, α, δ, β, α) 001000110100 01100111100 00110111010 011001100(δ, β, α, γ, α, α) 110100100000 11110011000 11101001100 011001100
.
.
.
.
5 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
φa
���
@@@
���HHH
HHH���
0
1
0
1
0
1
α
β
γ
δ
φb
���
@@@HHH���
���XXX
0
10
10
1
α
β
γ
δ
φc
���
@@@
HHH
HHH
XXX
XXX
0
1
1
1
1
1
α
βγ
δ
φd
���
@@@HHH���
HHH0
10
1
1
α
δ
β
γ
.
.
.
.
6 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
瞬時復号可能 =⇒ 一意復号可能
.
命題
.
.
.
. ..
.
.
瞬時復号可能 =⇒ 一意復号可能
証明: φが瞬時復号可能と仮定符号化された後の系列 φ(x1) · · ·φ(xn) ∈ φn(A)から
.
.
.
1 φ(x) ≺ φ(x1) · · ·φ(xn) =⇒ x1 = xφ(x1)φ(x2) · · ·φ(xn)から φ(x1)を取り除く
.
.
.
2 φ(x) ≺ φ(x2) · · ·φ(xn) =⇒ x2 = xφ(x2)φ(x3) · · ·φ(xn)から φ(x2)を取り除く
.
.
.
3 ......
符号化される前の系列 xn = (x1 · · · xn) ∈ Anが一意
.
.
.
.
7 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
一意復号可能であるための同値な条件
.
定理
.
.
.
. ..
.
.
以下の 3つの条件は同値である。
.
.
.
1 lφ が瞬時復号可能な符号化 φの長さ
.
.
.
2 lφ が一意復号可能な符号化 φの長さ
.
.
.
3 lφ が Kraftの不等式を満足:∑x∈A
2−lφ(x) ≤ 1
1. =⇒ 2.は,命題から。
.
.
.
.
8 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
2. =⇒ 3.
lmax := maxx∈A lφ(x)αn(m) := #{xn ∈ An|
∑ni=1 lφ(xi ) = m}
(∑x∈A
2−lφ(x))n =∑x1∈A
2−lφ(x1) · · ·∑xn∈A
2−lφ(xn)
=∑xn∈An
2−∑n
i=1 lφ(xi ) =n·lmax∑m=1
αn(m)2−m
φが一意復号可能=⇒重複がない=⇒ 各 nで αn(m) ≤ 2m
=⇒ 各 nで∑x∈A
2−lφ(x) ≤ (n · lmax)1/n =⇒
∑x∈A
2−lφ(x) ≤ 1
.
.
.
.
9 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
3. =⇒ 1.
∑x∈A
2−lφ(x) ≤ 1 ⇐⇒lmax∑m=1
α1(m) · 2−m ≤ 1
⇐⇒
α1(1) ≤ 2α1(2) ≤ 2{2− α1(1)}...
...α1(lmax) ≤ 2{2lmax−1 − 2lmax−2 · α1(1)− · · · − α1(lmax − 1)}
=⇒ レベルmで使用する葉の個数が、レベルm− 1で未使用の葉の個数の 2倍以下 (m ≥ 2)=⇒ 各レベルmに α1(m)個の葉をもつ 2進木 T が存在 (m ≥ 2)=⇒ φ(x)から T のレベル lφ(x)の葉への 1対 1写像が存在=⇒ lφが瞬時復号可能な符号化 φの長さ
.
.
.
.
10 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮
.
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
エントロピーと平均符号長
PX (x): 事象 (X = x)の確率 (x ∈ A)
.
X のエントロピー H(X )と φについての平均符号長 Elφ(X )
.
.
.
. ..
.
.
H(X ) :=∑x∈A
−PX (x) log2 PX (x)
Elφ(X ) :=∑x∈A
PX (x)lφ(x)
.
命題
.
.
.
. ..
.
.
H(X ) ≤ Elφ(X ) ≤ H(X ) + 1
となる一意復号可能な符号化 φが存在
.
.
.
.
11 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮 .
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
証明: Q(x) := 2−lφ(x)とおくと、
Elφ(X ) =∑x∈A
−PX (x) log2Q(x)
log x ≤ x − 1, x > 0と Kraftの不等式より,
Elφ(X )− H(X ) =∑x∈A
PX (x) log2PX (x)
Q(x)
≥ 1
log 2
∑x∈A
PX (x)
{1− Q(x)
PX (x)
}=
1
log 2{1−
∑x∈A
Q(x)} ≥ 0
lφ(x) := ⌈− log2 PX (x)⌉ (切上げ)は Kraftの不等式を満足し,⌈− log2 PX (x)⌉ ≤ − log2 PX (x) + 1より,右の不等式が成立。
.
.
.
.
12 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮 .
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
ブロック符号化
X n := (X1, · · · ,Xn): 確率変数の列事象 (Xi = xi ), (Xj = xj), xi , xj ∈ A, i ̸= j が独立PX n(xn), xn ∈ An: 事象 (X n = xn)の確率
H(X n) :=∑xn∈An
−PX n(xn) logPX n(xn)
=∑xn∈An
−PX n(xn)n∑
i=1
logPX (xi )
=n∑
i=1
∑x∈A
−PX (xi ) logPX (xi ) = nH(X )
.
.
.
.
13 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮 .
.
.
あらまし
.
.
一意復号可能性
.
.
エントロピーと平均符号長
φ : An → {0, 1}∗ (n次の符号化とは限らない)lφ(x
n) := ⌈− log2 PX n(xn)⌉Q(xn) := 2−lφ(xn), xn ∈ An
nH(X ) ≤ Elφ(Xn) ≤ nH(X ) + 1
.
平均圧縮率
.
.
.
. ..
. .
平均の長さを nで割った値Elφ(X
n)
n
.
定理
.
.
.
. ..
.
.
Elφ(Xn)
n→ H(X )
(n → ∞)で一意復号可能な符号化 φ : An → {0, 1}∗が存在
.
.
.
.
14 / 14
.
実験数学 3, (大阪大学理学部数学科 3 年・4 年), 第 7 回: データ圧縮 .