古典情報幾何から量子情報幾何へ 長岡浩司...

27
古典情報幾何から量子情報幾何へ 長岡 浩司(電通大) (記:野田知宣) 1. 量子情報幾何は完成した体系ではなく、色々な人が色々な方向に色々な研究を行っ ているところである。しかしそれなりに蓄積があり全貌を明らかにするのは限られ た時間では無理なので、今回の話の内容が量子情報幾何の全てではない事を最初に 断っておく。 古典情報幾何については昨年に講義したが([4])、ここでは確率分布の空間上に Fisher 計量と云われる Riemann 計量と α-接続と呼ばれるアフィン接続が自然に導 入され、ある意味でこれら以外は現れない事を保障する ˇ Cencov の定理により、色々 な異なる設定での問題で同じ幾何構造が現れる。見方を変えるとこれは相対エント ロピーの幾何とも思える。相対エントロピーは確率論や統計学において重要であり、 これともよく符合する。古典情報幾何は非常に統一感を持って眺める事が出来、相 対エントロピーを押さえておけば良いとの安心感もある。 量子情報幾何はそのような世界を量子状態の空間に拡張したときにどうなるかを 問う事が主要なモチベーションである。そこで現れる世界の特徴は先ず多様性であ る。 ˇ Cencov の定理に相当する一意性定理がなくなり、自然な条件のもとでさまざま な構造が導入される。もうひとつの特徴としてはこれら多様なものを列挙した場合 に閉じている感じがしない事である。特に量子相対エントロピーを眺めていると、 幾何的に見ても情報理論・統計学的な問題設定から見ても、これだけが重要という 気がしない。もっと何か大きな枠組みがあってその中の断片を見ている感じがする。 別の云い方をすれば断片を見ると相対エントロピーや幾何構造が現れているような 感じである。これらを包むものがどういう空間の幾何かも判らなければ、幾何学に 収まる保障もない。これらの印象を伝えることが今回の講義の目的である。 2. 古典情報幾何の復習 測度空間 (X, F , μ) に対し確率密度の空間を P = P (X) := {p ; p : X R s.t. x に対し p(x) = 0, Z pdμ =1}, P = P (X) := {p P ; x に対し p(x) > 0} と定める 1 P には境界があるが、P は多様体である(これについては黒瀬先生の 講義を参照の事)。 1 精確には p = 0,p> 0 a.e. 1

Upload: others

Post on 21-May-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

古典情報幾何から量子情報幾何へ

長岡 浩司(電通大)(記:野田知宣)

1. 序

量子情報幾何は完成した体系ではなく、色々な人が色々な方向に色々な研究を行っ

ているところである。しかしそれなりに蓄積があり全貌を明らかにするのは限られ

た時間では無理なので、今回の話の内容が量子情報幾何の全てではない事を最初に

断っておく。

古典情報幾何については昨年に講義したが([4])、ここでは確率分布の空間上に

Fisher 計量と云われる Riemann 計量と α-接続と呼ばれるアフィン接続が自然に導

入され、ある意味でこれら以外は現れない事を保障する Cencovの定理により、色々

な異なる設定での問題で同じ幾何構造が現れる。見方を変えるとこれは相対エント

ロピーの幾何とも思える。相対エントロピーは確率論や統計学において重要であり、

これともよく符合する。古典情報幾何は非常に統一感を持って眺める事が出来、相

対エントロピーを押さえておけば良いとの安心感もある。

量子情報幾何はそのような世界を量子状態の空間に拡張したときにどうなるかを

問う事が主要なモチベーションである。そこで現れる世界の特徴は先ず多様性であ

る。Cencov の定理に相当する一意性定理がなくなり、自然な条件のもとでさまざま

な構造が導入される。もうひとつの特徴としてはこれら多様なものを列挙した場合

に閉じている感じがしない事である。特に量子相対エントロピーを眺めていると、

幾何的に見ても情報理論・統計学的な問題設定から見ても、これだけが重要という

気がしない。もっと何か大きな枠組みがあってその中の断片を見ている感じがする。

別の云い方をすれば断片を見ると相対エントロピーや幾何構造が現れているような

感じである。これらを包むものがどういう空間の幾何かも判らなければ、幾何学に

収まる保障もない。これらの印象を伝えることが今回の講義の目的である。

2. 古典情報幾何の復習

測度空間 (X,F ,μ) に対し確率密度の空間を

P = P(X) := {p ; p : X→ R s.t. ∀x に対し p(x) = 0,Zp dμ = 1},

P = P(X) := {p ∈ P ; ∀x に対し p(x) > 0}

と定める1。P には境界があるが、P は多様体である(これについては黒瀬先生の

講義を参照の事)。

1精確には p = 0, p > 0 は a.e.1

Page 2: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

2

以降 X は有限集合と仮定する。特に X = {1, 2, . . . , d} のとき

Pd := P(X), Pd := P(X)と表す(多くの話は一般の測度空間に拡張出来るが、今回はこの仮定を置く2)。

任意の接ベクトル ∂, ∂0 ∈ Tp(P) に対し

g(∂, ∂0) := Ep[(∂`)(∂0`)] =Xx

p(x)∂`(x)∂0`(x),

で定まる計量を Fsiher 計量と呼ぶ。但し `(x) := log p(x). これがほぼ唯一の自然

な Riemann 計量である。{pθ ; θ = (θ1, . . . , θk) ∈ Θ ⊂ Rk} ⊂ P(X) に対し

kdθk2 :=Xi,j

gij(θ)dθidθj

は pθ と pθ+dθ との(統計的)識別のしやすさを表す量である。近い pθ と pθ+dθ が

あるとき、これらが大きく違った分布であればデータからどちらの分布かを判断出

来る。逆にあまり違わなければデータから判断するのは難しい。この識別の度合い

を Fisher 計量は表しており、統計学ではよく出てくる(即ち重要)。

P 上の任意のベクトル場 X, Y, Z に対し

g(∇(α)X Y, Z) = Ep[(XY `)(Z`)] +1− α

2Ep[(X`)(Y `)(Z`)]

で定まる接続を α-接続と呼ぶ。

定義 2.1. 写像 Γ : P(X) → P(Y) に対し、Γ がアフィン写像、即ち任意の p, q ∈P(X) と 0 5 a 5 1 に対し

Γ(ap+ (1− a)q) = aΓ(p) + (1− a)Γ(q)が成立するときMarkov 写像と呼ぶ。これは w : X×Y→ R : (x, y) 7→ w(y|x) で3

  (i) 任意の x, y に対し w(y|x) = 0,  (ii) 任意の x に対し

Py w(y|x) = 1,

  (iii) 任意の p に対し Γ(p) =P

xw(·|x)p(x)を満たすものが存在する事と同値である。

Γ がMarkov 写像であるとは、背後には何か通信路があり、分布の変化がその通

信路による場合である。条件 (i) と (ii) は

  ・入力側の要素 x をひとつ定めると y に関して確率分布を成す;

  ・x を変えると一般には y の確率分布は変わる

2X が無限集合の場合、Cencov の定理を Pistone 流の枠組みで定式化した仕事はおそらく無い。

また定式化も違ってくると思われる。無限次元の強みを用いて特徴付けられるであろう。ただ、有

限・無限を問わず自然な計量は Fisher 計量に限ると考えるのは自然である。統計学的応用では常に

X は無限集合の場合であるが、有限の場合を理解しておけば類推が可能である。ここで有限集合に

限る理由は面倒な仮定を書かなくて良いからである。3w(y|x) と表すのは慣習。

Page 3: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

3

を意味する。このようなセットが与えられているとき xを通信路に通すと確率 w(y|x)に従って y が出力される。入力側の x を規定する確率分布 p が与えられていると

する。p に従って x が出てきたときに、y の従う分布が Γ(p) =P

xw(·|x)p(x) となる。

p ∼ x → w(y|x) → y ∼ Γ(p)入力 通信路

(channel)出力

Γ のアフィン性は、入力側で二つの分布 p, q とそれを決める確率 a, (1− a) を用意

し、それらからデータを出して通信路を通して送信する場合、これを出力側で見る

と p だった確率と q だった確率がやはり a と (1− a) の確率で起きている事を要請

するものである。自然な確率分布の変換においてこの性質は必ず満たされると思っ

て良い。物理的に実現可能であり、分布に関する知識はなくデータのみで変換を行

う場合はアフィン性は常に成立している。逆に、アフィン性が成立しない状況はど

こかでインチキをしている。Markov 写像とは実現可能な確率分布の族そのものと

見做して良い。

また Γ のアフィン性は数学的に必要なだけでなく、

ap+ (1− a)q:p と q の統計的混合

を理解する事が大切である:

確率 a で p

確率 (1− a) で q

)↔ ap+ (1− a)q.

Markov 写像の概念は古典論の Cencov の定理を理解するのに必要なだけでなく、

量子版に当たる Petz の定理を理解する上でも大前提となる。これについては 4 節

で説明する。

Markov 写像 Γ : P(X)→ P(Y)、M ⊂ P(X) に対し、Γ が M 上で可逆とは任意

の p ∈ M に対し ∆(Γ(p)) = p を満たす Markov 写像 ∆ : P(Y) → P(X) が存在す

るときに云う。分布を写したとき自然な方法で(M 上では)元に戻せる事を表す条

件である。しかしこれはデータが元に戻っている事を述べている訳ではなく分布の

みが元に戻っていれば良い(これは十分統計量に相当する)。

X = Y の場合、Γ が P(X) 上で可逆である為の必要十分条件は任意の p に対し

Γ(p)(x) = p(f(x)) となる 全単射 f : X→ X が存在する事である。

任意の p ∈ P(X)、∂ ∈ Tp(P(X))、Markov 写像 Γ : P(X) → P(Y) に対し

Γ(p) ∈ P(X) なら ∂ := (dΓ)p(∂) ∈ TΓ(p)(P(Y)) として

g(∂, ∂) = g(∂, ∂)

が成立する。但し両辺にある gは Fisher計量。これは『データ処理(統計処理)をする

と情報は減る事はあっても増える事は無い』事を表している。特に ∂ ∈ Tp(M), M ⊂P(X) で Γ が M 上で可逆なら等号が成立する(証明は ∆ でも同様の不等式が成立

Page 4: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

4

する事から)。これを Fisher 計量の不変性(invariance)と呼ぶ。これは『単調性

⇒不変性』であるが、次の定理から単調なものは Fisher 計量のみである事が判る。

定理 2.2 (Cencov (Chentsov) の定理). (1) 不変な P 上の Riemann 計量は Fisher

計量かその定数倍に限られる。

(2) 不変な P 上のアフィン接続は {α-接続 ; α ∈ R} に限られる4。

以上で古典的情報幾何のレビューを終了する。次節から量子情報幾何の話になる。

3. 量子状態空間

本節では幾何学を考える舞台を設定し、その物理的意味を簡単に述べる。

H を d 次元 Hilbert 空間とする(但し d < ∞)。H は複素ベクトル空間であ

り、ψ,ϕ ∈ H に対し内積を hψ|ϕi で表す。ここで内積は Hermite 内積であるが、

物理に合わせて第一成分に関して反線型、第二成分に関して線型とする。例えば

H = Cd = Cd×1 とすると5

hψ|ϕi = ψ∗ϕ.

ここで ψ∗ は ψ の共役転置(Hermite 共役)。以下の話はこの例を思い浮べておけ

ば良い(一般の量子力学において H は無限次元であるが、スピン系や偏光系などで

は有限次元の H で記述される)。

以降、次の記号を用いる:

L(V ;W ) := {A ; A : V → W は線型 },L(V ) := L(V ;V ),Lh(V ) := {A ∈ L(V ) ; A = A∗}.

但し L(V ;W ) と書いた場合に V,W は線型空間であり、Lh(V ) と書いた場合 V に

は内積(計量)が定まっているとする。L(V ) の要素を V 上の作用素または演算子

(operator)、Lh(V ) の要素を Hermite 作用素などと呼ぶ。これらの記号の下で古

典情報幾何に対応して

S = S(H) := {ρ ; ρ ∈ Lh(H), ρ = 0, Tr ρ = 1},S = S(H) := {ρ ; ρ ∈ S, ρ > 0}

と定める。S は S で逆(行列)を持つもの。但し ρ = 0 は ρ が半正定値、ρ > 0 は

正定値を表す。S の要素を密度作用素(density operator)と呼ぶ。これは量子状態

4接続の不変性は計量と同様に『可逆な Markov 写像で写すと同じ接続が出てくる』で定義され

る。5Cd×1 は d× 1 行列、即ち d 次列ベクトルである事を表す。

Page 5: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

5

を表す数学的概念である。S, S は前節(古典情報幾何)での P , P と対応する:

S = ©U diag(λ1, . . . ,λd) U∗ ; (λ1, . . . ,λd) ∈ Pd, U:ユニタリª,

S = {U diag(λ1, . . . ,λd) U∗ ; (λ1, . . . ,λd) ∈ Pd, U:ユニタリ }

と表せる。但し diag(a1, . . . , an) は対角成分が a1, . . . , an の対角行列を表す。また

S は

Sr = {ρ ∈ S ; rank ρ = r}= {U diag(λ1, . . . ,λr, 0, . . . , 0) U∗ ; (λ1, . . . ,λr) ∈ Pr, U:ユニタリ }

としたとき

S =d[r=1

Sr

とも表せる。このとき

 ・各 Sr は (2dr − r2 − 1) 次元の滑らかな多様体;

 ・Sd = S; ・S1 = {ρ ∈ Lh ; ρ は1次元射影作用素(ρ2 = ρ)}   = P(H):H 上の複素射影空間6;

   = {|ψihψ| ; ψ ∈ H, hψ|ψi = 1}が成立する。ここで |ψi = ψ をケット(ベクトル)と呼び、hψ| : H→ C : ϕ 7→ hψ|ϕiをブラ(ベクトル)と呼ぶ。S1 の要素を純粋状態(pure state)と呼ぶ。ρ = |ψihψ|のとき ψ をその状態ベクトルと呼ぶ(これは波動函数の有限次元版7)。波動函数で

記述される系は純粋状態として記述している。一般には複数の純粋状態の中から確

率的にどれか一つが選ばれている。または大きな系は純粋状態であるが、考えてい

る系はその一部である。このような状態は純粋状態では記述出来ず、S の要素で記

述する事になる。即ち一般の量子状態は S の要素すなわち密度作用素で表される。

S には凸構造が入る。それを説明しておく。a ∈ R に対し Lh,a(H) := {A ∈Lh ; Tr A = a} と定める。これは Lh のアフィン部分空間。このとき

・S はアフィン空間 Lh,1 の凸部分集合:ρ,σ ∈ S, 0 5 λ 5 1⇒ λρ+ (1− λ)σ ∈ S.・S は S の凸部分集合。

・λρ+ (1− λ)σ は ρ と σ の統計的混合を表す:

確率 λ で ρ

確率 (1− λ) で σ

)→ λρ+ (1− λ)σ.

これについては本節末を参照の事。

6dimC S1 = d− 1, dimR S1 = 2(d− 1) である。他の Sr は複素多様体と見做せない。7H の単位ベクトル。量子力学では α を大きさ 1 の複素数としたとき2つの状態 ψ と αψ は同

じ状態を定めるとする。よって複素射影空間となる。

Page 6: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

6

S が理論を展開する舞台である。その構造を見ておく。S は Lh,1 の開集合だか

らこれにより多様体構造が誘導される。 このとき接空間は Tρ(S) = Tρ(Lh,1) = Lh,0と同一視が出来る(開集合とアフィン部分空間)。この同一視を要素で書けば

Tρ(S) = Tρ(Lh,1) = Lh,0

∈ ∈

∂ ←→ ∂(m) := ∂ρ

となる。このとき ∂(m) := ∂ρ を ∂ の m-表現(mixture representation)と呼ぶ。接

ベクトルを作用素で表現する方法は(少なくとも)2通りあり、その内の一つがこ

れである(一番自明で自然なもの)。古典情報幾何に倣って m-表現と呼ぶ。なので

上の接空間の同一視の下で T(m)ρ (S) := Lh,0 とも表す。

ここで密度作用素などの物理的背景(意味)『ρ ∈ S が量子状態を表すとはどうい

うことか』を説明する。

(i): 一つの量子系に対し或る Hilbert 空間 H が対応する。

(ii): この系の任意の状態(系の用意の仕方によって定まる)は或る ρ ∈ S(H) によって表される。

(iii): この系に行う任意の測定は、その測定値の集合を X(有限集合と仮定)と

置くとき

M : X → Lh(M)x 7→ Mx

s.t. (Mx = 0 (∀x ∈ X),P

xMx = I (identity on H)であるような M によって表される。この M を POVM(positive operator-

valued measure)と呼ぶ。

このとき測定値の確率分布は

PMρ (x) = Tr [ρMx]

と表される。これを量子力学における統計仮説などと呼ぶ。

量子系 H

状態 ρ Ã ◦

測定 M = {Mx}x∈X

測定値 x ∼ 確率 PMρ (x)

Page 7: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

7

これらはミクロな物理的状態を記述するときに仮定するセッティングであり、量

子力学の公理のようなものである。何かしらの系に対して対応する Hilbert 空間 Hがある。例えば R3 内を運動する質点なら R3 上の L2-函数全体、偏光系やスピン系

なら C2 など(最も細かい測定値の個数が次元)。系の状態は様々用意出来る。これ

らの用意の仕方を決めると量子系の状態が定まる。ここで用意の仕方には再現性や

前回の測定との独立性などが要求される。このような状況で何度も繰り返して測定

をすることで確率的概念が得られる。このとき密度作用素 ρ が定まる。一方、系に

対し測定を行って測定値を得る場合、測定値の集合 X に応じて半正定値作用素の族

{Mx} が定まる。状態と測定はそれぞれ独立に用意出来るものであるが、これらを

用意すると測定値の確率が定まる。それが常に

PMρ (x) = Tr [ρMx]

と表される。これが一番重要である。

本節の最後として凸結合

PMλρ+(1−λ)σ = λPMρ + (1− λ)PMσ(3.1)

の意味を簡単に述べておく。ρ, σ と2つ用意の仕方を準備し、確率 λ, (1−λ)でどち

らか一方を選ぶ。このとき測定側ではどちらが選ばれたかは判らないのであるが、そ

のときの確率分布は (3.1) の右辺になっているはずである。一方 PMρ (x) = Tr [ρMx]

において ρ は線型に入っているからこれは (3.1) の左辺のように書き換えられる。

凸結合 λρ+ (1− λ)σ で表される密度行列は確率 λ と (1− λ) で ρ と σ を用意する

仕方に対応した量子状態を表す密度行列となっている。

4. 量子系の単調計量

本節では Fisher 計量の量子版の話をする。古典的な Fisher 計量は Markov 写像

の下で減ることはあっても増えることは無いという単調性を満たす計量として特徴

付けられた(定数倍を除く)。更に Fisher 計量は、単調性よりも弱く思える不変性

で特徴付けられる。古典論では単調計量は Fisher 計量(の定数倍)に限られる。

以下では先ず量子系の単調計量について述べる。これらの理論は基本的に Petz

(ハンガリー)に依る。古典論では確率分布の自然な変換であるところの Markov 写

像を定め、それに対する単調性を定めた。量子版でも先ず Markov 写像に相当する

概念を定める。これは量子操作または量子通信路と呼ばれ、古典論に比べるとかな

り非自明な話になる。次に Petz の定理を述べるための準備を幾つかする。そして

Petz の定理を説明し、Fisher 計量との関係を述べる。

先ずは Markov 写像の量子版を定義する事から始める。

Page 8: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

8

定義 4.1 (量子操作 quantum operation). Hilbert 空間 H,K と Γ : S(H) → S(K)に対し以下の3条件 (i) ~ (iii) は互いに同値である。これらの性質を満たす Γ を量

子操作(quantum operation)、量子通信路(quantum channel)などと呼ぶ:

(i): k ∈ N とP

j A∗jAj = I を満たす {Aj}kj=1 ⊂ L(H;K) が存在し、任意の

ρ ∈ S(H) は Γ(ρ) =Pk

j=1AjρA∗j と書ける。

(ii): Hilbert 空間 K0 と等長写像 V : H → K ⊗ K0 が存在し、任意の ρ ∈S(H), X ∈ L(K) に対し

Tr [Γ(ρ)X ] = Tr [(V ρV ∗)(X ⊗ I)].(4.1)

ここで I は K0 の恒等変換。

(iii): 任意の Hilbert 空間 H に対しアフィン写像 Γ : S(H⊗ H)→ S(K⊗ H) で、

任意の ρ ∈ S(H) と σ ∈ S(H) に対し Γ(ρ⊗ σ) = Γ(ρ)⊗ σ となるものが存在

する。

注意 4.2. 量子操作の定義中の3条件についての補足をここに纏めておく。但し番

号付け (i), (ii), (iii) は上の定義の番号付けと対応させてある。

(i): この条件があると ρ = 0 なら Γ(ρ) = 0 であり、Tr Γ(ρ) = Tr ρ が分かる。

(ii): この条件がもっとも物理的である。

V (のユニタリ拡張)

K⊗K0

kK + K0

Γ(ρ)

系 H と状態 ρ は

より大きな系の一部と見做す。

それを V(のユニタリ拡張)で

K⊗K0 に写す。

量子系において K ⊗K0 は合成系 K +K0 と考えられる。

このとき K0 を無視して

K のみを考えたものが Γ(ρ)

(4.1) は

Γ(ρ) = Tr K0 [V ρV ∗]

と書いても同じ。右辺の Tr K0 は K0 のみトレースを取る事を表し、その意味

で partial trace などと呼ばれる。この条件は実際に状態を変化させる物理的状

況に対応した見方になっている。

(iii): ここで特に H = C とおくと Γ のアフィン性になる。条件 (iii) は『Γ がア

フィン』を含んだ条件。アフィン性は古典系でもそうだが、非常に重要で自然

な状態変化では成り立っていないとオカシイ条件。量子系ではアフィン性のみ

では物理的に実現可能であるとは云えず、合成系に拡張される必要がある。

Page 9: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

9

ρ <

H

H

H

id

状態を変化させない

> Γ(ρ)

系 H と H の状態 ρ を

系 K と H の状態 Γ(ρ) に写す。

このとき写った後の状態が

Γ(ρ) となっている。

これはまた Γ = Γ⊗ id とも書ける。但し id は L(H) 上の identity を表す。

目の前の系 H を(Hamiltonian の下での時間発展などの影響で)物理的変

化させ H となったとき、量子力学では H と H の中間の状態を作れる。これ

は数学で云えば完全正(completely positivity)という性質に相当する。これを

物理的に書き下したものが条件 (iii) である。

条件 (iii) はアフィン性に付加条件が付いている。ここで Γ のアフィン性の

みでは量子操作にならない例を述べておく。H = K = C2 とする。このとき

S(C2) =(ρr :=

1

2

"1 + z x− iyx+ iy 1− z

#; r = (x, y, z) ∈ R3, krk 5 1

)

と書ける。但し krk は Euclid ノルム。いま

Γ : ρr → ρ−r

は S(C2)→ S(C2) なるアフィン写像であるが、量子操作でない。物理的には

スピンの向きを正反対にするプロセスがないと解釈される。

これらの話は完全正写像の理論として

 ・(ii) ⇔ (iii) が示された(Stinespring)。

 ・(i) は意味は良く分からないが、形が非常に具体的なので便利であり、

    これは Krauss 表現とか作用素和表現(operator sum representation)

    と呼ばれる。

これらが Markov 写像の量子版に当たるものである。例えばユニタリで ρ を挟む

UρU∗ は量子操作である。これは条件 (iii) で k = 1 の Krauss 表現と思える。

次にこれらについて単調性を論じる。

定義 4.3 (単調計量). 任意の量子操作 Γ : S(H)→ S(K)、Γ(ρ) ∈ S(K) を満たす任

意の ρ ∈ S(H)、任意の ∂ ∈ Tρ(S(H)) に対し

gH(∂, ∂) = gK(∂, ∂), ∂ = (dΓ)ρ(∂),

Page 10: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

10

が成り立つとき S(H) 上の Riemann 計量 g = gH(あるいは計量の族 {gH}H)を単

調計量(monotone metric)と呼ぶ。

この定義は少し精確ではない。これは『量子操作で情報は減る事はあっても増え

る事は無い』を表しており、古典論の Fisher 計量の単調性に対応している。一意性

は成立しないが、かなり具体的な形を決められる(それが Petz の定理)。この Petz

の定理を定式化する為の準備を幾つかする。

準備 4.4 (operator calculus). A ∈ Lh(H) と f : W → R(W ⊂ R は区間で、f は

基本的には連続函数)に対し A の固有値の集合が spec(A) ⊂ W ならば

f(A) ∈ Lh(H)

が矛盾無く定義される(well-defined)。例えば

 ・f(x) = xn + a1xn−1 + · · ·+ an なら f(A) = An + a1A

n−1 + · · ·+ anI, ・A = Udiag(λ1, . . . ,λd)U

∗ なら f(A) = Udiag(f(λ1), . . . , f(λd))U∗

  (但し U はユニタリ),

 ・Aψ = λψ なら f(A)ψ = f(λ)ψ,

 ・AB = BA なら指数函数:(AB)t = BtAt、対数函数:log(AB) = logA+ logB

などが成立する。

準備 4.5 (作用素単調と作用素凸). f :W → R に対し

• f が作用素単調(operator-monotone)とは、任意の Hilbert空間Hと spec(A),

spec(B) ⊂ W を満たす任意の A,B ∈ Lh(H) に対し、A 5 B ならば f(A) 5f(B)(但し 5 は半正定値の意)。

• f が作用素凸(operator-convex)とは、任意の Hilbert 空間 H と spec(A),

spec(B) ⊂ W を満たす任意の A,B ∈ Lh(H)、0 5 λ 5 1 に対し

f(λA+ (1− λ)B) 5 λf(A) + (1− λ)f(B).

と定める。このとき

  ・作用素単調ならば単調増加;

  ・作用素凸なら(下に)凸

が成立する(但し共に逆は一般には成立しない)。この辺の話は理論が整備されてお

り、量子情報理論において非常に便利なツールを与える(しかし元々は純粋数学と

して作られた理論と思われる)。

準備 4.6 (modular operator). L(H) 上の Hilbert-Schmidt 内積を

hA,BiHS := Tr A∗B

Page 11: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

11

とする。このとき A ∈ L(H) に対し L(H)→ L(H) を

LA : X 7→ LA[X ] := AX,

RA : X 7→ RA[X] := XA,

と定める(L は左からの積を表すが、これはここだけの記号とする。ここ以降 L は

対数微分を表すのに用いる)。これらを用いて

∆ρ := LρRρ−1 : X 7→ ∆ρ[X ] := ρXρ−1, ρ ∈ S(H),

と定め、∆ρ を ρ のモジュラー作用素(modular operator)と呼ぶ。このとき ∆ρ は

Hilbert-Schmidt 内積 h , iHS に関して正定値である:

hX,∆ρ[X ]iHS = Tr X∗ρXρ−1

= Tr (ρ12Xρ−

12 )∗(ρ

12Xρ−

12 )

= 0.

(ρ > 0 なら hX,∆ρ[X]iHS > 0.)よって準備 4.4 から f : R+ → R に対し

f(∆ρ) ∈ Lh(L(H))

が定義される。

次に計量、対数微分、e-表現の関係を纏めておく。Fisher 計量の定義などにおい

て確率分布の対数 log p を微分した。量子系の Riemann 計量を考えるときも対応物

がある。計量を定める事は対数微分(に相当するもの)をどう定めるかとの問題に

なる。これにより古典論との繋がりが見易くなる。

S(H) 上の Riemann 計量 g が与えられているとする。このとき任意の X, Y ∈Tρ(S) に対し

g(X, Y ) = Tr [(Xρ)LY ] = Tr [X(m)Y (e)]

を満たすような線型写像

TρS → Lh,ρ,0 := {A ∈ Lh ; Tr ρA = 0}

∈ ∈

Y 7→ LY = Y(e)

が定まる。g(X,Y )において Y を固定して X を動かすと Tρ(S)上の線型汎函数とな

る。これを Tr [(Xρ)LY ]の方で見て作用素上の線型汎函数と思い Hilbert-Schimdt内

積に関する Rieszの表現定理を用いる事で存在が判る。但し Xρ は Tr = 0の範囲し

か動かないので LY が一意に定まらない。付帯条件 Tr ρA = 0により一意に定まる。

LY = Y (e) を Y の対数微分(logarithmic derivative)または e-表現(exponential

Page 12: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

12

representation)などと呼ぶ8。これは計量 g に依存する。対数微分 L を定める事で

計量 g が定まる事になる。

注意 4.7. 古典系では Fisher 計量は

g(X,Y ) = Ep[(X`)(Y `)], ` = log p,

=Xx

(Xp(x))(Y `(x))

であり、また

Ep[Y `] =Xx

p(x)(Y `(x)) =Xx

Y p(x)

= YXx

p(x)| {z }≡1

= 0

が成立し、Xp = X(m) を m-表現、X` = X(e) を e-表現と呼んだ。

これらの準備の下、単調計量に対する Petz の定理を述べる。

定理 4.8 (Petz の定理 [7]). S(H) 上の Riemann 計量 g に関し次の (i) と (ii) は同

値:

(i) g は単調計量;

(ii) 任意の t > 0 に対し tf(1/t) = f(t) を満たす作用素単調函数 f : R+ → R+ が存

在し、任意の ρ ∈ S, X ∈ Tρ(S) に対し

Xρ = f(∆ρ)[LXρ] (X(m) = f(∆ρ)[X(e)ρ])

が成立。

計量 g を定めるには対数微分 L を定めれば良いが、この Petz の定理は単調計量

の場合に対数微分 L がどういう形になるかを定めている。古典系において e-表現と

m-表現との間には

X` = X(e) =X(m)

p

の関係があり、量子系でも同様の対応関係

X(m) = f(∆ρ)[X(e)ρ]

が成立している。特に可環の場合 f(∆ρ) は何も無い事になる。即ち Fisher 計量に

なる。それを以下で説明する。

S(H) の部分多様体

M = {ρθ := U diag(pθ(1), . . . , pθ(d)) U∗ ; pθ ∈ Pd} ⊂ S(H),8対数微分、e-表現と相対する呼び方をするが、これは逆の見方をした結果であり、慣習である。

指数型分布族を対数線型(log linear)と呼ぶようなもの。

Page 13: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

13

を考える。但し U は fixed ユニタリであり、θ = (θ1, . . . , θd) ∈ Θ ⊂ Rd−1(ユニタ

リ U を fix しているので確率分布を考えているのと同じ)。このとき ∂i := ∂/∂θi と

して

∂i log ρθ = ρ−1(∂iρ) = (∂iρ)ρ−1 = U diag(∂i log pθ(1), . . . , ∂i log pθ(d)) U ∗

と書ける。∆ρ の定義から

∆ρ[(∂i log ρ)ρ] = ρ(∂i log ρ) = ∂iρ

が成立する。一方

∆ρ[(∂i log ρ)ρ] = ∆ρ[∂iρ].

よって ∂iρ は ∆ρ の固有値 1 の固有ベクトル。従って

f(∆ρ)[∂iρ] = f(1)∂iρ

であり、よって

L∂i =1

f(1)(∂i log ρ).

これより計量 g は

g(∂i, ∂j) = Tr [(∂iρ)Lj]

=1

f(1)Tr [ρ(∂i log ρ)(∂j log ρ)]

=1

f(1)Epθ [(∂i log pθ)(∂j log pθ)]

と表せ、これは Fisher 計量の定数倍である。どんな単調計量に対しても可換な方

向は常に Fisher 計量の定数倍になる。f(1) は任意に定めて良いが、可換な方向を

Fisher 計量としたいので以降 f(1) = 1 と仮定する。f を単調計量 g の Petz 函数

(Petz function)と呼ぶ。

可環な方向を見ると Fisher 計量となるので非可環な方向に差が現れる事になる。

これは U を変化させて得られる方向であり、こちらは色々な計量となる。

補足 4.9. (i) 単調計量は古典系の Fisher 計量の場合と同様の意味で可逆な量子操

作に関して不変である。特にユニタリ不変である:U をユニタリとしたとき

S → S

∈ ∈

ρ 7→ UρU∗

は可逆な量子操作であり、これに関して単調計量は不変となる。

(ii) S ⊂ S は内部であり、極限点の集合(境界)が純粋状態の集合 S1 = P(H) である。S のベクトルで境界 S1 に近づけていくと、計量が発散する場合と有限値に

止まる場合が共にある。有限値に止まる場合、単調計量 g は S1 上の Riemann 計

量を与える。これはユニタリ不変であり、よって Fubini-Study 計量の定数倍とな

Page 14: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

14

る。どのような場合に境界 S1 にまで計量が拡張できるかは知られている:Petz 函

数が f であるような単調計量 g に対し、g が S1 = P1(H) に拡張可能である事と

f(0) = limt↓0f(t) > 0 である事は同値(Petz-Sudar [8])。拡張可能な場合、拡張され

た計量は Fubini-Study 計量(の定数倍)である。

5. 単調計量の例

ここでは S(H) の部分多様体 M = {ρθ ; θ = (θi) ∈ Θ} 上の単調計量の例を5つ

述べる。単調計量 g を与える事は対数微分 L を与える事と同値であり、これはまた

Petz 函数 f を与える事とも同値である。

M 上の Riemann 計量 g に対し、接ベクトル (∂i)θ の e-表現(対数微分)を

Lθ,i = Li で表す。このとき計量 g の成分は

gij = Tr [(∂iρ)Lj]

で与えられる。g が単調計量の場合、その Petz 函数 f は

∂iρ = f(∆ρ)[Liρ]

を満たす。本節で述べる計量の Petz 函数は全て

f(1) = 1 と tf(1

t) = f(t)

を満たし、可換な方向は Fisher 計量である。ここで f(1) = 1 は規格化条件であり、

tf(1/t) = f(t) は計量が実数となる為の条件である(例 5.2 参照)。なお本節の内容

に関しては配布資料参照の事。

例 5.1 (SLD 計量 gS). 対数微分 Li := Lθ,i ∈ Lh を

∂iρ =1

2(ρLi + Liρ)(5.1)

で定める。{Li} を対称対数微分(symmetric logarithmic derivative, SLD)と呼ぶ。

ρ > 0 なら Li は一意的に存在する。このとき計量 gS の成分は

gSij = Tr [(∂iρ)Lj] = Re Tr [ρLiLj]

となり、また

∂ρ =1

2(ρLi + Liρ) =

1

2(Liρ+∆ρ[Liρ]) =

µ1 +∆ρ

2

¶[Liρ]

から Petz 函数は

f(t) =1 + t

2

となる。ここで t = 0 とすると f(0) = 1/2 > 0 から9この計量は境界 S1 にまで拡

張可能である。この計量は量子推定論において最初に現れた Fisher 計量の量子版で

9f(0) は limt↓0f(t) の意味。以下の例でも同様に用いる。

Page 15: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

15

1960 年代の事であり、これより Cramer-Rao 型不等式が得られる。またこれは最小

の単調計量でもある(Petz)。これについては 8 節で述べる。

例 5.2 (実 RLD 計量 gR). 先ず(実とは限らない複素の)RLD 計量から定める。

∂iρ = ρLi により Li ∈ L(H) を定める。これは Hermite 作用素とは限らない事に注

意する。この {Li} を右対数微分(right logarithmic derivative, RLD)と呼ぶ(右、

左は然して重要ではない)。

gRij := Tr [ρLiLj] = Tr [(∂iρ)Lj]

を成分とする Hermite 正定値行列 [gRij ] を RLD Fisher 情報行列と呼ぶ。これは

単調な『複素』計量を定める。これに対し Petz 函数は f(t) = t となり、これは

tf(1/t) = f(t) を満たさない。そこで実部を取り

gRij := Re gRij

を実 RLD 計量と呼ぶ。これに対し対数微分は

Li =1

2(Li + L

∗i ) =

1

2(ρ−1(∂iρ) + (∂iρ)ρ−1)

であり、

Liρ =1

2(ρ−1(∂iρ)ρ+ ∂iρ) =

1

2(∆−1ρ [∂iρ] + ∂iρ) =

1 +∆ρ

2∆ρ[∂iρ]

から Petz 函数は

f(t) =2t

1 + t

となる。これは t = 0 で f(0) = 0 から S1 に拡張出来ない。この計量は SLD(本質

的に 1-パラメータの場合)とは別種の(より『量子的』な)Cramer-Rao 型不等式

を与え、量子推定論で重要である。またこれは最大の単調計量である(これについ

ては SLD の最小性と共に 8 節で述べる)。

例 5.3 (量子 h-ダイバージェンスから導かれる計量 g(h)). ここでは二つの状態に対

し正値である距離的な量を述べる。二つの状態 ρ, σ ∈ S(H) に対し相対モジュラー

作用素(relative modular operator)∆σ,ρ を

∆σ,ρ : L(H) → L(H)

∈ ∈

A 7→ ∆σ,ρ[A] := σAρ−1

で定め、h(1) = 1 を満たす任意の函数 h : R+ → R に対し h-ダイバージェンス

(h-divergence)10を

Dh(ρkσ) := Tr [ρh(∆σ,ρ)[I]]

10情報理論に f -ダイバージェンスがあり、量子 f -ダイバージェンスと呼ばれる事が多いが、本講

義では f は Petz 函数に用いているので、ここでは代わりに h を用いる。

Page 16: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

16

と定義する。ここで I は H 上の恒等変換。h が狭義凸なら、Dh(ρkσ) = 0 かつ 等

号成立は ρ = σ のときに限る。h が更に作用素凸ならば、任意の量子操作 Γ に対し

単調性

Dh(Γ(ρ)kΓ(σ)) 5 Dh(ρkσ)が成立する(Petz, 1980 年代)。この h-ダイバージェンスの無限小版として計量

g(h) = [g(h)ij ] が

Dh(ρθ+dθkρθ) = Dh(ρθkρθ+dθ) = 1

2

Xi,j

g(h)ij dθ

idθj

で定まる。Dh(ρkσ) は ρ,σ に関し対称ではないが、計量 g(h) は対称である。また

Dh の単調性から g(h) の単調性が従う。h から Petz 函数を定める式は知られている

が、ここでは略す。h00(1) = 1 となるよう h を取れば Petz 函数は f(1) = 1 を満た

し、可換な方向は Fisher 計量と一致するよう出来る。対数微分も略す。

例 5.4 (BKM 計量 gB). 名前の BKM は統計力学で有名な物理学者 Bogoliubov,

Kubo, Mori の頭文字であるが、彼らは Riemann 計量として gB を導入した訳で

はない。gB は統計物理学における線型応答理論において現れる。

計量 gB を定める準備として h(x) = − log x に対する h-ダイバージェンス

D(ρkσ) = Tr [ρ(log ρ− log σ)]を考え、これを量子相対エントロピー(quantum relative entropy)と呼ぶ。これは

K-Lダイバージェンスの量子版であり非常に重要である。h(x) = − log xは作用素凸

であるからこれは単調性を満たす(よってこれより定まる計量も単調性を満たす)。

D(ρθ+dθkρθ) = D(ρθkρθ+dθ) = 1

2

Xi,j

gBijdθidθj

で単調計量 gB = [gBij ] を定め BKM 計量と呼ぶ。m-表現を用いず e-表現のみで表

してみるとこれは

gBij = Tr [(∂iρ)(∂j log ρ)] =

Z 1

0

Tr [ρλ(∂i log ρ)ρ1−λ(∂j log ρ)] dλ

となる。これは Fisher 計量と非常に似ている。また対数微分も

Li = ∂iρ

と Fisher 計量と類似している。Petz 函数は

∂iρ =

Z 1

0

ρλ(∂i log ρ)ρ1−λdλ =

Z 1

0

(∆ρ)λ[Liρ] dλ

から

f(t) =

Z 1

0

tλ dλ =t− 1log t

となる。これは t = 0 で f(0) = 0 から S1 へ拡張は出来ない。

Page 17: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

17

計量 gB は対応する e-接続の捩率が零となる唯一の単調計量である(計量から e-

接続の定め方は 7 節で述べる)。

例 5.5 (α-計量 g(α)). これはWigner, Yanase, Dyson の頭文字で WYD 計量とも呼

ばれるが、BKM 計量 gB の場合と同じように彼らは Riemann 計量として g(α) を

導いた訳ではない。

準備として量子 α-ダイバージェンスを α 6= ±1 である実数 α に対し

D(α)(ρkσ) = D(−α)(σkρ) = 4

1− α2(1− Tr [ρ 1−α2 σ

1+α2 ])

で定める。これは

h(α)(t) =4

1− α2(1− t 1+α2 )

に対する量子 h(α)-ダイバージェンスである。任意の α に対し h(α) は狭義凸である。

また作用素凸となるのは −3 5 α 5 3 のときに限る。この量子 α-ダイバージェンス

に対し

limα→−1

D(α)(ρkσ) = D(ρkσ), limα→1

D(α)(ρkσ) = D(σkρ)

が成立する。ここで両式の右辺は共に相対エントロピーである。

−3 5 α 5 3 に対し

D(α)(ρθ+dθkρθ) = D(α)(ρθkρθ+dθ) = 1

2

Xi,j

g(±α)ij dθidθj

で計量 g(α) = [g(α)ij ] を定め α-計量と呼ぶ。これはまた

g(±α)ij =

4

1− α2Tr [(∂iρ

1−α2 )(∂jρ

1+α2 )]

とも書ける。−3 5 α 5 3 としたので g(α) は単調計量である。Petz 函数は

f(t) =1− α2

4

(t− 1)21 + t− t 1+α2 − t 1−α2

となり、−1 < α < 1 なら f(0) > 0 で S1 に拡張出来るが、α 5 −1, 1 5 α なら拡

張出来ない。

また g(α) に対し

g(±1) := limα→±1

g(α) = gB, g(±3) := limα→±3

g(α) = gR

が成立する。

Page 18: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

18

6. SLD、RLD 計量と推定論

ここでは SLD 計量、RLD 計量が推定論で重要で、他の計量は出てこないかを前

節の続きとして述べる(古典論の場合については昨年度の講義 [4] を参照の事)。こ

こでの内容は、量子系では物理量 A が定数とどれくらい異なるかを表す2つの尺度

『余接ベクトルの変動は期待値が状態にどのくらい依存するか』と『測定値がどれく

らいバラつくか(分散的)』を計量を用いて結び付ける事であり、これが推定論で

あるとは直ぐには判り難いかもしれない(古典系で Fisher 計量が重要な理由と類す

る)。また推定論で重要である事と他の問題で重要である事は必ずしも一致しない。

古典系では必然ではないにしても Fisher 計量しか現れない。Cencov の定理の恩恵

により、異なる問題を考えていても計量としては Fisher 計量しか現れない。古典系

では推定論、仮説検定、情報理論でも結局は Fisher 計量になり、概念的な区別を付

け難い。量子系では概念的違いがしばしば現れ、それは計量の違いとなって現れる。

推定論を精確に定式化するには時間が掛かるので、ここでは大雑把に次のような

推定問題を考える。

問題:未知のパラメータ θ から定まる量子系に対する測定から得られる推定値 θ

を θ に出来るだけ近くしたい。

ρθ Ã ◦測定

θ

θ = (θ1, . . . , θk):未知

推定

この問題では一つの状態 ρ が与えられている場合もあれば、同じ θ に対し複数の

ρ のコピーがある場合も扱う。このとき原理的にどの程度の精度で推定出来るかを

考える(推定量 θ は測定なので POVM であり、Cramer-Rao 型不等式などを用い

て求めていく)。推定問題はこのような問題である。

より原理的な視点に立つことで、この問題は次の問題に帰着される(ちょっと云

い過ぎの感あり):平均 hAiρ = Tr [ρA] のオブザーバブル11 A ∈ Lh(H) に対し、状

態 ρ を用意すると測定値として A の固有値が得られる。

ρ Ã ◦A

測定値(A の固有値)

11可観測物理量。実数に値を取る観測に対応するもの。誤差の入らない測定は一つの Hermite 作

用素で与えられる。

Page 19: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

19

このとき ρ を S 上の函数と考えると期待値函数

hAi : S → R

∈ ∈

ρ 7→ hAiρの『変動』は

k(dhAi)ρk2 =Xi,j

gij∂ihAi∂jhAi

によって測られる(ここで g は S 上の計量。これは当然 g の取り方に依る)。

これを別の観点から見てみる。g に対する対数微分は

g(∂, ∂0) = Tr [(∂ρ)|{z}∂(m)

L∂0|{z}∂0(e)

]

で定義された。ここで T(e)ρ := Lh,ρ,0 上の内積12 ¿ , Àρ を導入することでこれは

g(∂, ∂0) = Tr [(∂ρ)L∂0 ] =¿ L∂ , L∂0 Àρ

と書ける。g は接ベクトルに対する内積であるが、¿ , À は作用素に対する内積で

あり L2-内積の量子版(の一種)と見做せる。即ち『L2(ρ)-内積モドキ』である。実

際、古典論では

g(∂, ∂0) =Xx

p(x)∂i`(x)∂j`(x) = Ep[∂i` ∂j`] (L2(p), `(x) = log p(x))

であった。このとき次が成立:

k(dhAi)ρk2 =¿ A− hAi, A− hAi Àρ=: Wρ[A].

証明は以下の通り:計量による余接ベクトルと接ベクトルの対応と e-表現によって

(dhAi)ρ g←→ (gradhAi)ρ e-rep.←→ (gradhAi)(e)ρ (∗)= A− hAiρ

∈ ∈ ∈

T ∗ρ Tρ T(e)ρ

と対応している。ここで (∗) の部分の等号は、任意の ∂ ∈ Tρ に対し Tr [∂ρ] = 0

から

∂hAi = Tr (∂ρ)A = Tr [(∂ρ)(A− hAiρ)]であるが、一方 gradhAi の定義から

∂hAi = g(∂, gradhAi) = Tr [(∂ρ)(gradhAi)(e)]となるので (gradhAi)(e) = A− hAiρ を得る。

12Lh,ρ,0 は ρ で期待値を取ると 0 となる Hermite 作用素の全体であった。また T(e)ρ は古典論に

倣った表示である。

Page 20: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

20

ここで Wρ[A] := k(dhAi)ρk2 と定めたが、これは A から平均 hAi を引いて L2-内

積を取っているから『分散モドキ』である13。ここまでは一般の計量 g に対して成

立するが、これがどの程度『分散』かを考える。SLD 計量 g = gS の場合 Wρ は本

当の分散である。実際、任意の A,B ∈ T (e)ρ に対し

¿ A,B Àρ= Re Tr (ρAB)

となるので

Wρ[A] = Tr [ρ(A− hAiρ)2] =: Vρ[A].これは本当の分散(A を測定すると固有値のどれかが得られるが、その測定値の本

当の分散)なので Vρ と置いた。これより Cramer-Rao 型不等式が得られる。SLD

計量 gS は推定論のみで重要な計量ではないが、これが一つ推定論で重要な理由で

ある。

g 6= gS の場合は W 6= V(i.e.,本当の分散ではない)。例えば BKM 計量 g = gB

の場合 L2 内積モドキは

¿ A,B Àρ=

Z 1

0

Tr [ρλAρ1−λB] dλ

となり、これはカノニカル相関(canonical correlation)と呼ばれる(A = B でも分

散にはならない)。この式で特に ρ が Gibbs 状態 ecH(c:定数、H:Hamiltonian)

なら、これは統計力学ではしばしば現れる(これが BKM の名の由来)。これは相

関と名が付いているが、複数の物理量の統計的相関を表す量ではない。古典系では

相関になるが、量子系の場合は相関に似た量である。

次に RLD 計量について簡単に述べる。複素 RLD 計量は推定で重要である(実

RLD 計量はそうでもない)。複素 RLD 計量 g = gR に対して、Hermite とは限ら

ない任意の作用素 A ∈ L(H) に対し

k(dhAi)ρk2 = Tr [ρ(A− hAi)(A− hAi)∗] (←複素化された分散)

が成立する。これより RLD Cramer-Rao 型不等式が得られる(POVM に関する議

論を積み重ね、実際に推定論的状況を考える事で(或る不等式を用いると)Hermite

とは限らない作用素の問題に帰着される。そこで上式を用いる事で得られる)。

7. S 上の e-接続、m-接続

m-接続は S がアフィン空間の凸開部分集合なので自然な平坦接続として定まる。

この m-接続の双対接続として e-接続を定める事が可能となる。本節ではこれらの

接続の性質、測地線などについて述べる。

13分散は通常 V で表す。モドキなので W で表している。

Page 21: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

21

S ⊂ Lh,1 を開集合とする。Lh,1 はアフィン空間であるから、これより自然な平坦

接続が S に誘導される。これを m-接続として ∇(m) で表す。当然、曲率 R(m) = 0、

捩率 T (m) = 0 である。このとき m-測地線は

ρt = (1− t)ρ0 + tρ1

となる。

S 上の計量 g に対し e-接続 ∇(e) を ∇(m) の計量 g に関する双対接続で定義する。

このとき曲率は R(e) = 0 を満たす。∇(e) に対し捩率 T (e) を

T(e)ij,k := Γ

(e)ij,k − Γ(e)ji,k = Tr [(∂iLj − ∂jLi)∂kρ]

で定める。これは対数微分の非対称性を表すものであり、T (e) = 0 なら双対平坦空

間 (S, g,∇(m),∇(e)) を得るが、一般には零でない。計量 g がユニタリ不変14、従っ

て単調計量なら

T (e) = 0 ⇔ g = gB

が成立する。このとき双対平坦空間 (S, gB,∇(m),∇(e))を得る。また BKM計量 gB か

ら定まる双対平坦構造に関するカノニカル・ダイバージェンス(canonical divergence)15 は量子相対エントロピーと一致する(これは古典論と同じである)。これにより

量子相対エントロピーは特別な意味を持つ事が判る。

次にこれら2つの接続の幾何的様相を見ていく。先ずそれぞれの接続係数は

Γ(m)ij,k = g(∇(m)∂i

∂j, ∂k) = Tr [(∂i∂jρ)Lk],

Γ(e)ij,k = Tr [(∂iLj)∂kρ]

と書ける。但し Lj, Lk は g に関する対数微分。これより ∇(m) と ∇(e) の双対性が

判る:

∂igjk = ∂iTr [(∂jρ)Lk] = Γ(m)ij,k + Γ

(e)ik,j.

m-平行移動は

Tρm←→ Tσ

∈ ∈

∂ ∂0

l l(∂)(m) = ∂ρ = (∂0)(m) = ∂0σ

14この条件は緩める事が出来るように思われる(が追求はしていない)。またユニタリ不変の仮定

は単調性よりは弱い。15色々な定義があるが、ここでは略す。昨年の講義 [4]では述べた。

Page 22: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

22

で与えられる(作用素として等号)。一方 e-平行移動は

Tρe←→ Tσ

∈ ∈

∂ ∂0

l lL = ∂(e) ↔ (∂0)(e) = L0

∈ ∈

Lh,ρ,0 Lh,σ,0としたとき (

L0 = L− Tr [σL],L = L0 − Tr [σL0]

となる(e-平行移動は期待値が零となるように定数を引いて等号)。これを確かめる

には双対性、即ち内積を保つ事を見れば良い。いま m-平行ベクトル場 X と e-平行

ベクトル場 Y に対し

g(Xρ, Yρ) = Tr [X(m)ρ Y (e)ρ ]

(∗∗)= Tr [X(m)

σ Y (e)σ ] = g(Xσ, Yσ)

から平行移動の正しい事が確かめられた。但し (∗∗) では X(m)ρ = X

(m)σ であり、共

に Tr = 0 即ち共に Lh,0 に属する事と Y(e)σ = Y

(e)ρ −(期待値) を用いた(期待値は定

数である事に注意)。これにより平行移動が容易に求められるので測地線も直ぐに

判る事になる(測地線の方程式を解かなくて良い)。実際に 5 節で述べた計量のう

ち3つ(SLD, BKM, 実 RLD)に関する e-測地線は以下のようになる(但し e-接続

は計量に依存するから、e-測地線も計量によって変わる事に注意)。因みに古典論の

場合、e-測地線は

pθ(x) = p0(x)eθf(x)−ψ(θ)(7.1)

の形で、これは1次元指数型分布族であった。

(i) SLD 計量 g = gS の場合 e-測地線は

ρθ = e12(θF−ψ(θ))ρ0e

12(θF−ψ(θ))(7.2)

の形となる(これを確かめるには対数微分を求めてそれが平行である事を見れば良

い。以下の2例も同様に確かめられる)。但し θ ∈ R, F ∈ Lh, ψ : R→ R. 形が指

数型分布族に似てる。

(ii) BKM計量 g = gB の場合:捩率も零であり、これが最も古典系の場合に近い。

e-測地線は

ρθ = elog ρ0+θF−ψ(θ)(7.3)

となる。これも指数型分布族に似てる。

Page 23: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

23

(iii) 実 RLD 計量 g = gR の場合は

ρθ = ρ120 e

θF−ψ(θ)ρ120(7.4)

である。

8. SLD の最小性、RLD の最大性

前節の測地線の式を用いて SLD 計量 gS の最小性と RLD 計量 gR の最大性を述

べる。先ずは gS の最小性から。

SLD 計量 gS の e-測地線 (7.2) において F を

F =

dXi=1

f(i)|iihi|

と固有値分解する。但し

 ・{f(i) ; 固有値 } ⊂ R(これは Hermite 性から);

 ・{|ii}:固有ベクトルからなる正規直交基底;

 ・|iihi| :固有ベクトル |ii 方向への1次元射影作用素。

いま pθ(i) := Tr [ρθ|iihi|] と置く。これは ρθ の下でオブザーバブル F を測定したと

き i 番目の値が出る確率を表す。

ρθ Ã ◦F

i ∼ pθ(i) (i 番目の出る確率が pθ(i))

このとき |ii が固有ベクトルである事から

e12(θF−ψ(θ))|ii = e 12 (θf(i)−ψ(θ))|ii

が成立する。これにより pθ(i) は

pθ(i) := Tr [ρθ|iihi|] = hi|ρθ|ii = p0(i)eθf(i)−ψ(θ)

と計算出来る。最右辺の p0(i)eθf(i)−ψ(θ) は古典的指数型分布族である。

ここで古典的モデル {pθ} の Fisher 情報量を g(θ) と置く。

η(θ) := Eθ[f ] =Xi

pθ(i)f(i)(∗)= Tr [ρθF ]

(ここで (∗) にはちょっとした計算が必要)から

g(θ) = Eθ[(f − η(θ))2] = Tr [ρθ(F − η(θ))2]

Page 24: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

24

となるが、SLD 計量 gS に対して対数微分は (7.2) と SLD 計量の定義式とから

Lθ = F − η(θ) となるので

g(θ) = Eθ[(f − η(θ))2] = Tr [ρθ(F − η(θ))2] = gS(θ)

を得る。測定値の分布の Fisher 情報量は SLD 計量である。

一方、g を任意の単調計量とすると、任意の(1 次元)曲線 {ρθ} に対し単調性

から

g(θ) = g

µdρθdθ,dρθdθ

¶= g(θ) = gS(θ)

が成立する(不等号の部分については量子操作と測定の関係を論じる必要があるが

略す)。任意の点 ρ ∈ S と任意の接ベクトル ∂ ∈ Tρ(S) とに対し⎧⎨⎩ ρθ = ρ,µdρθdθ

¶θ=0

= ∂

を満たす e-測地線 {ρθ} が存在するので gS の最小性

g = gS

が示された。

次に実 RLD の最大性について述べる。これは松本啓史氏(NII:国立情報学研究

所)との private communication (2005)16 に依る。但し論文になっているかは不明。

e-測地線 (7.4) において F を固有値分解する:

F =

dXi=1

f(i)|iihi|.

このとき

ρθ = ρ120

Xi

eθf(i)−ψ(θ)|iihi|ρ120

=Xi

pθ(i)σi

と書ける。但し

pθ(i) := hi|ρ0|ii| {z }k

p0(i)

eθf(i)−ψ(θ), σi :=1

p0(i)ρ120 |iihi|ρ

120 ∈ S1 ⊂ S

16RLD 計量の重要性は認識していたが、その実部を考える事に意味を見出していなかった。RLD

計量の測地線も知ってはいたが、量子情報幾何の解説 [5] などにも、頁数の関係もあり敢えて実 RLD

計量については書かなかった。しかし云われてみれば非常に自然な議論で得られる結果であり、どう

して気付かなかったのかと思う事であり、悔しい思いをした。

Page 25: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

25

と置いた。σi はトレースが 1 となるようにしてある(更に確率分布になる)。ここ

で古典モデル {pθ} の Fisher 情報量を g(θ) と置くと

g(θ) = gR(θ)

が成り立つ(計算のみ。略す)。一方、任意の単調計量 g に対し

g(θ) = g

µdρθdθ,dρθdθ

¶5 g(θ) = gR(θ)

が成立。ここで不等号の部分は次の直感的説明で理解して頂きたい:古典系 X =

{1, . . . , d} 上の確率分布 pθ に対し、i ∈ X が確率 pθ(i) で出てくる。i が出たら σi

を起動して粒子を放出する。σi から粒子が放出される部分のみ見るとこれは ρθ か

ら粒子が出ているように見える。

古典系

X = {1, . . . , d} i σi/

\ Ã ◦

ρθ/

\ Ã ◦

opθ(i)pθ

このプロセスは古典的な分布から量子状態を作っている(古典が基にある)。なので

単調性から、量子状態の方が計量は減る。本当は量子操作に対する定義を少し拡げ

る必要があるが、単調計量はこの意味での単調性を満たすので問題は無い。

SLD 計量の最小性の場合と同様に任意の始点と接ベクトルに対する測地線を考え

る事により gR の最大性を得る。

注意 8.1. SLD 計量は S1 に拡張出来るが、RLD 計量は S1 では発散してしまう。

途中のランク Sr でも存在するものは限られている。ではどのような接ベクトルに

対し RLD 計量は有限となるかと云えば、その方向が mixture に対応していれば有

限の値になる。mixture とは古典から量子を作る操作である。

9. 統計的識別

本節では二つの状態の統計的識別問題について、以前から予想されており最近証

明された結果を述べる。これは古典的には非常に情報幾何的な問題であり K-L ダ

イバージェンスや e-測地線などの現れる世界での話である。量子系の場合にはこれ

が情報幾何的な枠組みには収まりきらないが、境界での状況を見ると相対エントロ

ピーが現れてくるという意味で、今後の発展とも繋がる(かもしれない)内容であ

る。本節の内容については [5, p. 884] を参照の事(但し記号が若干異なる)。

Page 26: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

26

いま同一の状態である n 個の独立な量子系があり、その状態は全て ρ か又は全て

σ であるかのいずれかの状況で、どちらが本当の状態かは判っていない場合に、測

定を行ってどちらなのかを判別する問題を考える。このときに n が非常に大きいと

きの漸近論を展開したい。測定を行って、どちらの状態でありそうかを求める為に、

0 と 1 をそれぞれに対応する測定値として2値の測定を行う事になる。測定値 0 が

得られたら状態は ρ⊗n(全て ρ)と判断し、1 なら σ⊗n と判断する事にする。この

とき誤りは

   (i) 本当は ρ⊗n なのに σ⊗n と誤る;

   (ii) 本当は σ⊗n なのに ρ⊗n と誤る;

の2種類が考えられ、(i) の確率 αn は2値の POVM M = {M0,M1} を用いて

αn = Tr [ρ⊗nM (n)

1 ]

となり、(ii) の確率 βn は

βn = Tr [σ⊗nM (n)

0 ]

となる。この状況において、αn と βn の両方を小さくする事は出来ない。なので問

題の設定としては『αn 5 A の下で βn を小さくする(またはその逆)』となる。い

ま n を非常に大きく取っていく場合に

limn→∞

αn = 0 = limn→∞

βn

は容易に実現出来る。なので問題は収束の速さである。例えば βn 5 e−nr との制限

の下で αn の零への収束の速さ(指数部分)を考える。

古典論では、最適な仮説検定は尤度比検定である事が知られているので、尤度比

を表す統計量で色々なものが決定される。古典論なので ρ, σ の代わりに p, q を考

え、F (x) = log p(x)q(x)

と置くとこの確率変数 F (x)の振る舞いが判れば仮説検定のレー

ト(指数の速度)の問題は解ける。ここで F (x) の振る舞いは大偏差(期待値から

外れた所に行く確率の零への収束速度の)問題が解ければ良い事になる。ここで考

えている問題は Bernoulli 試行なので Cramer の定理からモーメント母函数(また

はキュムラント母函数)によって記述される事が判る。

一方、量子系の場合、これに対応する問題は解かれていなかった。いま

ψ(θ) = log Tr [ρθσ1−θ](9.1)

を考える(キュムラント母函数の対応物で先ず思い付くもの)。これに対し古典論と

同様の計算で最適なレートが与えられるのではないかと予想はされていた。

この問題に関連し、Audenaert et al. [1]と Nussbaum and Szkola [6]がこの問題の

一部を含む Chernoff bound 予想を独立に全く新しい手法で解いた。そして Hayashi

[2] で達成可能性が、Nagaoka [3] で達成限界がそれぞれ示された(これら4つとも

全て 2006 年の preprint)。これでこの予想も解かれた事になるが、肝心の結果は

(9.1) で良いであった。この結果は量子情報理論にとっては良いものであるが、情報

Page 27: 古典情報幾何から量子情報幾何へ 長岡浩司 ...ohnita/2006/2007/mini2007/nagaoka.pdf · (2) 不変なp 上のアフィン接続は{α-接続; α∈r} に限られる4。

27

幾何にとっては少々困るものである。BKM 計量 gB の ρ と σ を結ぶ e-測地線 (7.3)

における ψ は

ψ(θ) = log Tr [e(θ log ρ+(1−θ)σ)]

と書ける。この ψ と (9.1) の ψ とは ρ と σ が非可環の場合は異なり常に ψ 5 ψ が

成立する(古典論なら同じ)。もし小さい方の ψ を用いてレートの計算が出来るの

であれば、古典論の場合の幾何学的状況が再現出来る(S の幾何学的情報で分布の

識別問題が記述出来る)。ところが実際は ψ ではなく ψ であり、ρθσ1−θ は Hermite

作用素ではない。なのでこれは状態を作って規格化定数として出てくる類のもので

はない。しかし ψ を微分する事で

ψ0(1) = D(ρkσ), ψ0(0) = −D(σkρ)(9.2)

として端では相対エントロピーが現れる。仮説検定で相対エントロピーが出てくる

のはこの部分のみを見ていた事になる。量子情報理論で相対エントロピーが重要な

のはほぼ (9.2) のみが重要な場合を扱っていると云って良い。色々なものの指数レー

トを考えていくと相対エントロピーでは表しきれない状況が出てくる。古典論の場

合は端でない部分も相対エントロピーの幾何で記述出来た。なので相対エントロピー

は非常に重要だと思い込んでいた。

ここから先を考えるとき、それが幾何学的に理解出来る保証は無い。

References

[1] K.M.R. Audenaert, J. Calsamiglia, Ll. Masanes, R. Munoz-Tapia, A. Acin, E.

Bagan, F. Verstraete, The Quantum Chernoff Bound, arXiv:quant-ph/0610027

[2] Masahito Hayashi, Quantum estimation and the quantum central limit theorem,

arXiv:quant-ph/0608198

[3] Hiroshi Nagaoka, The Converse Part of The Theorem for Quantum Hoeffding Bound,

arXiv:quant-ph/0611289

[4] 長岡 浩司, 情報幾何の基礎概念, 大阪市立大学数学研究所ミニスクール「情報幾何への入門と応

用」報告集, 2006.

http://math01.sci.osaka-cu.ac.jp/%7Eohnita/2006/inf_geom/minis.html

[5] 長岡 浩司, 量子情報幾何の世界, 電子情報通信学会論文誌 VOL.J88-A No.8 August 2005.

[6] M. Nussbaum and A. Szkola, A lower bound of Chernoff type for symmetric quantum

hypothesis testing, arXiv:quant-ph/0607216

[7] D. Petz, Monotone metrics on matrix spaces. Linear Algebra Appl. 244 (1996), 81—96.

[8] D. Petz and C. Sudar, Geometries of quantum states, J. Math. Phys. 37 (1996), no. 6,

2662—2673.