第 Ⅱ 部  社会構造概念の彫琢

25
第第第第第第第第第 第8第 第第第第第第第第第第第第第第 2008/10/06( 第 ) Social Network Seminar 第第第第 M1

Upload: caelan

Post on 30-Jan-2016

30 views

Category:

Documents


0 download

DESCRIPTION

第 Ⅱ 部  社会構造概念の彫琢. 第 8 章 統計的社会ネットワークモデル. 2008/10/06( 月 ) Social Network Seminar M1 浦田淳司. 8.1  統計モデルと社会ネットワーク分析 ‐ 妥協か進歩か 8.2  トライアッド・センサスと推移性の測定 ‐ 三者関係の統計分析 8.3  社会ネットワークのマルコフ連鎖過程モデル ‐ 社会関係の離散確率モデル 8.4    モデル族 ‐ 結合関係の諸傾向をパラメーター化し、推定する 8.5    モデルの展開と   統計的社会ネットワーク・モデリングの定着. 内容. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第 Ⅱ 部  社会構造概念の彫琢

第Ⅱ部 社会構造概念の彫琢

第 8 章 統計的社会ネットワークモデル

2008/10/06( 月 )Social Network Seminar

M1 浦田淳司

Page 2: 第 Ⅱ 部  社会構造概念の彫琢

2

内容

8.1  統計モデルと社会ネットワーク分析‐ 妥協か進歩か

8.2  トライアッド・センサスと推移性の測定‐ 三者関係の統計分析

8.3  社会ネットワークのマルコフ連鎖過程モデル‐ 社会関係の離散確率モデル

8.4    モデル族‐ 結合関係の諸傾向をパラメーター化し、推定する

8.5    モデルの展開と  統計的社会ネットワーク・モデリングの

定着

1p

*p

Page 3: 第 Ⅱ 部  社会構造概念の彫琢

統計モデルと社会ネットワーク分析 妥協か、進歩か。

3

Page 4: 第 Ⅱ 部  社会構造概念の彫琢

統計的・・・

4

統計的なモデル:データ間の独立性を仮定

社会ネットワークモデル:社会単位間の結合従属性を仮定

⇒ マルコフモデルや独立性の議論の進展により、実用化

残る問題点・専門の統計技法に偏り、社会ネットワーク分析本来の自由な数学的モデル化が制限・社会構造というよりも、結合対の属性や属性間の有意な関係を分析しているに過ぎない

なおも、統計的社会ネットワークモデルは 社会ネットワーク分析にとって独自の進歩なのか、

             あるいは統計的方法への妥協に過ぎないのか

といった問いが残る

Page 5: 第 Ⅱ 部  社会構造概念の彫琢

対の相互化モデル  ( Katz and Powell

1955 )

5

ダイアッド間の結合の測定のためのモデル(相互対について検討)

ネットワークメンバー N 人、各人の選択数 d

◆ 個人の間に偶然相互対が形成される確率 2

2

)1( Nd

◆ ネットワークの中で期待される相互対の総数

)1(2)1(2

)1()0|(

2

2

2

N

Nd

N

dNNmE

◆ 条件付き確率とパラメータ

)|Pr()Pr()Pr( baabbaabba

)1

d-1-N

1(1

)Pr(

NN

d

N

dabba τ

)1(

)1(2 2

dNNd

NdmN

τ

選択しない部分

Page 6: 第 Ⅱ 部  社会構造概念の彫琢

トライアッド・センサスと推移性の測定 三者関係の統計分析

6

Page 7: 第 Ⅱ 部  社会構造概念の彫琢

トライアッド・センサス

7

・ダイアッド:アクター i と j の二者関係・トライアッド:アクター i,j,k の三者関係  → 相互対の数 m 、非対象対の数 a 、無結合数 n を並べて名前をつける

布置というベクトルで集計        102}0,0,1,1,0,0{},,,,,{ jikjikkijkij aaaaaa

}0,1,0,0,1,0{

}1,0,0,0,0,1{

トライアッドのタイプ別出現頻度をベクトル T 上で整理↓

固有の重みをかけて、ダイアッドの数を計算

個人の小集団のモデル化には適するが、組織全体の分析には対応していない

Page 8: 第 Ⅱ 部  社会構造概念の彫琢

社会ネットワークの マルコフ連鎖過程モデ

ル 社会関係の離散確率モデル

8

Page 9: 第 Ⅱ 部  社会構造概念の彫琢

離散過程のモデル化

9

● ランダム・ダイグラフアクター ij 間の結合のあるなしをランダムに決定→ネットワークを生成

● マルコフ連鎖前提:時間軸 t 導入  時点 t の二項結合関係 Xij(t)={xij(t)}   ( 0 or 1 )

時間間隔 (t,t+dt) における、遷移確率はすべて事前の状態 {X(s):s<t} に依存し、これに限定を加えないと手に負えない

● モデル化のための仮定

仮定 1   X(t)はマルコフ連鎖であるPab(t,t+dt)=P{Xij(t+dt)=b|X(t)=a}

仮定 2 ひとつの結合の変化しか同時には与えられない

Page 10: 第 Ⅱ 部  社会構造概念の彫琢

相互性モデル

10

仮定 1 , 2 より同時遷移率は

と示される。マルコフ連鎖 X(t) における微小遷移率であり、時間 t のときの特性に依存。

● 相互性モデル

ij 間の結合の生成・切断は、j から i への相互結合の有無に関係しているとする

jiij

jiij

xta

xta

111

000

),(

),(

ダイアッドの状態: Dij(t)={Xij(t),Xji(t)}には、 (0,0) (1,0) (0,1) (1,1)  の 4 つがありうる。

jijiij

jijiijjiij

jijiij

xxtN

xxxxtA

xxtM

,

)1)(1()(

)]1()1[()(

)(

非結合対数

非対象対数

相互対数相互性モデルで測定されるべきは

であり、うち 2 つがわかれば、パラメータが推定できる

パラメータ推定は煩雑で、連続時間確率過程において、マルコフ過程が仮定されているが、非常に厳しい仮定といえ、より現実的なモデルへの置き換えが必要

Page 11: 第 Ⅱ 部  社会構造概念の彫琢

P1モデル族結合関係の諸傾向をパラメータ化し、推定する

11

Page 12: 第 Ⅱ 部  社会構造概念の彫琢

p 1モデルとは

12

n×n の二項行列 X において、相互対数、ノード j の入次数を

ji i

ijjjiij XXXXM1

,

で表し、平均や分散と比較すると、相互対と結合の受信は偶然以上に頻繁に起こっていること  がわかる。

(社会的諸関係の相互化傾向、差別的受信傾向)

このような偏向した相互対、受信対が存在する M と X+j をコントロールするパラメータをもった分布族が要請され、

ログリニアモデルを応用し、 p1モデルが考案された

特徴・偏向パラメータを指数族として表現・マルコフ性などの仮定を導入せず    →きわめて柔軟なモデル化

Page 13: 第 Ⅱ 部  社会構造概念の彫琢

p 1モデルとは

13

n×n の隣接行列 A 上の確率関数 p1(x) は

}){},{,,(}exp{

)()(1

jijjii Kxxxpm

xXPxp

相互性 全結合 出次数 入次数 正規化のための定数

)0}{}{( ii

特徴:ダイアッド Dij は独立的である→推移性や派閥化は表現できない相互化傾向、差別的受信のみ表現

各種対の確率は

と表現され、

X の確率分布は

となる

Page 14: 第 Ⅱ 部  社会構造概念の彫琢

p 1モデルとは

14

指数形を強調して書き換えると、

ji ji

ijji

ijijjiijij nxxxxXP }exp{)(

jina

jiaanm

ijijij

jiijijijij

);/log(

));/()log((

ただし

また、この二つのパラメータに対して、(全ての i<j に関して)

という制約がある

0ji

jiij

ij

Page 15: 第 Ⅱ 部  社会構造概念の彫琢

パラメータ解釈

15

(1) ρ,{αi},{βi} を 0 と仮定する隣接行列 A における分布は独立同等分布 (iid) になり、

となる。これは、 Xij= 1 に対するそうでない場合の比率、準密度を表しているので、

このパラメータ θ を密度パラメータという。

(2)θ,{βi} を 0 と仮定する上と同様に、各行において iid で、

αi は X の出次数を統制し、 αi が大きく正であると結合の送信の増加になるので、

このパラメータ αi を生産性パラメータをいう。

(3)θ, {αi} を 0 と仮定する上と同様に、各行において iid で、

βi は X の入次数を統制し、 βi が大きく正であると結合の受信の増加になるので、

このパラメータ βi を牽引性パラメータをいう。

)1/log()/log(00 ppna ijijij

)1/log()/log(0 ppna ijijiij

)1/log()/log(0 ppna ijijjij

Page 16: 第 Ⅱ 部  社会構造概念の彫琢

p 1モデルの意義とその拡張

16

p1モデルは「社会単位の独立性の仮定」をとりはずし、ダイアッドの独立性を仮定。

否定意見:確率が 0.5 をも下回っているのに、隣接行列を予測しようというのはおかしい。 個人と関係の構造を対の積み重ねへと分解してしまっている

(ぶつぎりにされたダイアッドの統計分析)肯定意見( Fienberg and Wesserman 1981b )3因子交互作用のないログリニアモデルを、 4元分割表に適合させればよい。

と配列。 p1は

)()1(log

)1(log

)1(log

11

01

00

ijjijiijij

ijjjiijij

ijij

YP

YP

YP

という関係にある。

Page 17: 第 Ⅱ 部  社会構造概念の彫琢

p 1モデルの拡張

17

p 1の最尤推定法は、以下の対数尤度関数を最大化することである。

対数尤度比 LLR は  

・結合( k,l )を二項関係から有値関係に発展させること。( Xij=k,Xji=l  として、そこに強度を表現)・カテゴリーを考慮するには、 4 つの変数のうち、どれか 2 つの相互作用(周辺度数)をモデルにふくめればよい。

モデルの拡張

Page 18: 第 Ⅱ 部  社会構造概念の彫琢

P *モデルの展開と 統計的社会ネットワーク・モデリングの定着

18

Page 19: 第 Ⅱ 部  社会構造概念の彫琢

p* モデルとは

19

マルコフ・ランダム・グラフと呼ばれるグラフに依拠した指数族のモデルであり、ダイアッド間の独立性を前提としない統計的なモデル化( Frank and Strauss, 1986 )

X を単独、二項、有向関係に対するソシオマトリクスとし、下のように表記できる。

観測データ x に関する全ての関数 z1(x),z2(x), ・・・ ,zr(x) とする。(※結合数、相互対数、アクターのある属性値、などなんでも)

また、 θ をパラメータとすると、下のように表記できる

確率は 0 から 1 の間でなくてはならないので、対数変換して、

Page 20: 第 Ⅱ 部  社会構造概念の彫琢

p* モデルのパラメータ

20

)(

}exp{)Pr(

k

LxX

もっとも単純な形

正規化定数を求めることが困難⇒ロジットモデルの適応

Page 21: 第 Ⅱ 部  社会構造概念の彫琢

ロジット p* ・モデル

21

p* モデルは、個別の結合に対する確率でなく、結合の全コレクションについてのもの。なので、ネットワークの他のすべての結合に条件づけられた確率が使われる。

)|0Pr(

)|1Pr(}exp{

cijij

cijij

ij XX

XX

他のネットワークすべてを含み、正規化定数に依存していないまた、これは

)(zdij

パラメータを属性に依存させ、なおかつ構造をみることが可能

Page 22: 第 Ⅱ 部  社会構造概念の彫琢

マルコフ・グラフ

22

ダイアッド間の従属性を仮定するマルコフ・グラフの導入その推定法としての準尤度推定法の考案

⇒p*モデルのモデル化

従属グラフ:条件的に従属したすべての対を結合するような線からなるグラフ

1

2

3 4

G :マルコフグラフD :従属グラフ

34

1413

2423

12

・ D のクリークは、 G ではトライアングルかスター

→ クリークを問題にする時は、トライアッドかスターのみ考えればよい

   モデル化の仮定を単純化してくれる

Page 23: 第 Ⅱ 部  社会構造概念の彫琢

準尤推定??

23

従属構造をモデル化しているので、尤度計算において、手に負えない正規化のためパラメータの推定において最尤推定が不可能

⇒ 条件的確率のロジット ωij を統計的に独立的であると仮定した準尤推定を用いる

準尤度関数最大化することは、ロジスティック回帰モデルをロジット{ ωij }にフィットさせることと同値であるので

ネットワークデータと関連するアクターの属性をとって、反応変数に関するパラメータのベクトルと

説明変数に関するパラメータの行列を作成すれば、最大準尤度推計値と概算的な誤差値を得るために、

ロジスティック回帰の一般計算パッケージを利用できる

具体事例は  Anderson, Wasserman and Crouch(1999) の小学生の友人関係モデル

ジェンダーに注目。ただ詳しくわからないので、いつか論文ゼミで・・・

Page 24: 第 Ⅱ 部  社会構造概念の彫琢

p * モデルのゆくえ

24

この分野のモデルの発展はほぼ完成↓実用的な段階にきている。が、応用研究はイリノイ大学の一部のみ

理由 1:社会ネットワーク分析の主流とは関係なく、純統計学的な知識が必要理由 2:複数の統計ソフトを使いこなさなければならない

しかし、統計学社会ネットワーク分析が新しい可能性を示しているのは間違いない(筆者談)

Page 25: 第 Ⅱ 部  社会構造概念の彫琢

END

25