Download - 第 Ⅱ 部 社会構造概念の彫琢
第Ⅱ部 社会構造概念の彫琢
第 8 章 統計的社会ネットワークモデル
2008/10/06( 月 )Social Network Seminar
M1 浦田淳司
2
内容
8.1 統計モデルと社会ネットワーク分析‐ 妥協か進歩か
8.2 トライアッド・センサスと推移性の測定‐ 三者関係の統計分析
8.3 社会ネットワークのマルコフ連鎖過程モデル‐ 社会関係の離散確率モデル
8.4 モデル族‐ 結合関係の諸傾向をパラメーター化し、推定する
8.5 モデルの展開と 統計的社会ネットワーク・モデリングの
定着
1p
*p
統計モデルと社会ネットワーク分析 妥協か、進歩か。
3
統計的・・・
4
統計的なモデル:データ間の独立性を仮定
社会ネットワークモデル:社会単位間の結合従属性を仮定
⇒ マルコフモデルや独立性の議論の進展により、実用化
残る問題点・専門の統計技法に偏り、社会ネットワーク分析本来の自由な数学的モデル化が制限・社会構造というよりも、結合対の属性や属性間の有意な関係を分析しているに過ぎない
なおも、統計的社会ネットワークモデルは 社会ネットワーク分析にとって独自の進歩なのか、
あるいは統計的方法への妥協に過ぎないのか
といった問いが残る
対の相互化モデル ( Katz and Powell
1955 )
5
ダイアッド間の結合の測定のためのモデル(相互対について検討)
ネットワークメンバー N 人、各人の選択数 d
◆ 個人の間に偶然相互対が形成される確率 2
2
)1( Nd
◆ ネットワークの中で期待される相互対の総数
)1(2)1(2
)1()0|(
2
2
2
N
Nd
N
dNNmE
◆ 条件付き確率とパラメータ
)|Pr()Pr()Pr( baabbaabba
)1
d-1-N
1(1
)Pr(
NN
d
N
dabba τ
)1(
)1(2 2
dNNd
NdmN
τ
選択しない部分
トライアッド・センサスと推移性の測定 三者関係の統計分析
6
トライアッド・センサス
7
・ダイアッド:アクター i と j の二者関係・トライアッド:アクター i,j,k の三者関係 → 相互対の数 m 、非対象対の数 a 、無結合数 n を並べて名前をつける
布置というベクトルで集計 102}0,0,1,1,0,0{},,,,,{ jikjikkijkij aaaaaa
}0,1,0,0,1,0{
}1,0,0,0,0,1{
トライアッドのタイプ別出現頻度をベクトル T 上で整理↓
固有の重みをかけて、ダイアッドの数を計算
個人の小集団のモデル化には適するが、組織全体の分析には対応していない
社会ネットワークの マルコフ連鎖過程モデ
ル 社会関係の離散確率モデル
8
離散過程のモデル化
9
● ランダム・ダイグラフアクター ij 間の結合のあるなしをランダムに決定→ネットワークを生成
● マルコフ連鎖前提:時間軸 t 導入 時点 t の二項結合関係 Xij(t)={xij(t)} ( 0 or 1 )
時間間隔 (t,t+dt) における、遷移確率はすべて事前の状態 {X(s):s<t} に依存し、これに限定を加えないと手に負えない
● モデル化のための仮定
仮定 1 X(t)はマルコフ連鎖であるPab(t,t+dt)=P{Xij(t+dt)=b|X(t)=a}
仮定 2 ひとつの結合の変化しか同時には与えられない
相互性モデル
10
仮定 1 , 2 より同時遷移率は
と示される。マルコフ連鎖 X(t) における微小遷移率であり、時間 t のときの特性に依存。
● 相互性モデル
ij 間の結合の生成・切断は、j から i への相互結合の有無に関係しているとする
jiij
jiij
xta
xta
111
000
),(
),(
ダイアッドの状態: Dij(t)={Xij(t),Xji(t)}には、 (0,0) (1,0) (0,1) (1,1) の 4 つがありうる。
jijiij
jijiijjiij
jijiij
xxtN
xxxxtA
xxtM
,
)1)(1()(
)]1()1[()(
)(
非結合対数
非対象対数
相互対数相互性モデルで測定されるべきは
であり、うち 2 つがわかれば、パラメータが推定できる
パラメータ推定は煩雑で、連続時間確率過程において、マルコフ過程が仮定されているが、非常に厳しい仮定といえ、より現実的なモデルへの置き換えが必要
P1モデル族結合関係の諸傾向をパラメータ化し、推定する
11
p 1モデルとは
12
n×n の二項行列 X において、相互対数、ノード j の入次数を
ji i
ijjjiij XXXXM1
,
で表し、平均や分散と比較すると、相互対と結合の受信は偶然以上に頻繁に起こっていること がわかる。
(社会的諸関係の相互化傾向、差別的受信傾向)
このような偏向した相互対、受信対が存在する M と X+j をコントロールするパラメータをもった分布族が要請され、
ログリニアモデルを応用し、 p1モデルが考案された
特徴・偏向パラメータを指数族として表現・マルコフ性などの仮定を導入せず →きわめて柔軟なモデル化
p 1モデルとは
13
n×n の隣接行列 A 上の確率関数 p1(x) は
}){},{,,(}exp{
)()(1
jijjii Kxxxpm
xXPxp
相互性 全結合 出次数 入次数 正規化のための定数
)0}{}{( ii
特徴:ダイアッド Dij は独立的である→推移性や派閥化は表現できない相互化傾向、差別的受信のみ表現
各種対の確率は
と表現され、
X の確率分布は
となる
p 1モデルとは
14
指数形を強調して書き換えると、
ji ji
ijji
ijijjiijij nxxxxXP }exp{)(
jina
jiaanm
ijijij
jiijijijij
);/log(
));/()log((
ただし
また、この二つのパラメータに対して、(全ての i<j に関して)
という制約がある
0ji
jiij
ij
パラメータ解釈
15
(1) ρ,{αi},{βi} を 0 と仮定する隣接行列 A における分布は独立同等分布 (iid) になり、
となる。これは、 Xij= 1 に対するそうでない場合の比率、準密度を表しているので、
このパラメータ θ を密度パラメータという。
(2)θ,{βi} を 0 と仮定する上と同様に、各行において iid で、
αi は X の出次数を統制し、 αi が大きく正であると結合の送信の増加になるので、
このパラメータ αi を生産性パラメータをいう。
(3)θ, {αi} を 0 と仮定する上と同様に、各行において iid で、
βi は X の入次数を統制し、 βi が大きく正であると結合の受信の増加になるので、
このパラメータ βi を牽引性パラメータをいう。
)1/log()/log(00 ppna ijijij
)1/log()/log(0 ppna ijijiij
)1/log()/log(0 ppna ijijjij
p 1モデルの意義とその拡張
16
p1モデルは「社会単位の独立性の仮定」をとりはずし、ダイアッドの独立性を仮定。
否定意見:確率が 0.5 をも下回っているのに、隣接行列を予測しようというのはおかしい。 個人と関係の構造を対の積み重ねへと分解してしまっている
(ぶつぎりにされたダイアッドの統計分析)肯定意見( Fienberg and Wesserman 1981b )3因子交互作用のないログリニアモデルを、 4元分割表に適合させればよい。
と配列。 p1は
)()1(log
)1(log
)1(log
11
01
00
ijjijiijij
ijjjiijij
ijij
YP
YP
YP
という関係にある。
p 1モデルの拡張
17
p 1の最尤推定法は、以下の対数尤度関数を最大化することである。
対数尤度比 LLR は
・結合( k,l )を二項関係から有値関係に発展させること。( Xij=k,Xji=l として、そこに強度を表現)・カテゴリーを考慮するには、 4 つの変数のうち、どれか 2 つの相互作用(周辺度数)をモデルにふくめればよい。
モデルの拡張
P *モデルの展開と 統計的社会ネットワーク・モデリングの定着
18
p* モデルとは
19
マルコフ・ランダム・グラフと呼ばれるグラフに依拠した指数族のモデルであり、ダイアッド間の独立性を前提としない統計的なモデル化( Frank and Strauss, 1986 )
X を単独、二項、有向関係に対するソシオマトリクスとし、下のように表記できる。
観測データ x に関する全ての関数 z1(x),z2(x), ・・・ ,zr(x) とする。(※結合数、相互対数、アクターのある属性値、などなんでも)
また、 θ をパラメータとすると、下のように表記できる
確率は 0 から 1 の間でなくてはならないので、対数変換して、
p* モデルのパラメータ
20
)(
}exp{)Pr(
k
LxX
もっとも単純な形
正規化定数を求めることが困難⇒ロジットモデルの適応
ロジット p* ・モデル
21
p* モデルは、個別の結合に対する確率でなく、結合の全コレクションについてのもの。なので、ネットワークの他のすべての結合に条件づけられた確率が使われる。
)|0Pr(
)|1Pr(}exp{
cijij
cijij
ij XX
XX
他のネットワークすべてを含み、正規化定数に依存していないまた、これは
)(zdij
パラメータを属性に依存させ、なおかつ構造をみることが可能
マルコフ・グラフ
22
ダイアッド間の従属性を仮定するマルコフ・グラフの導入その推定法としての準尤度推定法の考案
⇒p*モデルのモデル化
従属グラフ:条件的に従属したすべての対を結合するような線からなるグラフ
1
2
3 4
G :マルコフグラフD :従属グラフ
34
1413
2423
12
・ D のクリークは、 G ではトライアングルかスター
→ クリークを問題にする時は、トライアッドかスターのみ考えればよい
モデル化の仮定を単純化してくれる
準尤推定??
23
従属構造をモデル化しているので、尤度計算において、手に負えない正規化のためパラメータの推定において最尤推定が不可能
⇒ 条件的確率のロジット ωij を統計的に独立的であると仮定した準尤推定を用いる
準尤度関数最大化することは、ロジスティック回帰モデルをロジット{ ωij }にフィットさせることと同値であるので
ネットワークデータと関連するアクターの属性をとって、反応変数に関するパラメータのベクトルと
説明変数に関するパラメータの行列を作成すれば、最大準尤度推計値と概算的な誤差値を得るために、
ロジスティック回帰の一般計算パッケージを利用できる
具体事例は Anderson, Wasserman and Crouch(1999) の小学生の友人関係モデル
ジェンダーに注目。ただ詳しくわからないので、いつか論文ゼミで・・・
p * モデルのゆくえ
24
この分野のモデルの発展はほぼ完成↓実用的な段階にきている。が、応用研究はイリノイ大学の一部のみ
理由 1:社会ネットワーク分析の主流とは関係なく、純統計学的な知識が必要理由 2:複数の統計ソフトを使いこなさなければならない
しかし、統計学社会ネットワーク分析が新しい可能性を示しているのは間違いない(筆者談)
END
25