論文紹介: connections between human dynamics and network science
TRANSCRIPT
Connections between Human Dynamics and
Network ScienceChaoming Song, Dashun Wang, Albert-Laszlo Barabasi
(under review)http://arxiv.org/abs/1209.1411
takano, twitter: @mtknntkm
ビッグデータと複雑系科学
● 幅広く大量のデータが集められる、処理できるように○ 複雑系研究(細胞生物学から計算機科学まで)は再形成されている
● これは Human DynamicsとSocial Media研究 を前進させた○ E-mail, 携帯端末, ソーシャルネットは大量の「動的な行動パターン」データ
○ 特にNetwork ScienceとHuman Dynamicsを刺激した
Network Science と Human Dynamics
Network Science
Human Dynamics
● Network Science○ ネットワークの構造とそれの動力学に焦点
■ 個体間相互作用の全体的性質
■ 現実世界のネットワークの全体的な性質に関する発見
● スケールフリーネットワークとかのロングテール的な性質
● リンクの強さを特徴づける予測可能なパターン
● Human Dynamics○ 個体間相互作用のパターンの一時的な形態に焦点
○ 相互作用の時間とか
■ これもロングテール
● ランダムだとポアソンになるはずなので、
ランダムとは著しく異なる
● これらは同じ系・データセットに関する研究だが
平行して研究され、あまり交わりがない
目的
● 両者を繋ぐこと○ Network ScienceとHuman Dynamicsの定量的特徴を繋ぐ
○ 複数の系を幅広く横断する一般性を示す
● 使うデータ○ Twitter, Mobile Phone, E-mail (Enron), Online Messages
社会ネットワークのベキ則
● ネットワーク全体の特性○ b) 友達の数の分布
■ 度数 k の分布
○ c) 社会関係の強さの分布
■ 相互作用頻度 w の分布
● コミュニケーションの動的特性○ d) アクティブ度の分布
■ 他者との相互作用回数 C の分布
○ e) 2者間の相互作用間隔 τ の分布
● どのデータでも類似の傾向
○ ネットワーク全体の特性とコミュニケーションの動
的特性は独立に報告された
ネットワーク特性とコミュニケーション特性の結合
● 各個体の以下の2つを比較してみる○ ネットワーク全体の特性「友達の数 k の分布」
○ コミュニケーションの動的特性「アクティブ度 Cの分布」
● 結果、○
という関係だった(α < 1)
● 友達を増やすためには、アクティブ度をもっと増やさ
なければならない
● → 社会関係を広げるほど一人あたりのコスパは
悪くなる
● α は社会的能力と言える
社会的能力 α の分布
● メディアによって異なる○ コミュニケーションシステムを特徴づける指標になりうる
● 社会的能力 α はアクティブ度 C に依存しない
i.e., α と C は独立
動的さ β(β: 2者間の相互作用間隔 τ の分布のべき係数)
はコミュニケーションシステム間の違いがない
※ F(x) = exp(σx)/(1+s exp(k x))
各データは国(文化)もデモグラも違うので、
かなり幅広い不変性がありそう
● Scaling Regimeに限定すると○ exp(σ β/β^)=β/β^
度数分布 P(k) と社会的能力α・アクティブ度C
● kはC^αに比例し、αとCは独立なので↑のように書ける
● つまり、○ 度数分布のべき分布(ロングテール性)は社会的能力とアクティブ度の不均一性に起因する
● もし、P(C)が支配的だったら、P(α)を無視して○
● もし、P(α) が支配的だったら、P(C)を無視して○
● べき係数 γ は社会的能力の多様性σ で決まる。
平均的なアクティブ度Cはべき係数を減らす
度数分布 P(k) と社会的能力α・アクティブ度CだいたいFit※ 図a-dMobile PhoneだけはP(C) が支
配的なときにはFitしなかった
べき係数γ P(C) が支配的なとき P(α) が支配的なとき
社会関係の強さw の比率(r=w/C)
● rの分布(図a)はべき分布
○ 一部の仲の良いヒトとずっとコミュニ
ケーション
○ べき係数はCに非依存、αに依存して
各個人で異なる
○ r^(-α)にすると個体差はなくなる
● 重みの分布は
● 全てのコミュニケーションシス
テムでFit
まとめ
● P(k)とP(C)とP(α) の関係はネットワーク構造と各人のダイナミクスをつなぐ
● 各指数はコミュニケーションシステムを特徴づける指標群になりうる○ より理解するには数理モデルの構築が必要
○ 本研究の結果から、これらのコミュニケーションシステムを一つのモデルで説明できそう
● 本研究で発見したNetwork ScienceとHuman Dynamicsの関係はビッグデータに
基づく社会のメカニズム的な理解のきっかけとなるだろう