複雑ネットワークの成長過程における統計的推測: 大規模...

2
1 複雑ネットワークの成長過程における統計的推測: 大規模データから探る普遍なメカニズム Thong Pham 1,* 下平英寿 2,1 1 理化学研究所 革新知能統合研究センター(AIP) 数理統計学チーム 2 京都大学 大学院情報学研究科 多分野に渡る現実のネットワークを支配する解釈しやすい普遍的な成長メカニズムがあるだろう か? 1999 年、Barabási [1]は、一見関係がないように見える電力供給ネットワーク、昆虫の神経ネ ットワーク、俳優の共演関係を表すネットワークと WWW のネットワークの背景に、優先的選択とい う成長メカニズムがあるだろうと主張した。彼らの発見以来、優先的選択メカニズムは複数の分野で 複数の実ネットワークでも確認され、複雑ネットワーク分野のブームを巻き起こす一つの要因となっ た。 優先的選択メカニズムでは、ネットワークの成長過程に登場するリンクがノード # に接続する確率 # は、そのノードが既に持っているリンクの数 の優先的選択関数 に比例する: # . が増加関数であれば、多くのリンクを持っているノードの方が、少数のリンクしか持っていないノ ードより新しいリンクを獲得する確率が高いことを意味する。これは、豊かな者が更に豊かになると いう「rich-get-richer」の現象であり、社会学、経済学や生物学等で昔から知られている極めて普遍的 な現象である。 しかし、rich-get-richer メカニズムだけでは、ネットワークの成長過程を説明しきれない場合があ る。なぜなら、この現象では二つのノードが同じ次数を持っていれば、確率 # も同じになるが、例え WWW では同じリンクの数を持っても、内容がより面白くて魅力を感じさせるサイトの方が確率 # が高いと思われる。故に、ノード間の個体差をモデル化する必要が出てくる。このように個体差を表 すのは「fit-get-richer」のメカニズムである[2]。このメカニズムでは、確率 # はノードごとに決まる 適応度 # に比例する: # # . # はノードの魅力の強さを表すと見做せる。rich-get-richer と同様に、fit-get-richer も社会学や生物 学などで知られている普遍的な現象である。 本研究は、確率 # は優先的選択関数 と適応度 # の積に比例すると仮定する: # # . このモデルを用いて # を同時推定すれば、現実のネットワークで rich-get-richer fit-get-richer のメカニズムのどちらがより強く働くのかという検証が可能になる。本研究の貢献は以下のように二 つある: l 優先的選択関数 と適応度 # 同時推定する方法を提案する[3, 4]。図1のシミュレーション結 果から分かるように、提案手法はうまく動作する。図 2 は実際のネットワーク(FBW)で推定 した の関数と # の分布を表す。図 2 からこのネットワークでは rich-get-richer fit-get-richer の両方が働いたことが分かる。推定提案手法の計算アルゴリズムは Minorize-Maximization ルゴリズム[5]と解釈できて、目的関数の単調増加性や並列計算の効率化などの特徴が挙げら れる。提案手法のソフトウエアは R パッケージとして公開している[6, 7]l 7 つのカテゴリーにおける 27 個の実ネットワークに対して、優先的選択関数 と適応度 # を同 時推定することによって、rich-get-richer fit-get-richer メカニズムはどのカテゴリーでも存 在することが分かった。しかし、二つのメカニズムの強さの割合はネットワーク毎に違ってく (図3)。本研究はその強さの割合を定量的に図る指標も提案した[8, 9]* Email: [email protected] 科学研究費補助金 新学術領域研究「スパースモデリングの深化と高次元データ駆動科学の創成」 最終成果報告会 (2017/12/18-20)

Upload: others

Post on 31-Jan-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 1

    複雑ネットワークの成長過程における統計的推測:

    大規模データから探る普遍なメカニズム

    ThongPham1,*下平英寿 2,11理化学研究所 革新知能統合研究センター(AIP) 数理統計学チーム

    2京都大学 大学院情報学研究科

    多分野に渡る現実のネットワークを支配する解釈しやすい普遍的な成長メカニズムがあるだろう

    か? 1999 年、Barabási ら[1]は、一見関係がないように見える電力供給ネットワーク、昆虫の神経ネットワーク、俳優の共演関係を表すネットワークとWWWのネットワークの背景に、優先的選択という成長メカニズムがあるだろうと主張した。彼らの発見以来、優先的選択メカニズムは複数の分野で

    複数の実ネットワークでも確認され、複雑ネットワーク分野のブームを巻き起こす一つの要因となっ

    た。 優先的選択メカニズムでは、ネットワークの成長過程に登場するリンクがノード𝑣#に接続する確率

    𝑃#は、そのノードが既に持っているリンクの数𝑘の優先的選択関数𝐴'に比例する:P# ∝ 𝐴'.

    𝐴'が増加関数であれば、多くのリンクを持っているノードの方が、少数のリンクしか持っていないノードより新しいリンクを獲得する確率が高いことを意味する。これは、豊かな者が更に豊かになると

    いう「rich-get-richer」の現象であり、社会学、経済学や生物学等で昔から知られている極めて普遍的な現象である。 しかし、rich-get-richer メカニズムだけでは、ネットワークの成長過程を説明しきれない場合があ

    る。なぜなら、この現象では二つのノードが同じ次数を持っていれば、確率𝑃#も同じになるが、例えばWWWでは同じリンクの数を持っても、内容がより面白くて魅力を感じさせるサイトの方が確率𝑃#が高いと思われる。故に、ノード間の個体差をモデル化する必要が出てくる。このように個体差を表

    すのは「fit-get-richer」のメカニズムである[2]。このメカニズムでは、確率𝑃#はノードごとに決まる適応度𝜂#に比例する:

    P# ∝ 𝜂#.𝜂#はノードの魅力の強さを表すと見做せる。rich-get-richer と同様に、fit-get-richer も社会学や生物学などで知られている普遍的な現象である。 本研究は、確率𝑃#は優先的選択関数𝐴'と適応度𝜂#の積に比例すると仮定する:

    P# ∝ 𝐴'𝜂#.このモデルを用いて𝐴'と𝜂#を同時推定すれば、現実のネットワークで rich-get-richer と fit-get-richerのメカニズムのどちらがより強く働くのかという検証が可能になる。本研究の貢献は以下のように二

    つある:l 優先的選択関数𝐴'と適応度𝜂#を同時推定する方法を提案する[3, 4]。図1のシミュレーション結

    果から分かるように、提案手法はうまく動作する。図 2 は実際のネットワーク(FBW)で推定した𝐴'の関数と𝜂#の分布を表す。図 2からこのネットワークでは rich-get-richerと fit-get-richerの両方が働いたことが分かる。推定提案手法の計算アルゴリズムは Minorize-Maximization アルゴリズム[5]と解釈できて、目的関数の単調増加性や並列計算の効率化などの特徴が挙げられる。提案手法のソフトウエアは Rパッケージとして公開している[6, 7]。

    l 7つのカテゴリーにおける 27個の実ネットワークに対して、優先的選択関数𝐴'と適応度𝜂#を同時推定することによって、rich-get-richer と fit-get-richer メカニズムはどのカテゴリーでも存在することが分かった。しかし、二つのメカニズムの強さの割合はネットワーク毎に違ってく

    る(図3)。本研究はその強さの割合を定量的に図る指標も提案した[8, 9]。

    * Email: [email protected]

    科学研究費補助金 新学術領域研究「スパースモデリングの深化と高次元データ駆動科学の創成」最終成果報告会 (2017/12/18-20)

  • 2

    References [1] Barabasi and Albert. “Emergence of Scaling in Random Networks”. Science (1999). [2] Guido Caldarelli et al. “Scale-Free Networks from Varying Vertex Intrinsic Fitness”. Phys. Rev. Lett. (2002). [3] Thong Pham, Paul Sheridan and Hidetoshi Shimodaira. “PAFit: A Statistical Method for Measuring Preferential Attachment in Temporal Complex Networks”. PLoS ONE (2015). [4] Thong Pham, Paul Sheridan and Hidetoshi Shimodaira. “Joint estimation of preferential attachment and node fitness in growing complex networks”. Scientific Reports (2016). [5] David R Hunter and Kenneth Lange. “A Tutorial on MM Algorithms”. The American Statistician (2004). [6] Thong Pham, Paul Sheridan and Hidetoshi Shimodaira. R package PAFit: https://CRAN.R-project.org/package=PAFit (from 2015/9). [7] Thong Pham, Paul Sheridan and Hidetoshi Shimodaira. “PAFit: An R Package for Modeling and Estimating Preferential Attachment and Node Fitness in Temporal Complex Networks”. arXiv (2017). https://arxiv.org/abs/1704.06017 [8] Thong Pham, Paul Sheridan and Hidetoshi Shimodaira. “The attribution problem in complex networks: untangling the roles of talent and experience in growing networks”. 2016 Conference on Complex Systems, September 2016, Amsterdam. [9] Thong Pham, Paul Sheridan and Hidetoshi Shimodaira. “Multinomial matrix factorization: Joint inference of attachment function and node fitnesses in dynamic networks”. Social influence in networks, Satellite symposium of NetSci 2017, June 2017, Indianapolis.

    図 3: Rich-get-richerと fit-get-richerの強さの割合

    図 1:優先的選択関数と適応度(シミュレーション) 図 2:実ネットワーク(FBW)から推定した優先的選択関数と適応度