コミュニティ分割されたコミュニティの特性解析 - huscapb-04...

3
Instructions for use Title コミュニティ分割されたコミュニティの特性解析 Author(s) 三好, 栄次; 鈴木, 育男; 山本, 雅人; 古川, 正志 Citation 情報処理北海道シンポジウム2008講演論文集, B-04 Issue Date 2008-09-19 Doc URL http://hdl.handle.net/2115/51359 Rights ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著 作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「 情報処理学会倫理綱領」に従うことをお願いいたします。 Type article File Information 2008B04.pdf Hokkaido University Collection of Scholarly and Academic Papers : HUSCAP

Upload: others

Post on 27-Jan-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

  • Instructions for use

    Title コミュニティ分割されたコミュニティの特性解析

    Author(s) 三好, 栄次; 鈴木, 育男; 山本, 雅人; 古川, 正志

    Citation 情報処理北海道シンポジウム2008講演論文集, B-04

    Issue Date 2008-09-19

    Doc URL http://hdl.handle.net/2115/51359

    Rightsここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。

    Type article

    File Information 2008B04.pdf

    Hokkaido University Collection of Scholarly and Academic Papers : HUSCAP

    https://eprints.lib.hokudai.ac.jp/dspace/about.en.jsp

  • B-04

    情報処理北海道シンポジウム 2008

    コミュニティ分割されたコミュニティの特性解析

    三好栄次* 鈴木育男山本雅人古川正志

    (~ヒ大工/

    1はじめに

    近年, web技術の進歩, SNSなどによりweb上のネット

    ワークが飛躍的に拡大されてきた.またそれに伴いネッ

    トワークからコミュニティを抽出する研究も盛んに行

    われている.大規模なネットワークにおけるコミュニテ

    ィ抽出の手法についてはGirvan,Newm姐, Clauset[llらに

    よって提案されている.

    本研究の目的は, コミュニティ分割されたコミュニテ

    ィに対し, (1)平均クラスタリング係数, (2)各コミュニ

    ティ内における平均パス長を求め,分割されたコミュニ

    ティ内でのコミュニティの特性解析を行った結果を報

    告する.

    2 コミュニティ分割

    2.1 コミュニティ分割とは

    コミュニティ分割とは, ネットワーク上のノードをあ

    る指標に基づき,特定の集団として抽出する操作であり,

    本研究では指標にモジュラリティ (Modularity)を用いる.

    モジュラリティはコミュニティ内にエッジが多く,コミ

    ュニテ・ィ聞にエッジが少ないノード集合が良く分割さ

    れたコミュニティである前提で, コミュニティの分割の

    評価を数値化したものである.

    2.2分割手法

    Clauset[llの提案したコミュニティ分割手法は, コミュ

    ニティ同士を結合した際のモジュラリティの変化が最

    も大きい結合を選びながらコミュニティを抽出する手

    法 であ る.今,対象となるネットワーク N を

    N=(V,E),v=かIカ・νi...}.E=お=ιvJv川 jE V}とし,mを総エッジ数,島をノード niの次数,Qijをモジュラ

    リティ, 及びAQをモジュラリテイの変化分とする.こ

    のとき分割アノレゴリズムは以下となる.

    1.全てのノードをコミュニティ内ノード数 lのコミュニ

    ティとする.

    2.ノード間エッジeij=(nド nj)において,全てのエッジ集

    合を Eとし.AQijの初期値をノードの次数kiんを用

    い以下の条件で求める.

    [email protected]十札幌市北区北 14条西 9丁目北海道大学工学部

    44i =~~/m一的/2m2J 匂・ d, IO;~ f/=E

    3.それぞれのノードに関して,

    ki a, =一一ー一2m

    を求める.

    (2)

    (3)

    4.最も値の大きい AQijを選び,iとjに相当するコミュ

    ニティを統合する.

    5.コミュニティ聞のエッジ匂 =(Ci,Cj)に関して,i,jに関

    連するエッジの集合を円とする.企Qの値を以下に

    従い更新する.

    IAQik +AQjk; eik,ejk E巧

    AQ'jk = 1 AQik -2a jak'向kE Eij ' ejk rf_ Eij IAQjk一2aiak;ejk E Eij,eik rf_ Eij

    6. aj;を更新する.

    (4)

    7. AQが正である,またはコミュニティが一つになるま

    でステップ 3からステップ 6までを繰り返す.

    3数値計算実験

    3.1実験条件

    本研究で、はAmazon.comの米国政治に関する本のオン

    ライン販売のネットワーク [2]をコミュニティ分割の対象

    ネットワークとする.このネットワークでは本をノード

    とし, ある本を購入した人が別の本を購入したとき, ノ

    ード聞にエッジが張られる.

    実験に用いられるデータはIVI= 105, IEト441である.

    長手ー

    cs一一

    。a 一一 @ ~- ~

    Fig.lオンライン販売のネットワーク.可視化ツーノレ

    としてP司jek[31を使用

  • 6-04

    情報処理北海道シンポジウム 2008

    使用したネットワークを図 1に示す.なお今回使用し

    た計算機の性能は, Pentium4 2.60GHzメインメモリ

    1.0GB である.

    3.2実験方法

    Clausetのコミュニティ分割方法を上記に述べたネッ

    トワークに適用し,分割を行う.その後,分割された各

    コミュニティに対し,それぞれの平均クラスタリング係

    数 ι平均ノ〈ス長 Lを計算し,コミュニティごとに数値を比較する. コミュニティごとのクラスタリング係数

    の計算では,コミュニティ聞に張られているエッジは無

    いものとして,計算する.

    3.3結果

    数値計算実験で得られたコミュニティ分割数は4であ

    り,各コミュニティの LとCを表 lに示す.又,得られ

    たコミュニテイネットワーク全体の分割を図 2に,それ

    ぞれのコミュニティを図 3に示す.

    このとき得られたモジュラリティ Qは0.501,であり,

    またネットワーク全体の平均パス長Lは3.079,平均クラ

    スタリング係数 Cは0.488,となっている.

    モジュラリティの値からある程度まとまりのあるコ

    ミュニティとして分割が得られている.

    4考察

    ネットワーク全体に対し,分割されたコミュニティで

    は平均クラスタリング係数は高く,平均パスも 2前後で

    あり,コミュニティ内のノード間距離も短い.更に分割

    されたコミュニティ内ではほぼ確実にセットで買われ

    ている本が存在している.又,その本を中心としたハブ、

    が,コミュニティを形成しており,そこでは平均パス長

    が低くなっている.平均クラスタリング係数においては,

    モジュラリティの定義から高くなったことが分かる.こ

    れらから,コミュニティ内で、はスモーノレ・ワールドを形

    成していることも観察できた.

    5おわりに

    本研究では,コミュニティ分割とそのコミュニティの

    特性解析を行った.実験より,抽出されたコミュニティ

    が高いクラスタリング係数,短い平均パス長を持ち,ス

    モール・ワールドを形成しているのが判明した.今後の

    課題としてプログラムの高速化,別の指標を用いた手法,

    分割を評価するための新たな情報の追加,異なるデータ

    での実験と結果の比較が必要となる.

    Table 1各コミュニティ情報

    I Ivl IEI L C (1 ) 49 201 2.11 0.529

    (2) 3 3

    (3) 12 25 1.8- 0.636

    (4) 41 176 2 0.554

    Fig.2ネットワーク全体のコミュニティ分割

    ー 。) • -.r土手二 ー-',,1民謡手で-!..~

    .・;対乞J .

    • • (3)

    • 一 一ー .

    .・• . ... .

    • •

    .・1記号・-Fig.3分割されたコミュニティをコミュニティ聞のリンクを除き,コミュニティごとに表示

    参考文献

    [1] Aaron Clauset, M. E. J. Newman,姐dCristopher Moore,

    "Finding commu血tys仕ucωrein very 1紅 genetworks",

    紅 Xiv:cond-mat/0408187v2(2004).

    [2] Network data

    ht土p://www-personal.umich.edu/-mejn/netdata/ [3] Networks / P司ek

    h句://vlado.fmf.uni-lj.sν'pub/networks/p司jek!