kdd2013読み会資料「confluence: conformity influence in large social newtworks』
TRANSCRIPT
Confluence: Conformity Influence in Large Social Networks
Jie Tang, Sen Wu, Jimeng Sun
KDD2013読み会
Gunosy Inc.
Coffee Yoshida
2013/09/08 KDD2013読み会
概要
• グループや友人に同調して、意見や行動を変更する社会的な影響があり、Comformityと呼ぶ– Comformity = 順応、従順、服従
• 3種類のConformity(individual, peer, group)の影響を定式化したConfluenceモデルを提案する
• Flickr、Gowalla、Weibo、Co-Authorのデータを使い、Confluenceモデルでユーザのアクションを予測する実験を行った
2013/09/08 KDD2013読み会
イントロ
• Conformityとは– 社会心理学とかで言われる、グループの規範に従うように、
態度・信念・行動を変更すること
• Conformityを引き起こす原因– 個人のステータス、個人間の影響、周りのプレッシャー、
などなど、、
• Conformityに取り組む理由– 社会心理学とは別の視点からConformityに取り組み、その
影響を定式化することによって、ソーシャルネットワーク上の複雑なダイナミクスを理解するのに役立つ
2013/09/08 KDD2013読み会
イントロ
• Conformityに取り組む上での課題
1.色々な要素が混ざったConformityを、どのように区別・定義するか?
2.どのようにモデルを構築するか?
3.どのように、提案モデルが、実際のソーシャルネットワーク上で有効であるかを示すか?
2013/09/08 KDD2013読み会
イントロ
• Conformityに取り組む上での課題1.色々な要素が混ざったConformityを、どのように区別・定義するか?⇒ individual, peer conformity, group conformityの3つに分けた
2.どのようにモデルを構築するか?⇒ probabilistic factor graph modelであるConfluence Modelを提案した
3.どのように、提案モデルが、実際のソーシャルネットワーク上で有効であるかを示すか?⇒ 4つのソーシャルネットワーク(Flickr、Gowalla、Weibo、Co-Author)で実験した(アクション予測について)
2013/09/08 KDD2013読み会
問題定義 - Notations
2013/09/08 KDD2013読み会
問題定義 – 入力と出力
• 入力
– ネットワーク
– アクション履歴
• 出力
– 3種類のConfirmityの内、各ユーザにとってどれが重要か
– アクションの予測
G = (V,E,C,X)
A = {(a,vi, t)}a,i,t
q* = argmaxq Pq (Y t |G,A)
Y * = argmaxY t+1 Pq* (Y
t+1 |G,A)
2013/09/08 KDD2013読み会
問題定義 – Individual Conformity
• 3種類のConformity – Individual Conformity– 同調する相手が誰かは関係なしに、あるユーザのそもそも
の同調しやすやを表す
– (友人と同じアクションを、友人がアクションを行ってから、閾値時間 ε 以内に行った回数) / (全アクション数)
– 自分のアクションの内、友人がちょっと前に同じアクションを行っていた割合
2013/09/08 KDD2013読み会
問題定義 – Peer Conformity
• 3種類のConformity – Peer Conformity– 特定の友人に対する同調しやすさ
– (友人 v’ と同じアクションを、友人 v’ がアクションを行ってから、閾値時間 ε 以内に行った回数) / (ある友人 v’ の全アクション数)
– 友人のアクションの内、自分がちょっと後に同じアクションを行った割合
2013/09/08 KDD2013読み会
問題定義 – Group Conformity
• 3種類のConformity – Group Conformity– 特定のグループに対する同調しやすさ
– (グループ内のユーザと同じアクションを、そのユーザがアクションを行ってから、閾値時間 ε 以内に行った回数)/ (あるグループ Ck に属するユーザの τ %以上が行った全アクション数)
– グループの τ%以上のメンバーが行ったアクションの内、自分が他のグループメンバーのちょっと後に同じアクションをした割合
2013/09/08 KDD2013読み会
(再掲)問題定義 – 入力と出力
• 入力
– ネットワーク
– アクション履歴
• 出力
– 3種類のConfirmityの内、各ユーザにとってどれが重要か
– アクションの予測
G = (V,E,C,X)
A = {(a,vi, t)}a,i,t
q* = argmaxq Pq (Y t |G,A)
Y * = argmaxY t+1 Pq* (Y
t+1 |G,A)
2013/09/08 KDD2013読み会
Confluence Model – 図
2013/09/08 KDD2013読み会
Confluence Model – 目的関数
• 目的関数(Hammersley-Clifford theoremを使った)
q = ({a},{b},{g},{m})パラメータ:
2013/09/08 KDD2013読み会
Confluence Model – Peer Conformity Factor
• Peer Conformity Factor
– Conformityがあったと認める閾値 ε を決めるのは難しい
– Conformityが、アクションの時間差に応じて小さくなっていくと考える
– 実験では、 ε = 1, λ = 2 とした
2013/09/08 KDD2013読み会
Confluence Model – Group Conformity Factor
• Group Conformity Factor
– τ = 0.25とした
– 各グループのメンバー25%以上が行ったアクションのみに、Conformityを考える
– 複数のグループに所属している場合、それぞれGroup Conformity Factorを考える
– Newman法を使用して、グループに分けた
2013/09/08 KDD2013読み会
Confluence Model – Individual conformity factor
• Individual conformity factor
2013/09/08 KDD2013読み会
(再掲)Confluence Model – 目的関数
• 目的関数(Hammersley-Clifford theoremを使った)
q = ({a},{b},{g},{m})パラメータ:
2013/09/08 KDD2013読み会
Confluence Model – Feature Definition
• Conformity要素とは別の要素も考慮した– ユーザ属性
• フレンド数、直近3タイムスタンプでの新規フレンド数、所属グループ数、直近3タイムスタンプでの新規グループ数
– Opinion leader• ユーザがOpinion leaderか否か(Influence Rankを使用)
– Structure hole• ユーザがStructure holeか否か
– Social ties
• フレンド間の繋がりの強弱(コミュニケーション頻度とコモンネイバー数)
– Social balance• 4種類のトライアドがあるか否か
2013/09/08 KDD2013読み会
Confluence Model – Feature Definition
• Conformity要素とは別の要素も考慮した
– ユーザ属性、Opinion leader、Structure holeは、として目的関数に混ぜた
– Social ties、Social balanceはと同じ形式で、目的関数に混ぜた
f (yi, xi, j )
g(yi, y ' j, pcf (vi,v j ))
2013/09/08 KDD2013読み会
Confluence Model – Distributed Model Learning
• 分散学習アルゴリズムを提案
– 実際のソーシャルネットワークは、ノード数多いので、スケールする学習アルゴリズムが必要
1. グラフをサブグラフに分け、各サブグラフ内で、各パラメータについての目的関数の勾配を算出(スレーブで並列処理)
2. 全パラメータを勾配にもとづいて、最適化(マスターで行う)
2013/09/08 KDD2013読み会
Confluence Model –Model Inference
• 学習したパラメータ θ を使用して、t + 1 のアクションを予測する
Y * = argmaxY t+1 Pq* (Y
t+1 |G,A)
2013/09/08 KDD2013読み会
実験 - データセット
• データセット
– Flickr
• アクション:写真にコメント
– Gowalla
• アクション:チェックイン
• アクション:2012年の10個のホットトピックについてのつぶやき
– Co-Author
• アクション:ある分野の論文執筆
2013/09/08 KDD2013読み会
実験 - データセット
2013/09/08 KDD2013読み会
実験
• 評価手法– Prediction Accuracy
• アクション予測• Precision、Recall、F1値、AUC
– Scalability Performance– Qualitative Case Study
• 比較手法– SVM
• ユーザ属性、individual conformityを使用
– ロジスティック回帰• ユーザ属性、individual conformityを使用
– CRF• ユーザ属性、ソーシャル属性、individual conformity、peer
conformityを使用
2013/09/08 KDD2013読み会
実験 – Prediction Performance
• F1値トップだった(1〜17%増加)
2013/09/08 KDD2013読み会
実験 – Factor Contribution Analysis
• CF(Conformity Factor)を入れた時の伸び大きい(2〜20%増加)
2013/09/08 KDD2013読み会
実験 – Effects of Conformity
• CF(Conformity Factor)を入れないとすごい下がる
• Group Conformityが一番効いてる
2013/09/08 KDD2013読み会
実験 – Scalability Performance
• スレーブ数増やすと、スピード上がっていく
2013/09/08 KDD2013読み会
実験 – Scalability Performance
• 比較手法よりも高速
2013/09/08 KDD2013読み会
実験 – Qualitative Case Study
• Peer Conformityの影響が大きいアクション1を行っているユーザの多いグループ1は、繋がりが疎で、対立的な意見のコメンが多い
• Group Conformityの影響が大きいアクション2を行っているユーザの多いグループ2は、繋がりが密で、旅グループぽい
2013/09/08 KDD2013読み会
まとめ
• 3つのConformityを定義した
• Conformity Influenceを定式化したConfluence Modelを提案した
• アクション予測結果抜群だった
• 分散学習モデル高速だった
• ケーススタディでもモデルの有効性示せた
2013/09/08 KDD2013読み会