kdd2013読み会資料「confluence: conformity influence in large social newtworks』

31
Confluence: Conformity Influence in Large Social Networks Jie Tang, Sen Wu, Jimeng Sun KDD2013読み会 Gunosy Inc. Coffee Yoshida 2013/09/08 KDD2013読み会

Upload: coffee-yoshida

Post on 10-Jul-2015

396 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence: Conformity Influence in Large Social Networks

Jie Tang, Sen Wu, Jimeng Sun

KDD2013読み会

Gunosy Inc.

Coffee Yoshida

2013/09/08 KDD2013読み会

Page 2: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

概要

• グループや友人に同調して、意見や行動を変更する社会的な影響があり、Comformityと呼ぶ– Comformity = 順応、従順、服従

• 3種類のConformity(individual, peer, group)の影響を定式化したConfluenceモデルを提案する

• Flickr、Gowalla、Weibo、Co-Authorのデータを使い、Confluenceモデルでユーザのアクションを予測する実験を行った

2013/09/08 KDD2013読み会

Page 3: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

イントロ

• Conformityとは– 社会心理学とかで言われる、グループの規範に従うように、

態度・信念・行動を変更すること

• Conformityを引き起こす原因– 個人のステータス、個人間の影響、周りのプレッシャー、

などなど、、

• Conformityに取り組む理由– 社会心理学とは別の視点からConformityに取り組み、その

影響を定式化することによって、ソーシャルネットワーク上の複雑なダイナミクスを理解するのに役立つ

2013/09/08 KDD2013読み会

Page 4: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

イントロ

• Conformityに取り組む上での課題

1.色々な要素が混ざったConformityを、どのように区別・定義するか?

2.どのようにモデルを構築するか?

3.どのように、提案モデルが、実際のソーシャルネットワーク上で有効であるかを示すか?

2013/09/08 KDD2013読み会

Page 5: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

イントロ

• Conformityに取り組む上での課題1.色々な要素が混ざったConformityを、どのように区別・定義するか?⇒ individual, peer conformity, group conformityの3つに分けた

2.どのようにモデルを構築するか?⇒ probabilistic factor graph modelであるConfluence Modelを提案した

3.どのように、提案モデルが、実際のソーシャルネットワーク上で有効であるかを示すか?⇒ 4つのソーシャルネットワーク(Flickr、Gowalla、Weibo、Co-Author)で実験した(アクション予測について)

2013/09/08 KDD2013読み会

Page 6: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

問題定義 - Notations

2013/09/08 KDD2013読み会

Page 7: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

問題定義 – 入力と出力

• 入力

– ネットワーク

– アクション履歴

• 出力

– 3種類のConfirmityの内、各ユーザにとってどれが重要か

– アクションの予測

G = (V,E,C,X)

A = {(a,vi, t)}a,i,t

q* = argmaxq Pq (Y t |G,A)

Y * = argmaxY t+1 Pq* (Y

t+1 |G,A)

2013/09/08 KDD2013読み会

Page 8: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

問題定義 – Individual Conformity

• 3種類のConformity – Individual Conformity– 同調する相手が誰かは関係なしに、あるユーザのそもそも

の同調しやすやを表す

– (友人と同じアクションを、友人がアクションを行ってから、閾値時間 ε 以内に行った回数) / (全アクション数)

– 自分のアクションの内、友人がちょっと前に同じアクションを行っていた割合

2013/09/08 KDD2013読み会

Page 9: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

問題定義 – Peer Conformity

• 3種類のConformity – Peer Conformity– 特定の友人に対する同調しやすさ

– (友人 v’ と同じアクションを、友人 v’ がアクションを行ってから、閾値時間 ε 以内に行った回数) / (ある友人 v’ の全アクション数)

– 友人のアクションの内、自分がちょっと後に同じアクションを行った割合

2013/09/08 KDD2013読み会

Page 10: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

問題定義 – Group Conformity

• 3種類のConformity – Group Conformity– 特定のグループに対する同調しやすさ

– (グループ内のユーザと同じアクションを、そのユーザがアクションを行ってから、閾値時間 ε 以内に行った回数)/ (あるグループ Ck に属するユーザの τ %以上が行った全アクション数)

– グループの τ%以上のメンバーが行ったアクションの内、自分が他のグループメンバーのちょっと後に同じアクションをした割合

2013/09/08 KDD2013読み会

Page 11: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

(再掲)問題定義 – 入力と出力

• 入力

– ネットワーク

– アクション履歴

• 出力

– 3種類のConfirmityの内、各ユーザにとってどれが重要か

– アクションの予測

G = (V,E,C,X)

A = {(a,vi, t)}a,i,t

q* = argmaxq Pq (Y t |G,A)

Y * = argmaxY t+1 Pq* (Y

t+1 |G,A)

2013/09/08 KDD2013読み会

Page 12: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model – 図

2013/09/08 KDD2013読み会

Page 13: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model – 目的関数

• 目的関数(Hammersley-Clifford theoremを使った)

q = ({a},{b},{g},{m})パラメータ:

2013/09/08 KDD2013読み会

Page 14: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model – Peer Conformity Factor

• Peer Conformity Factor

– Conformityがあったと認める閾値 ε を決めるのは難しい

– Conformityが、アクションの時間差に応じて小さくなっていくと考える

– 実験では、 ε = 1, λ = 2 とした

2013/09/08 KDD2013読み会

Page 15: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model – Group Conformity Factor

• Group Conformity Factor

– τ = 0.25とした

– 各グループのメンバー25%以上が行ったアクションのみに、Conformityを考える

– 複数のグループに所属している場合、それぞれGroup Conformity Factorを考える

– Newman法を使用して、グループに分けた

2013/09/08 KDD2013読み会

Page 16: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model – Individual conformity factor

• Individual conformity factor

2013/09/08 KDD2013読み会

Page 17: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

(再掲)Confluence Model – 目的関数

• 目的関数(Hammersley-Clifford theoremを使った)

q = ({a},{b},{g},{m})パラメータ:

2013/09/08 KDD2013読み会

Page 18: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model – Feature Definition

• Conformity要素とは別の要素も考慮した– ユーザ属性

• フレンド数、直近3タイムスタンプでの新規フレンド数、所属グループ数、直近3タイムスタンプでの新規グループ数

– Opinion leader• ユーザがOpinion leaderか否か(Influence Rankを使用)

– Structure hole• ユーザがStructure holeか否か

– Social ties

• フレンド間の繋がりの強弱(コミュニケーション頻度とコモンネイバー数)

– Social balance• 4種類のトライアドがあるか否か

2013/09/08 KDD2013読み会

Page 19: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model – Feature Definition

• Conformity要素とは別の要素も考慮した

– ユーザ属性、Opinion leader、Structure holeは、として目的関数に混ぜた

– Social ties、Social balanceはと同じ形式で、目的関数に混ぜた

f (yi, xi, j )

g(yi, y ' j, pcf (vi,v j ))

2013/09/08 KDD2013読み会

Page 20: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model – Distributed Model Learning

• 分散学習アルゴリズムを提案

– 実際のソーシャルネットワークは、ノード数多いので、スケールする学習アルゴリズムが必要

1. グラフをサブグラフに分け、各サブグラフ内で、各パラメータについての目的関数の勾配を算出(スレーブで並列処理)

2. 全パラメータを勾配にもとづいて、最適化(マスターで行う)

2013/09/08 KDD2013読み会

Page 21: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

Confluence Model –Model Inference

• 学習したパラメータ θ を使用して、t + 1 のアクションを予測する

Y * = argmaxY t+1 Pq* (Y

t+1 |G,A)

2013/09/08 KDD2013読み会

Page 22: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験 - データセット

• データセット

– Flickr

• アクション:写真にコメント

– Gowalla

• アクション:チェックイン

– Weibo

• アクション:2012年の10個のホットトピックについてのつぶやき

– Co-Author

• アクション:ある分野の論文執筆

2013/09/08 KDD2013読み会

Page 23: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験 - データセット

2013/09/08 KDD2013読み会

Page 24: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験

• 評価手法– Prediction Accuracy

• アクション予測• Precision、Recall、F1値、AUC

– Scalability Performance– Qualitative Case Study

• 比較手法– SVM

• ユーザ属性、individual conformityを使用

– ロジスティック回帰• ユーザ属性、individual conformityを使用

– CRF• ユーザ属性、ソーシャル属性、individual conformity、peer

conformityを使用

2013/09/08 KDD2013読み会

Page 25: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験 – Prediction Performance

• F1値トップだった(1〜17%増加)

2013/09/08 KDD2013読み会

Page 26: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験 – Factor Contribution Analysis

• CF(Conformity Factor)を入れた時の伸び大きい(2〜20%増加)

2013/09/08 KDD2013読み会

Page 27: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験 – Effects of Conformity

• CF(Conformity Factor)を入れないとすごい下がる

• Group Conformityが一番効いてる

2013/09/08 KDD2013読み会

Page 28: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験 – Scalability Performance

• スレーブ数増やすと、スピード上がっていく

2013/09/08 KDD2013読み会

Page 29: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験 – Scalability Performance

• 比較手法よりも高速

2013/09/08 KDD2013読み会

Page 30: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

実験 – Qualitative Case Study

• Peer Conformityの影響が大きいアクション1を行っているユーザの多いグループ1は、繋がりが疎で、対立的な意見のコメンが多い

• Group Conformityの影響が大きいアクション2を行っているユーザの多いグループ2は、繋がりが密で、旅グループぽい

2013/09/08 KDD2013読み会

Page 31: Kdd2013読み会資料「Confluence: Conformity Influence in Large Social Newtworks』

まとめ

• 3つのConformityを定義した

• Conformity Influenceを定式化したConfluence Modelを提案した

• アクション予測結果抜群だった

• 分散学習モデル高速だった

• ケーススタディでもモデルの有効性示せた

2013/09/08 KDD2013読み会