研究室輪読 recommending investorsfor crowdfunding projects

41
Recommending Investors for Crowdfunding Projects Yusuke Iwasawa 2015.04.30 Paper Reading

Upload: yusuke-iwasawa

Post on 15-Aug-2015

36 views

Category:

Technology


0 download

TRANSCRIPT

Recommending Investors for Crowdfunding Projects

Yusuke Iwasawa

2015.04.30 Paper Reading

• WWW’14 • Citations: 4 • Motivation:

• I’m currently working on similar work using ‘ReadyFor?’ Data • For the start point of the research

Agenda

1. Introduction 2. Related Work 3. Investors vs. Donors 4. Dataset 5. Pledging Behavior 6. Recommending Investors 7. Discussion

3

Crowdfunding

• Crowdfunding is a matching platform between funder (and project) with investors • Investors could fund projects among various projects • In exchange of funds, investors get some rewards (e.g post card)

4

Discover Page Rewards

https://www.kickstarter.com/discover/categories/art?ref=discover_index

What is a problem?

• Not all projects are successfully financed! • According to a Report of Kickstarter, the success rate is 50%

5

https://www.kickstarter.com/discover/categories/art?ref=discover_index

Solution is …

• Finding Potential Investors on Twitter using tweets • They develop a recommendation logic that recommends potential

investors to a project

6

Founder

Project

Potential Investors

Investor 1

Investor2

Investor 3

Investor 4

Matching

https://www.kickstarter.com/projects/envelop/envelop-3d-sound?ref=discover_potd

… and more

Structure and Contribution of the Paper

7

2. Related Work

3. Hypothesis 4. Dataset

5. Quantitive Evaluation

6. Recommend System Evaluation

• Summarize related work • Explain how important the matching is

• Derive well-grounded hypothesis about investors behavior

• Crawl dataset (kickstarter and twitter) 3month

• Quantitively test hypotheses

• Build a statistical model to recommend potential investors from Twitter

Recommendation Logic Based on Findings

Contribution 1

Contribution 2

Contribution 3

Contribution 4

2. Related Work

Crowdfunding The numbers

• Crowdfunding site started in 2001

• More than 450 of such sites

• $2.8billion in 2012

• 1 million projects were successfully funded in 2012

10

Related Work (By Economists)

• 距離の摩擦(friction of distance) を低減して(あるいはなくして)いる • 一方で、初期の投資は家族や友人、知人から受けることが多い

11

Related Work (Computer Scientists) 1/2

• プロジェクトが成功するかどうかの予測に焦点 • [Mollick 2012]:

• どれだけ準備をしたか(ビデオの有無、スペルミスの有無、更新回数) • Social Capital (Facebook上のフレンド数)

• [Greenberg et al. 2013]: • SVMの利用で約68%の精度で成否を予測可能

• [Gilbert et al. 2014]: • プロジェクト説明文のみを利用して成否を予想できる • 予想に寄与するワードはCialding’s Six Principlesに大別できる※ • 1)Reciprocity, 2) Scarcity(希少性), 3) Social Proof (社会的証明),

4) Social Identity(社会的同定), 5) Linking, 6) Authority • [Etter et al. 2013]:

• 初期の段階で85%は成否を予想できる

12※ http://www.mindtools.com/pages/article/six-principles-influence.htm

Related Work (Computer Scientists) 2/2

• [Hui et al., 2014] • 45人のクラウドファンディング経験者へのインタビューの分析研究 • クラウドファンディング上でプロジェクトが成功するまでのステップをまとめ、

それぞれのステップで必要なツールについて検討

13

1) Prepare (準備)

2) Test (テスト)

3) Publicize (公開)

4) Follow Through

5) Contribute (貢献)

プロジェクトの公開、ユーザの巻き込み

“the majority of failed project creators cited the inability to successfully leverage an online audience as a main reason for failing”

• この段階で、プロジェクトに投資してくれるユーザを巻き込むことができれば、プロジェクト成功率は高まるはず

• ->推薦ロジックが必要

3. Investors VS. Donors

INVESTORS vs. DONORS

• 「クラウドファインディングの投資家は多様である」という仮説から分析を出発

• Occasional Investors(Donors) • := 投資回数が4プロジェクト以下の人 • たまにしか投資しない、親類や友人が主

• Frequent Investors(Investors) • := 投資回数が32プロジェクト以上の人 • よく投資する、なんらかの理由で投資するプロジェクトをKickstarter上で

探している。

15

List of Hypotheses

16

H1

H1. サイトの更新頻度が高いH1. ユーザの要望によく答えている(コメントを返すetc)H1. 様々なリワードが用意されているH1. 専用のWebサイトが存在している

H2

H3

H4

H5

Hypothesis

次のようなプロジェクトはFrequent Investorsによく投資される

目標金額が高いプロジェクトは、Frequent Investorsによく投資される地理的に近いプロジェクトは、Ocassional Investorsによく投資される成長が早いプロジェクトは、Frequent Investorsによく投資されるFrequent Investorsは、自分の興味にあうプロジェクトに投資する

• H1: 投資家はマネジメントスキル等に注意する • H2: より野心的なプロジェクトは投資行動をする人に好まれる • H3: 友人などは地理的に近い場合が多い • H4: FrequentUserの方がサイトをよく見るから • H5: Occasional Investorsは友人とかを支援する

4. Dataset

Dataset

• クローリングで取得 • (2013年7月〜2013年12月) • カテゴリは13カテゴリ

(Art, Filmなど) • 510 projects (45.2%)が

成功(Kickstarter公表値は43.85%)

18

成功/失敗プロジェクトの統計値

• 低めのゴール設定 • 成功キャンペーンは平均28.9日(表だと28.56日なので誤植?)、平均13日で

100%に到達 • 失敗プロジェクトは、目標額の平均19.51%しか獲得してない

19

Activity Level (投資回数)

• 51%が投資回数4回未満(Occasional Investors) • 11%が投資回数32回以上(Frequent Investors)

20

5. Pledging Behavior

Quantitive Analysis: Activity Level VS. Features

• 仮説の有効性を定量評価 • ユーザを、投資回数が~4回(Occasional Investors)、~8回、~16回、

~32回、それ以上(Frequent Investors)に分割 • あるプロジェクトPに投資したユーザを投資回数によって分類し、プロジェクトPの属性と

ユーザの投資回数の関係を調査

22

• プロジェクトの属性には 1. 更新回数 2. コメント数 3. リワードの数 4. 目標金額 5. Geographic Description

1. 投資家とプロジェクトの距離的な近さ 6. 成長率 7. Facebook友人数 を利用して調査

Facebookフレンド数が54-148のプロジェクトの投資者のうち約

45がOccasional Investors

Quantitive Analysis

23

[H5] Frequent investors tend to support projects that match their own interests

• ユーザ:ツイート内容に従ってをトピックベクトルで表現 • プロジェクト:説明文の内容にしたがってトピックベクトルで表現 • 2つのcosine類似度を計算

• ピアソンの相関係数でr=0.20, (p<0.05) ->Frequent Investorsの方が、自分の興味とマッチしたプロジェクトに投資

24

Summary

• Frequent InvestorsはOccasional Investorsより次のような項目を重視 する傾向 • Well-Managed(よく更新される、コメントが多い)、目標金額が大きい、

グローバル規模、成長率が高い、自分の興味にあう • Occasional Investorsは、家族や友人、知人が主なトリガー

25

6. Recommending Investors

実験設定 -概要-

1. Binary Classification 1. (Project, User)のペアが与えられた時に、UserがProjectを購入する

かどうかを当てる 2. Balanced, Imbalancedな設定で検証

2. Ranking Investors 1. あるプロジェクトが与えられた時に、投資家をランク付け

27

2種類の実験

実験設定 -特徴量-

• Statics: プロジェクト公開時に決まるもの • 目標金額、リワードの数、カテゴリー • 過去に購買したカテゴリ、Twitterでのつぶやき内容(Topic Similarity?)

• Dynamic: • 成長率、更新回数、Geographic Dispersion、コメント数

• ※ Activity Levelを素性に入れたり、ユーザをOccasional vs. Frequentで分けたりはしない • (今までの分析…)

28

目標金額 リワード数 カテゴリ 投資家の購買履歴 投資家のTopic

Output: 投資家AがこのプロジェクトPを買うかどうか(0/1or 確率)

Input 例:Statics素性

実験設定 -正解データの設定-

• 目標:あるプロジェクトに投資してくれそうなTwitterユーザを発見すること

29

K-AccountT-Account Project

• あるProjectを買ったKickstarter-Accountと、同一プロジェクトをつぶやいたTwitterアカウントを結合

• 7249pairs (891 projects) • 200個のマニュアルチェックで92%正解

Positive

K-AccountT-Account Project

• Positive例のペアから、T-Accountと買わなかったプロジェクトのペアをランダムに生成

• 数はPositivetと同数7249pairs

Negative

Binary Classification -特徴量固定の場合-

• クラスバランスがあっても(上)なくても(下)同程度

• SVM+RBF、Staticな特徴量で0.82の精度

• Static+Dynamicで0.84まで上昇

30

Binary Classification -特徴量を変化させた場合-

number of comments (C), reward levels (R), geographic span (S), growth rate (G), category matching (E) and topic similarity (TS)

31

• 全部の特徴量を使うと一番良い • 上がり幅を見ると、過去にユーザが買ったカテゴリとの対応とトピック類似度が予測

精度の向上によく効く

カテゴリ別購買ユーザの分布比較

• カテゴリによって、Occasional InvestorsとFrequent Investorsの割合が大きく異なる

• 例えば、Musicはほとんどの場合でOccasional Investors • 一方で、Comics, Games, Technologyはほとんどが4回以上買っているユーザ

によるもの->Product自体に投資するというよりもカテゴリに投資している?

32

Ranking Investors – Result -

• MeanRR (平均逆順位): 逆順位の平均値 • MaxRR(最大逆順位):あるプロジェクトに対する逆順位の最大値の平均 • どちらも低いほど良い • ランダムと比較して勝利 (MRRで0.50->0.32)

33

7. Practical Implications

Theoretical Implications (What is a motive?)

• 最初期の考え:Investors = Donorsである • “Some crowdfunding efforts, such as art or humanitarian projects, view their

funders as patrons or philanthropists, who expect nothing in return.”[3]

• 本研究:Investorsにも種類があることを発見した • Donors≒Occasional Investorsである • Frequent Investors≒Proper InvestorsをDonorsと捉えるのは適切

でない • 投資行動の仕方(そのモチベーション)は単一ではない • 投資回数による切り口の有効性を検証 • 自分が作っているプロジェクトのカテゴリに応じてどのようにユーザ

(Investors) を巻き込むかを考える必要が有る

35

Practical Implications (Feature: Twitter Data)

• ユーザ情報としてTwitterデータのみを利用(サイト内の行動などは利用しない) • ->68%程度の精度、0.40のMRR • まだKickstarterを利用したことがない潜在顧客のリーチも有効

• おそらく、広告とかそういう話

36

Conclusion

• Kickstarter上での投資行動の仮説検証を通して、あるプロジェクトを投資しそうなユーザの予測モデルを構築

• Occasional InvestorsとFrequent Investorsがかなり違う投資行動をとることをデータから検証

• �SVM+RBFを使った、プロジェクトを投資の予測モデルを構築

• 現在は、KickstarterのプロジェクトURLが与えられた時に潜在投資者Twitterアカウントのリストを提示するウェブサイトを構築中

• 外因性の素性に関する分析を今後は行う

37

Fin.

Features

39

特徴量の選定• Featureの選定

に利用

40

41