論文の共著関係ネットワークの中心性分析 terano lab

15
論文の共著関係ネットワークの中心性分析 Terano.Lab 原田 泰輔 鍋田 武頼

Upload: analytics2014

Post on 26-May-2015

6.486 views

Category:

Technology


7 download

DESCRIPTION

All Analytics Championship Powered by SAS ~データサイエンス・アドベンチャー杯(2014年3月8日(土)開催)入賞作品

TRANSCRIPT

Page 1: 論文の共著関係ネットワークの中心性分析 Terano Lab

論文の共著関係ネットワークの中心性分析

Terano.Lab 原田 泰輔 鍋田 武頼

Page 2: 論文の共著関係ネットワークの中心性分析 Terano Lab

背景・目的

2

[背景]

科学技術の発展のためには,研究資源の有効活用が不可欠.

近年,複合的な問題が増加し,分野をまたいでの共同研究の

必要性が増している.

[目的]

各分野の牽引者の特定

異分野間の関係の解明

- 中心人物の特定を行う

- 研究者ネットワークの性質の解明

Page 3: 論文の共著関係ネットワークの中心性分析 Terano Lab

分析手法

[手法]

1)著者をノードとし, 共著者間にリンクを張る. - 多重リンクは排除する. - 共著リスト上で隣り合う著者間のみリンクを張る.[1]

2)次数分布をもとに, ネットワークの性質の分析を行う. 3)各著者の中心性を求め, 比較を行う.

- 次数中心性. - 媒介中心性. - 近接中心性.

3

[1] 篠田孝祐 : 日本における人工知能研究の系譜,人工知能学会誌,26巻6号(2011)

Page 4: 論文の共著関係ネットワークの中心性分析 Terano Lab

各指標の説明

4

評価基準 [ネットワークの中心性]

- 次数中心性 : 直接リンクの数.

- 媒介値中心性 :

その点を通る経路が多いほど中心性が高い

という指標.

- 近接中心性 : 他の点と距離が近いほど中心性が高い という指標.

Fig1.ネットワークの例

1 2 3 4 5 6 7

次数中心性 2 2 3 3 3 3 2

媒介中心性 0 0 0.53 0.6 0.13 0.13 0

近接中心性 0.43 0.43 0.6 0.67 0.55 0.55 0.4

Table.1:各中心性の値

Page 5: 論文の共著関係ネットワークの中心性分析 Terano Lab

対象データ

5

[対象] タイプBデータ(論文番号,著者名,JICST分類コード) - 1981年から2012年の以下領域のデータ

- 論文数:627940編 - ユニーク著者数:734735人

工学一般 エネルギー工学 熱機関,応用熱力学 機械工学 運輸交通工学 鉱山工学

工学一般

材料試験

材料力学

構造力学

岩盤力学

エネルギー工学

エネルギー変換及び貯蔵

エネルギー消費・省エネルギー

エネルギー利用と環境との関係

熱工学

熱機関

空気調和

冷凍

機械工学一般

工作,機械の組立

流体機械

産業機械

精密機械

自動車

鉄道車両

船舶

飛しょう体

運輸交通一般

道路輸送

鉄道輸送

水上輸送

航空輸送

鉱山工学

Table.2:分野分類表

Page 6: 論文の共著関係ネットワークの中心性分析 Terano Lab

ネットワークの可視化

6 Fig.2:エネルギー工学分野の共著ネットワーク

- 次数の大きい著者の周りに著者が多く集まるよう配置

Gephi(オープンソース)を使用し,作成したネットワークを可視化

Page 7: 論文の共著関係ネットワークの中心性分析 Terano Lab

ネットワークの可視化

7 Fig.3:エネルギー工学分野の共著ネットワーク2

Page 8: 論文の共著関係ネットワークの中心性分析 Terano Lab

分析結果-次数分布

8

Fig.4:エネルギー工学分野の次数-順位の関係 Fig.5:エネルギー工学分野の次数出現頻度

Fig.6:6分野の次数-順位の関係 Fig.7:6分野の次数出現頻度

ネットワークにはスケールフリー性がある.つまり, ごく少数の著者が大きな次数を持ち, 大多数の著者が少ない次数しか持たない.

Page 9: 論文の共著関係ネットワークの中心性分析 Terano Lab

分析結果-次数中心性

9

工学一般 エネルギー工学 熱機関、応用熱力学 機械工学 運輸交通工学 鉱山工学 6分野総合

1 田中啓介 美濃輪智朗 田辺新一 大森整 山本新 岡津弘明 田辺新一

2 江角務 松村幸彦 加藤信介 須田義大 中村英夫 山本晃司 大森整

3 久保司郎 吉野博 吉野博 永井正夫 中野倫明 恒川昌美 加藤信介

4 秋庭義明 下田吉之 千田二郎 竹内芳美 泉隆 大和田秀二 吉野博

5 野口博司 赤司泰義 相良和伸 堤正臣 永井正夫 柴山敦 須田義大

6 北村春幸 丹羽英治 甲谷寿史 LIN Weimin 須田義大 広吉直樹 永井正夫

7 安藤柱 井上隆 山中俊夫 森田昇 水間毅 藤田豊久 村上周三

8 高橋学 渡辺俊行 秋元孝之 国枝正典 高橋聖 島田英樹 秋元孝之

9 寺田賢二郎 高口洋人 村上周三 毛利尚武 土居俊一 松井紀久男 下田吉之

10 菅田淳 村上周三 草鹿仁 青山栄一 山本修身 佐々木久郎 千田二郎

順位

分野

Table.2:次数中心性

Page 10: 論文の共著関係ネットワークの中心性分析 Terano Lab

分析結果-媒介・近接中心性

10

工学一般 エネルギー工学 熱機関、応用熱力学 機械工学 運輸交通工学 鉱山工学 6分野総合

1 LIM C.w. 美濃輪智朗 田辺新一 竹内芳美 須田義大 柴山敦 大森整

2 酒井達雄 島田荘平 千田二郎 大森整 桑原雅夫 山冨二郎 田辺新一

3 田中啓介 下田吉之 加藤信介 梅原徳次 水間毅 安達毅 ZHANG X.

4 高橋学 鈴木善三 森吉泰生 須田義大 赤松幹之 山口勉 WU Y.

5 大崎純 松村幸彦 後藤雄一 永井正夫 綱島均 岡津弘明 吉野博

6 菅田淳 山本博巳 村上周三 中村隆 中村英夫 大和田秀二 ZHANG Z.

7 野口裕久 坂西欣也 柳原隆司 辻本良信 永井正夫 山本晃司 須田義大

8 寺田賢二郎 三浦秀一 吉野博 佐々木信也 押野康夫 松岡俊文 村上周三

9 CHEN W.q. 伊香賀俊治 門出政則 森田昇 鎌田実 佐々木久郎 LIN W.

10 高橋正気 小木知子 池田耕一 LIN Weimin 緒方正剛 西山孝 竹内芳美

分野

順位

工学一般 エネルギー工学 熱機関、応用熱力学 機械工学 運輸交通工学 鉱山工学 6分野総合

1 酒井達雄 美濃輪智朗 田辺新一 大森整 須田義大 山口勉 田辺新一

2 菅田淳 島田荘平 加藤信介 竹内芳美 桑原雅夫 山冨二郎 大森整

3 越智保雄 鈴木善三 村上周三 梅原徳次 綱島均 佐々木久郎 村上周三

4 田中啓介 坂西欣也 柳原隆司 LIN Weimin 永井正夫 天満則夫 吉野博

5 小笠原俊夫 松村幸彦 吉野博 中村隆 片山硬 坂本靖英 LIN Weimin

6 野口裕久 花岡寿明 秋元孝之 佐々木信也 丸茂喜高 大賀光太郎 井上隆

7 伊藤隆基 山本博巳 池田耕一 森誠之 鎌田実 安達毅 須田義大

8 佐野雄二 三浦秀一 桑沢保夫 須田義大 水間毅 大和田秀二 竹内芳美

9 秋田貢一 藤本真司 千田二郎 上原嘉宏 大野寛之 駒井武 伊香賀俊治

10 大野信忠 井上貴至 後藤雄一 野口昭治 佐藤安弘 島田荘平 松村隆

分野

Table.3:媒介中心性

Table.4:近接中心性

順位

Page 11: 論文の共著関係ネットワークの中心性分析 Terano Lab

分析結果-エネルギー工学分野の中心性

11

エネルギー工学 エネルギー資源及び開発 エネルギー変換及び貯蔵

近接 次数 媒介 近接 次数 媒介 近接 次数 媒介

1 末広茂 末広茂 末広茂 美濃輪智朗 美濃輪智朗 美濃輪智朗 長屋重夫 長屋重夫 長屋重夫

2 小宮山涼一 伊藤浩吉 坂田興 花岡寿明 松村幸彦 小木知子 平野直樹 金子宏 平野直樹

3 藤井康正 山地憲治 山本博巳 鈴木善三 近藤昭彦 花岡寿明 式町浩二 玉浦裕 津田理

4 山本博巳 山本博巳 松村幸彦 柳下立夫 中村真人 天野寿二 後村直紀 平野直樹 長嶋賢

5 松村幸彦 前川忠 藤井康正 松村幸彦 井田民男 横山伸也 大崎博之 秋山友宏 大崎博之

6 坂田興 中田俊彦 小宮山涼一 澤山茂樹 長野克則 井上貴至 長嶋賢 相良和伸 野村新一

7 前川忠 藤井康正 坂西欣也 多田千佳 吉川邦夫 近藤昭彦 玉田勉 松本昭 新冨孝和

8 永富悠 近藤康彦 近藤康彦 柳田高志 藤本真司 岩田光夫 稲垣淳二 青田浩幸 村上雅人

9 柳沢明 小宮山涼一 柳沢明 藤本真司 坂志朗 柚山義人 中村武恒 式町浩二 嶋田隆一

10 坂西欣也 松村幸彦 美濃輪智朗 井上誠一 笹内謙一 高橋徹 大久保仁 熊野寛之 広瀬誠

エネルギー工学消費・省エネルギー エネルギー利用と環境との関係

近接 次数 媒介 近接 次数 媒介

1 下田吉之 吉野博 下田吉之 伊香賀俊治 市川徹 伊香賀俊治

2 村上周三 下田吉之 井上隆 近本智行 下田吉之 西村郁夫

3 宮田征門 井上隆 伊香賀俊治 永瀬修 外岡豊 遠藤康之

4 吉野博 村上周三 柳原隆司 柳原隆司 丹羽英治 戸田貴光

5 井上隆 赤司泰義 渡辺健一郎 西村郁夫 伊香賀俊治 田原靖彦

6 奥宮正哉 渡辺俊行 吉野博 村上周三 永田勝也 村上周三

7 坂本雄三 宮田征門 村上周三 戸田貴光 佐土原聡 亀卦川幸浩

8 高口洋人 高口洋人 宮崎隆彦 坂本雄三 岡建雄 稲葉敦

9 坊垣和明 奥宮正哉 丹羽英治 外岡豊 吉田聡 八木田浩史

10 伊香賀俊治 伊香賀俊治 坂本雄三 水石仁 松縄堅 高橋宏

分野 順位

分野 順位

Table.5:エネルギー工学分野の中心性

Page 12: 論文の共著関係ネットワークの中心性分析 Terano Lab

考察

次数分布がべき乗則に従ってるので, ネットワークにはスケールフリー性がある.つまり,ハブの役割を果たす著者がごく少数存在する.

各指標での順位にばらつきはあるが, 全ての指標で高順位に入っている著者が確認された.

12

[中心性について]

[次数分布について]

Page 13: 論文の共著関係ネットワークの中心性分析 Terano Lab

今後の展望

この分析結果から, 今後以下のようなことが期待できる.

- 時系列分析により, 新領域ができる過程の解明.

- 時間的変化から学問領域の変化の推定.

- より細かいマイニングによる, 高精度の中心人物特定

.

- 研究の将来性や抜けの分析.

13

Page 14: 論文の共著関係ネットワークの中心性分析 Terano Lab

まとめ

異分野間の関係の解明を行うために, 共著関係をもとにしたネットワークの解析を行った.

共著者ネットワークのスケールフリー性が明らかになった.

各分野, 6分野全体を牽引している研究者の特定をした.

14

以上の結果から,今後,研究資源の効果的な配分 が期待できる.

Page 15: 論文の共著関係ネットワークの中心性分析 Terano Lab

参考文献リスト

[1]篠田孝祐 : 日本における人工知能研究の系譜,人工知能学会誌,26巻6号

(2011)

[2]浅田洋平,松尾豊,石塚満 : Webからの研究者ネットワーク抽出の大規模化,人工知能学会誌,20 巻6 号(2006)

[3]松尾豊,石黒周,松原仁,橋田浩一,中島秀之 : 効果的な共同研究を支援するためWebからの研究者ネットワーク抽出,情報学シンポジウム講演論文集

(2005)

[4]安田雪,松尾豊 : 人工知能学会における研究者ネットワークの分析,第19 回人工知能学会全国大会,2A3-02(2005)

15