lodチャレンジ2016 エリアベンチマーキング資料

15
エエエエエエエエエエエ LOD エエエエエエエエエエエエエエエエエエ DOGRUN INC. エエエエエエエ LOD エエエエエ 2016 エエエエ エエ エエ

Upload: nao-oec

Post on 14-Apr-2017

63 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Lodチャレンジ2016 エリアベンチマーキング資料

エリアベンチマーキングLODと機械学習を使った地域課題発見ツールDOGRUN INC. オオイシナオヤLOD チャレンジ 2016発表資料(修正・追加)

Page 2: Lodチャレンジ2016 エリアベンチマーキング資料

エリアベンチマーキングとは人口減少や高齢社会などこれまでに無かった状況を迎える地域社会では、経験や生活の中の感覚からだけでは無く、データに基づいた地域の課題や長所の発見が、地域住民へのサービス向上や地域活性化への有効な手段になると考えられます。エリアベンチマーキングは、社会構成・産業構造の近い地域同士のデータを比較することが地域の特徴を発見する手段の一つとして考え、政府統計データと機械学習によって集計された地域同士の類似度のデータを探索的な可視化ツールとして提供します。

Page 3: Lodチャレンジ2016 エリアベンチマーキング資料

利用したデータ

政府統計が Linked Open Dataとして公開される「統計LOD」から社会統計データを中心に任意の測度のデータを利用。http://data.e-stat.go.jp/lodw/

Page 4: Lodチャレンジ2016 エリアベンチマーキング資料

データ集計と可視化手法• SPARQLにより統計 LODよりデータを取得し、主成分分析した地域間の類似度を散布図にプロット。

• D3.jsによる散布図はマウスのインタラクションにより表示エリアをフォーカスすることが可能。個々のドットを選択しデータダウンロード用のフラグを起てることができる。

• 同様のデータをクラスタリングし、クラスターを動的にラベルした日本地図を表示している。選択中の地域が大まかにどのような地理的な分布の傾向を示すのか見ることができる。

Page 5: Lodチャレンジ2016 エリアベンチマーキング資料

http://area-benchmarking.meta-dog.com

ソースコードも公開しています。

Page 6: Lodチャレンジ2016 エリアベンチマーキング資料

類似地域の探索的な可視化

Page 7: Lodチャレンジ2016 エリアベンチマーキング資料

地域の選択

都道府県名+市町村区名を入力すると、該当する地域がタグ付きでオレンジ色のドットとして表示されます。直接ドットをクリックしても選択状態になります。

Page 8: Lodチャレンジ2016 エリアベンチマーキング資料

散布図の拡大

散布図をドラッグすることで、ドットが密集している部分など見たい箇所を拡大して表示することができます。

Page 9: Lodチャレンジ2016 エリアベンチマーキング資料

比較する地域の選択

検索対象の地域の近くのドットをクリックし、類似度の高い地域にフラグを起てることができます。

Page 10: Lodチャレンジ2016 エリアベンチマーキング資料

サブセットの可視化

取得した全ての測度を使った類似度だけでなく、医療・教育や産業などカテゴリを絞った類似度をプロットし、異なる視点から類似した地域を探すことができます。

Page 11: Lodチャレンジ2016 エリアベンチマーキング資料

類似地域の統計データ取得

• 詳細な分析用に選択したエリアのデータがダウンロードできます。• 同じような産業構造や人口統計のパターンの地域同士のデータを比較することで、エリアの課題や特徴の再発見に役立ててください。

Page 12: Lodチャレンジ2016 エリアベンチマーキング資料

類似する地域のクラスタリング

• 選択した地域と同じクラスターに分類された地域をラベルして地図上でオレンジ色で表示することができます。• 選択中の地域が属するクラスターが、大まかにどのように地理的に分布するか確認できます。

Page 13: Lodチャレンジ2016 エリアベンチマーキング資料

地域課題×機械学習×統計 LOD

Page 14: Lodチャレンジ2016 エリアベンチマーキング資料

地域課題と LOD

これからの地域課題の取組みは、公共データをいかに理解し活用していくかが大きなテーマとなる。LODはリソースの意味が明確で、データセットのあらゆるリソースを中間的な API無しで利用できるため、複数のデータセットを含む多次元の機械学習的データ分析に適してるのではと考えられる。

Page 15: Lodチャレンジ2016 エリアベンチマーキング資料

統計 LODへの期待機械学習的データ解析の手法が急速に広まり、社会問題の解決にオープンデータ分析が活用される土壌ができつつあり、統計 LODは地域課題の発見・解決における重要な公共リソースに位置づけられる。統計 LODのデータセットが増えて行くことで、分析の精度・多様性も向上するはず。統計 LODが多くの分野の統計データに対応し、継続的にメンテナンスされ、発展していくことを期待しています。