tokyo r hiromatsu

24
素素素素素素素素 ~~ 素素素素素素素素素素 2011/08/27 TokyoR #16 Hiroki Matsui

Upload: hiroki-matsui

Post on 15-Jan-2015

2.009 views

Category:

Documents


0 download

DESCRIPTION

第16回、TokyoRの発表資料です。

TRANSCRIPT

Page 1: Tokyo r hiromatsu

~素人の手による~Rを用いた地理情報分析

2011/08/27TokyoR #16

Hiroki Matsui

Page 2: Tokyo r hiromatsu

自己紹介• Hiroki Matsui (RPT,MPH)• 専門:リハビリテーション、臨床疫学・医療経済学

• 元理学療法士(リハビリ屋)→現在は研究者と事務屋の間

• Rは趣味程度に利用→現在は、仕事で利用• Rも地理情報分析も素人

• Twitter:Hiro_macchan

Page 3: Tokyo r hiromatsu

本日のテーマ• R による地理的情報の分析• でも、僕は R も地理情報分析も素人

→ タスクを設定してそれを達成し、事例報告でお茶を・・・。– エンジニアの皆様、専門家の皆様ごめんなさ

い。– 逆に色々教えて下さい。

Page 4: Tokyo r hiromatsu

本日のテーマ• タスク– R を用いて– 東京都の専門医の地理的分布を– Google Earth 上に描画してみよう!

Page 5: Tokyo r hiromatsu

GIS で地図を書く• GIS(Geographic Information System :地理的情

報システム)を用いることにより、コンピューター上で、地理的情報を重ね合わせて表示し、情報を得るためのソフトウェア。

• 空間統計や、時空間統計などの統計手法についても近年は発達している。

→ 今回は、そういった高度な内容は扱いませんので、また教えて下さい。。。

Page 6: Tokyo r hiromatsu

GIS で地図を書く• 必要なもの– 白地図情報• 描画の下地になる白地図情報。数値集計の枠組み

になったりする。– 地理的情報が付与された統計情報• 統計数値と地理的情報(具体的には緯度経度)が

セットになったデータセット– GIS ソフト• 色々あって選り取り見取り?今回はRを使ってみ

よう。

Page 7: Tokyo r hiromatsu

GIS で地図を書く• 必要なもの– 白地図情報• 描画の下地になる白地図情報。数値集計の枠組み

になったりする。– 地理的情報が付与された統計情報• 統計数値と地理的情報(具体的には緯度経度)が

セットになったデータセット– GIS ソフト• 色々あって選り取り見取り?今回はRを使ってみ

よう。

Page 8: Tokyo r hiromatsu

GISで地図を書く• 白地図情報– 各種白地図情報(

国土地理院、国土交通省、 ESRI社)

– ファイル形式は様々だが、 ESRI 社の開発したShape ファイル形式が広く利用されている。

– Google Earthや Google Map 上に描画する場合もある。 139E 139.2E 139.4E 139.6E 139.8E 140E

35.4

N35.6

N35.8

N36N

Page 9: Tokyo r hiromatsu

GIS で地図を書く• 必要なもの– 白地図情報• 描画の下地になる白地図情報。数値集計の枠組み

になったりする。– 地理的情報が付与された統計情報• 統計数値と地理的情報(具体的には緯度経度)が

セットになったデータセット– GIS ソフト• 色々あって選り取り見取り?今回はRを使ってみ

よう。

Page 10: Tokyo r hiromatsu

GISで地図を書く• 地理的情報を付加した

統計情報– 住所情報にジオコーディ

ングで、緯度経度情報を付加する必要性

– 各種ジオコーダー(Google, Yahoo, 東大CSVアドレスマッチングサービス等)

– R上でもジオコーディングをする手法があるようです。( R-wiki参照) 139E 139.2E 139.4E 139.6E 139.8E 140E

35.4

N35.6

N35.8

N36N

Page 11: Tokyo r hiromatsu

GIS で地図を書く• 必要なもの– 白地図情報• 描画の下地になる白地図情報。数値集計の枠組み

になったりする。– 地理的情報が付与された統計情報• 統計数値と地理的情報(具体的には緯度経度)が

セットになったデータセット– GIS ソフト• 色々あって選り取り見取り?今回はRを使ってみ

よう。

Page 12: Tokyo r hiromatsu

GISで地図を書く• GISソフトとしてのR– maptools というパッケージが有名– 地理的情報を SpatialPoligon という形のデータ

で格納し、R上で地図への描画などを行う事が出来る。

– 他のパッケージは試してないので、比較できませんが結構便利です。

Page 13: Tokyo r hiromatsu

maptools の紹介• maptools で出来ること– 地理的情報を SpatialPoligon に変換– ShapeFile などで記載された白地図情報を

SpatialPoligon に変換– SpatialPoligon ファイルの編集– KML ファイルへの出力• 等々

Page 14: Tokyo r hiromatsu

事例紹介(白地図データ)• 白地図データは、諸般の事情により、国

土交通省国土政策局の国土数値情報から取得した JPGIS ファイルから Shape ファイルを作成

• (ESRI社に白地図データをRで使っていい?と聞いたらだめと言われたんで。。。)

Page 15: Tokyo r hiromatsu

事例紹介(ジオコーディング)• ジオコーディング済みの地理的情報を取得

しましょう。• 今回は、東京都における各医療機関の住

所情報、及び、所属する専門医数を利用します。– 東京都のHPから取得

• ジオコーディングは、東大地理空間研究所が提供している、 CSV アドレスマッチングサービスを利用

Page 16: Tokyo r hiromatsu

Rによる実際の処理• 白地図シェープファイルの取り込み• 統計情報の取り込み• 主題図の描画• KMLファイルへの出力

Page 17: Tokyo r hiromatsu

白地図の ShapeFile の取り込み

139E 139.2E 139.4E 139.6E 139.8E 140E

35.4

N35.6

N35.8

N36N

library(maptools)

jpn2<-readShapeSpatial(shapefile,proj4string = CRS("+proj=longlat +datum=WGS84"))

tokyo<-jpn2[jpn2$KEN==" 東京都 ",]

plot(tokyo,xlim=xlim,ylim=ylim,axes=T)

Page 18: Tokyo r hiromatsu

統計情報の取り込み hospital<-read.csv(byouin,colClasses=c(rep("numeric",55),rep("character",5),rep("numeric",4)),head=T)

lola<-hospital[,fx:fy]

sp.hospital<-SpatialPoints(lola,proj4string = CRS("+proj=longlat +datum=WGS84 +units=km"))

spdf.hospital<-SpatialPointsDataFrame(sp.hospital,data=hospital)

139E 139.2E 139.4E 139.6E 139.8E 140E

35.4

N35.6

N35.8

N36N

Page 19: Tokyo r hiromatsu

主題図の描画 #病院の、白地図上での所属を判定 res_all<-overlay(spdf.hospital,tokyo) spdf.hospital@data$location<-as.factor(res_all)

f.plot<-function(x){ iro<-brewer.pal(8,"Greens")

kaisou<-classIntervals(x,n=8,style="kmeans")colcode<-findColours(kaisou,iro)  

plot(tokyo,col=paste(colcode,80,sep=""),axes=T,xlim=xlim,ylim=ylim) } f.plot(tokyo$p.obstgyne)

# 各市区町村の別の産婦人科専門医合計人数を計算 obstgyne<-tapply(spdf.hospital$産婦人科専門医 ,spdf.hospital$location,sum) obst.name<-names(obstgyne) obstgyne<-as.data.frame(obstgyne) obstgyne$name<-obst.name #SP にマージ tokyo@data<-merge.data.frame(tokyo@data,obstgyne,by.x="OBJECTID",by.y="name",all=T) tokyo$obstgyne<-ifelse(is.na(tokyo$obstgyne),0,tokyo$obstgyne)

Page 20: Tokyo r hiromatsu

主題図の描画

Page 21: Tokyo r hiromatsu

地図の重ね合わせ

plot(spdf.hospital,cex=spdf.hospital$産婦人科専門医 *0.1,pch = 16, col = "#0000FF70",xlim=xlim,ylim=ylim,add=T)

Page 22: Tokyo r hiromatsu

KML ファイルへの出力 # 地図を Google Map とかで使える用に png/kml 形式に変換 library(rgdal) opt_exask <- options(example.ask=FALSE) tf <- "c:/KML/tokyo" SGqk <- GE_SpatialGrid(tokyo) png(file=paste(tf, ".png", sep=""), width=SGqk$width, height=SGqk$height,bg="transparent") par(mar=c(0,0,0,0), xaxs="i", yaxs="i") iro<-brewer.pal(8,"Greens") kaisou<-classIntervals(tokyo$p.obstgyne,n=8,style="kmeans") colcode<-findColours(kaisou,iro) plot(tokyo,col=paste(colcode,80,sep=""), xlim=SGqk$xlim, ylim=SGqk$ylim) dev.off() kmlOverlay(SGqk, paste(tf, ".kml", sep=""), paste(tf, ".png", sep=""))

参考: R-wiki ( http://www.okada.jp.org/RWiki/index.php?GoogleEarth%A4%C8R )

Page 23: Tokyo r hiromatsu

GIS の医療政策への応用• 患者の医療アクセスの解析• 医療マーケティング

• 医療のアウトカムリサーチを行う際の交絡調整に。。

Page 24: Tokyo r hiromatsu

参考資料• 書籍

– 地理空間データ分析 (R で学ぶデータサイエンス 7) (谷村 晋 (著 ), 金 明哲 (編集 ) )

• ホームページ– R-wiki(http://www.okada.jp.org/RWiki/index.php?GoogleEarth%A4%C8R)– CSV アドレスマッチングサービス( http://newspat.csis.u-tokyo.ac.jp/geocode/)– 国土地理院( http://www.gsi.go.jp/kiban/index.html)– 国土交通省( http://nlftp.mlit.go.jp/ksj/index.html)– ESRI ジャパン( http://www.esrij.com/)

– 参考にさせて頂いたブログ• http://d.hatena.ne.jp/dichika/touch• http://d.hatena.ne.jp/isseing333/