Download - 1.空間統計デ タ 特性空間統計データの特性 空間分析 第5回 ...ecogis.sfc.keio.ac.jp/gis/2010/5_Tokei.pdf1.空間統計デ空間統計デ タの特性ータの特性
空間分析空間分析第5回
空間統計デ タ空間統計データ
1 空間統計デ タ 特性1.空間統計データの特性
》空間統計データには、ふつうの統計データにはない特性がある。
1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析1)標本
》ところで、ふつうの統計分析は大丈夫?
▷平均とか、分散とか、標準偏差とか、正規分布と▷平均 、分散 、標準偏差 、 規分布か、相関係数とか、回帰分析とか、覚えていますか?
》例:入社5年目の平均給料 30万円
1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析1)標本
5人
》どちらも平均は
30万円 3
4
5人年功給与
30万円
》分散が違う 1
2
▷上: 1.3
▷下:17.6
0
20 22 24 26 28 30 32 34 36 38 40万円
5人
3
4
5人
実力主義
1
2
3
0
20 22 24 26 28 30 32 34 36 38 40万円
1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析1)標本
標本(サンプル)と母集団(全体)の平均・分散は、ほぼ 致し る が前提ほぼ一致している、のが前提。
1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析2)相関
》 x(空港間の直線距離)と 500
min500min
空港間の所要時間(分)
線距y(空港間の所要時間)の
350
400
450
400
450
相関
》 R = 0 942 250
300
350
250
300
350
》 R 0.942
100
150
200
100
150
200
0
50
0 1,000 2,000 3,000 4,000 5,000 6,000k
0
50
100
0 1 000 2 000 3 000 4 000 5 000 6 000
k
km0 1,000 2,000 3,000 4,000 5,000 6,000
空港間の直線距離(km)
1.空間統計データの特性(0)ふ う 統計分析(0)ふつうの統計分析2)相関
R =
1.空間統計データの特性(0)ふつうの統計分析(0)ふつうの統計分析
3)回帰分析
》 モデル=一般的な 500min500min
空港間の所要時間(分)》 デル 般的な
法則
》 もちろん、例外も350
400
450 y = 0.083x + 32.945
R² = 0.9423400
450
ある
250
300
350
250
300
350
100
150
200
100
150
200
0
50
0 1,000 2,000 3,000 4,000 5,000 6,000k
0
50
100
0 1 000 2 000 3 000 4 000 5 000 6 000
k
km0 1,000 2,000 3,000 4,000 5,000 6,000
空港間の直線距離(km)
1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある
SFC周辺の地価公示地点
1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある
》点の密度
▷一定の面積あたりの点の度数▷ 定 面積あたり 点 度数
1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある
》点の分布パターン
凝集型 ランダム型 均等型
1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある
》点分布パターン分析
▷区画法▷区画法› ランダムな点分布=点密度がポアソン分布
› 対象の点分布がランダムかどうかをχ2検定
1 空間統計データの特性1.空間統計デ タの特性(1)分布に偏りがある
》点分布パターン分析
▷最近隣距離法▷最近隣距離法› 点iについて、1番目~N番目に近い最近隣点を見つけ,各最近隣点までの距離diを測定
距離の平均値 により最近隣距離を定義› 距離の平均値rにより最近隣距離を定義
1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある
》直線距離
》ネットワーク距離》ネットワ ク距離
▷道のり
▷所要時間・運賃(駅すぱあと)▷所要時間 運賃(駅すぱあと)
》コスト距離
所要時間 時間価値 + 運賃等▷所要時間 x 時間価値 + 運賃等
1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある
》ネットワーク解析
▷ ArcGISのNetwork Analystで2点間のネットワーク▷ y 点間 ネッ ワ ク距離・コスト距離を計算できる。
1 空間統計データの特性
1)交通ネ トワ クデ タを構築する
1.空間統計デ タの特性(2)いろいろな距離がある
1)交通ネットワークデータを構築する
Global Mapping(ISCGM;2006)
Digital Chart of the World Data Server(ESRI;1993)(公開国・準備国)
1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある
1)交通ネ トワ クデ タを構築する1)交通ネットワークデータを構築する
道路
鉄道
1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある
1)交通ネ トワ クデ タを構築する
都市圏内は若干怪しいDigital Chart of the World Data Server
Gl b l M i
1)交通ネットワークデータを構築する
Global Mapping
•東海道新幹線が渋谷発
山手線が くな新宿 東京新宿 東京•山手線が円くない
•中央線・南武線・井の頭線・京葉線がない
中央林間 新横浜中央林間 新横浜
•小田急江ノ島線・相鉄線・田園都市線・横須賀線・常磐線が途切れて
る
湘南台
横浜
湘南台
横浜 いる
•武蔵野線が武蔵境発,西武多摩川線が田無発 西武新宿線が飯
藤沢藤沢発,西武新宿線が飯田橋発
•西武新宿線と池袋線が ぎはぎ
1 空間統計データの特性1.空間統計デ タの特性(2)いろいろな距離がある
1)交通ネ トワ クデ タを構築する1)交通ネットワークデータを構築する
道路と航空路を接続
Hawth’s toolで
発着空港の座標csv
道路と航空路を接続
発着空港の座標csv
→航空路のラインshp 航空路
1 空間統計デ タ 特性1.空間統計データの特性(2)いろいろな距離がある
2)Network Analystで交通ネットワークを検索する
県庁
空港道路
航空
道路・航空を乗り継ぐルートの検索結果の例
東京からの加重平均移動コストの分布
1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する
》空間的自己相関
SFC周辺の公示地価
1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する
》空間的自己相関の強さを表す指標
▷例:Moran’s I▷例› ある地区属性の他の地区属性との共分散を元にした指標.
相関係数と同様に の間をとる› 相関係数と同様に,-1~1の間をとる
○ 1に近づくほど、同じような空間属性が配置されている
○ -1に近づくほど、異なった空間属性が配置されている、異 属 置
○ 0に近づくほど、空間属性がランダムに分布する
1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する
》空間統計データの自己相関を反映した回帰モデル
1)ふつうの回帰モデル)ふ う 回帰 デル
y:目的変数、X:説明変数、β:パラメータ、
ε:正規分布する誤差項
1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する
》空間統計データの自己相関を反映した回帰モデル
2)時系列統計データの自己相関を反映した回帰モデル)時系列統計デ タ 自 相関を反映した回帰 デル
例:ことしのGDPは去年のGDPに相関する
ρ:パラメータρ ラ タ
1 空間統計データの特性1.空間統計デ タの特性(3)近隣の目的変数同士が相関する
》空間統計データの自己相関を反映した回帰モデル
3)空間統計データの自己相関を反映した回帰モデル)空間統計デ タ 自 相関を反映した回帰 デル
例:地価は近隣の地価と相関する
SARモデルの場合、SARモデルの場合、
W:空間重みづけ行列
1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる
》ふつうの統計データの場合:線形補間
2000 2002 2005ここの値を推計
2000 2002 2005
1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる
》空間統計データの場合:空間補間
ここの値を推計ここの値を推計
1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる
》空間統計データの場合:空間補間
▷例:クリギング▷例 クリギング
1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる
》空間統計データの場合:空間補間
▷例:クリギング▷例 クリギング› ラグランジュ未定乗数法なので、逆行列を解けばいい。
▷
1 空間統計データの特性1.空間統計デ タの特性(4)補間が2次元になる
》空間統計データの場合:空間補間
▷クリギング▷クリギング
2 主題図 トリ ク2.主題図のトリック
》昭和生まれ? 平成生まれ?
1920
1930若くない
1940
1950
1960
若くない
昭和生まれ1960
1970
1980
20世紀生まれ昭和生まれ
1980
1990
2000
若い2000
201021世紀生まれ
平成生まれ
2 主題図 トリ ク2.主題図のトリック
》空間的パターンの分類方法の選び方
自然分類 標準偏差 等間隔 等量町丁目別人口密度
分類手法が変わると、同じ分類に入っていた町丁目が、別々の分類に分かれるようになったりする。
町丁目別人口密度
2 主題図 トリ ク2.主題図のトリック
》自然分類
2 主題図 トリ ク2.主題図のトリック
》標準偏差
2 主題図 トリ ク2.主題図のトリック
》等間隔
2 主題図 トリ ク2.主題図のトリック
》等量
2 主題図 トリ ク2.主題図のトリック
》手動で切りのいい数字に
▷他人に見せるときは、見る人のことを考えると、▷他人 見 る きは、見る人 を考える 、切りのいい数字で「1,000以上」「 10,000以上」の方が分かりやすい。
3 最適値(最適地)を探す3.最適値(最適地)を探すボロノイ分割(ティーセン分割)
》 垂直二等分線を繋ぎ合せて最近隣領域を分割
も と学びた 人はもっと学びたい人は…
》空間モデリング(奇数年の春学期)
その前に ふつうの統計を学びたい人はその前に、ふつうの統計を学びたい人は…
》データ分析(春学期3クラス・秋学期2クラス)
》 SFCデータ分析教育グループ編『データ分析入》 SFCデ タ分析教育グル プ編『デ タ分析入門』第7版、慶應義塾大学出版会、2008年
》鳥居泰彦『はじめての統計学』日本経済新聞社》鳥居泰彦『はじめての統計学』日本経済新聞社、1994年