犯罪オープンデータを用いた犯罪予測ア ルゴリズムとシステムの … ·...
TRANSCRIPT
犯罪オープンデータを用いた犯罪予測アルゴリズムとシステムの開発
株式会社Singular Perturbations
東京大学空間情報科学研究センター
梶田真実
第2回官民ラウンドテーブル(犯罪)
2018/03/27 株式会社Singular Perturbations
1
資料3
専門分野:理論統計物理(ガラス転移)
梶田 真実略歴:千葉大学飛び入学→2010年3月東京大学大学院 Ph.D →学術振興研究員(PD)で大阪大学、名古屋大学
自作iOS App「パトロールマップ」
各都道府県警察配信MLの軽犯罪データの可視化
犯罪予測アルゴリズム
現在 株式会社Singular Perturbations設立CEO(兼)東京大学空間情報科学研究センター客員研究員
会社概要および発表者自己紹介
実績
受賞:• VLED Disruptive Innovation Award(日本オラクル)賞• LODコンテスト2016データサイエンス賞メディア:日経BP、ITpro
論文:arxiv.org/1704.00240特許:2016/06
http://www.singularps.com
2
理論 犯罪データ
(https://www.youtube.com/watch?v=k1nO3yVGx9M)
4. PreCobs[4]
ドイツ・バイエルン州警察
が実証実験
LA,シアトル、サンタクルーズ等の警察が導入
1. PredPol[1]
全米60以上の警察で導入。2011年にGeorge Mohler准教授が提案したEM法を用いた犯罪予測アルゴリズム[2]を
もとに警察向けパトロール経路提案事業を行うスタートアップ。
[3] http://www.riskterrainmodeling.com
世界の犯罪予測アプリケーション
3. HunchLab[5] , PROVE (azavea社)
6. Predictive Crime Analytics
(Avrio and Pantascene; Hitachiが買収)
全米35州、45カ国で試験が行われた犯罪に関連する環境要因を地図上で重ね合わせたものを用いた予測。
5. Blue Crush (IBM)
犯罪予測は多数のベンチャー企業が生まれる業界
7. C.R.A.S.H. (Crash Reduction Analyzing Statistical History): 交通事故予測アルゴリズム(テネシー州警察)
8. Civcic Scape; ソースコードをgithubで公開(9 cityの警察で利用または準備中)
9. Space Imaging Middle East (ドバイ警察)
[4] http://www.ifmpt.de
[1] http://www.predpol.com[2] Mohler, G.O., et al., 2011. J. American Statistical Association, 106 (493), 100–108
[5]https://www.hunchlab.com
Memphis警察が導入
フィラデルフィア、NY検討、シカゴ市警
シカゴ全域で殺人事件が前年同期より3%増えた中で、
発砲事件が39%、殺人事件が33%減
http://japanese.engadget.com/2017/08/11/hunchlab/
犯罪発生が予測される地域に人員を重点配置することで、重大犯罪が30%、凶悪犯罪は15%減少した
https://data.cityofchicago.org/Public-Safety/Crimes-2001-to-present/ijzp-q8t2
現在のデータ公開状況(アメリカ)時間分解能は1日毎。空間分解能は250m程度
https://data.cityofnewyork.us/Public-Safety/Historical-New-York-City-Crime-Data/hqhv-9zeg
アルゴリズム開発に使える!
3
2. Risk Terrain Modeling[3]
現在のデータ公開状況(日本)
http://www.bouhan.metro.tokyo.jp/opendata/
警視庁データ項目:住居侵入等時間分解能は1ヶ月毎。空間分解能は丁目まで
時間分解能は1日毎。
データ公開に希望する内容
4
犯罪予測をするには
粗すぎる
現在のデータ活用事例:犯罪予測アルゴリズムの開発
“近接反復被害”の法則犯罪者は、一度犯行に成功すると、既に得た知識を有効活用できる(環境とターゲットの行動を熟知した)現場近くで犯行を繰り返す。
一度犯罪が起きると、その近傍で犯罪が発生しやすくなる→犯罪のカスケード現象
〜Self-Exciting Point Process (SEPP) model〜
予測犯罪発生密度λ(t)=g(t-t1)+g(t-t2)+λ0
→ How to find g(t,x)?
5
SEPPのg(t,x)をグリーン関数と焼き直し、犯罪事象ρを物理方程式として関係付ける
犯罪データから生成されたρを用いてグリーン関数g(t,x)を求めるという問題に帰着
How to find g(t,x)?
Data-driven Green's function (DDGF) アルゴリズム
オリジナル
データ駆動型
ノンパラメトリック型steps of algorithm
① calculateφ from past crime data
② construct g using Laplace transform ofφ
③ predict future crime rate λ using g(t,x)
φ(k,t)= < ρ(k,t+t0)/ρ(k,t0) >t0
g(k,z) = φ(k,z)/(1+ φ(k,z)) → g(t,x)
λ(x,t) = Σti<t g(t-ti,x-xi)
6
東京の予測犯罪発生密度と実際に起きた犯罪
2015/7/2に実際に起きた犯罪
• 警視庁のメーリングリストサービス(メール警
視庁)が配信する東京都の軽犯罪データ
• 東京都の痴漢、窃盗、不審者、暴漢
• 東京都庁から半径10km圏内、2015/3月 ~
2015/10月までの期間から100日間
• 時空間分解能: 1km^2, 1day
予測犯罪発生密度が高い
エリアで実際に犯罪が発生し
ている。
予測犯罪発生密度Esri Japan, Esri, HERE, DeLorme, INCREMENT P, USGS, METI/NASA
7
1. 犯罪発生確率が高い順番に、セルを選択
(例:全体の15%だけ選択)
2. 選んだセルと実際に犯罪が起きた場所(↑)
が一致する割合から、精度を定義する
精度=予測できた犯罪数/全ての犯罪発生件数
8
大
小
データ公開で実現できること&期待される社会へのインパクト
・日本の犯罪について犯罪予測精度を検証し、学術的な成果を創出
→日本の犯罪(犯罪数が少ない/犯罪発生メカニズムが日本独特の場合)に合った予測手法の検討
→様々な分野の専門家が犯罪予測分野へ参入する→日本の犯罪学分野の活性化・公開可能なデータを用いた一般向けの犯罪予測アプリケーションを開発
(例)ひったくりの犯罪予測確率と実際の犯罪
今後実現したいサービス「クライムナビ」
①デスクトップ型アプリケーション
過去に発生した犯罪
今日の予測犯罪確率の等高線図
(昨日までの犯罪情報から計算)
②モバイルアプリケーション
cartoDB 9