ビッグデータ処理技術の進化と、 エッジヘビー...
TRANSCRIPT
![Page 2: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/2.jpg)
IoT時代の到来で、
IoTデータがビッグデータの主役となる
膨大なデータがエッジ側で生成されるようになる – 例:映像はカメラ1台で年間100TB、タービンセンサ、ポイントク
ラウド
2
![Page 3: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/3.jpg)
IoT・ビッグデータへの機械学習の適用
3
![Page 4: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/4.jpg)
データの「種類」の爆発
IoT後
4
![Page 5: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/5.jpg)
機械学習技術を活用することにより、
データに対する深い分析の実現を目指す
5
「学習=人間が知識や知能を獲得する過程」を コンピュータ上で実現しようとする
![Page 6: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/6.jpg)
機械学習技術
データがあるところ、どこでも使える
様々な分野の問題に利用可能
6
レコメンデーショ
ンクラスタリング 分類、識別 市場予測 評判分析
情報抽出 文字認識 ロボット 画像解析
遺伝子分析 検索ランキング 金融 医療診断
適用分野
![Page 7: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/7.jpg)
機械学習を大規模化する上での2つの難しい課題
7
入出力がボトルネックとなる 計算量がボトルネックとなる
![Page 8: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/8.jpg)
分析処理のオンライン化・ストリーム化
8
省スペース・効率的なアルゴリズムを使う
![Page 9: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/9.jpg)
9
WEKA
1993-
SVM light
1998-
Mahout
2006-
•Structured Perceptron [Collins, EMNLP 2002] •Passive Aggressive / MIRA 2004~
•oll: online-learning library
[岡野原, 2008]
大規模データに機械学習を適用する、2つのアプローチ
オンライン (リアルタイム)
バッチ
小規模 単体
大規模 分散並列
ここは?
![Page 10: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/10.jpg)
Jubatus
RDBMS/DWH
❶大規模化
❸深い分析
❷リアルタイム性 Yahoo! S4
Twitter Storm
Complex Event Processing
Structured Perception [Collins] Passive Aggressive / MIRA Oll: online-learning library [PFI]
![Page 11: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/11.jpg)
Jubatus supports Scalable Parallel Machine
Learning
“Loose Model Sharing”
11
Each node updates its
model incrementally by
learning from raw data
Nodes only exchange
differences between
models in each node
![Page 12: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/12.jpg)
データを集めるのではなく、
データが分散したまま分析・活用する
12
![Page 13: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/13.jpg)
データを集約するアプローチは、
近い将来うまくいかなくなる
13
丸山宏, 岡野原大輔 Edge-Heavy Data: CPS・ビッグデータ・クラウド・スマホがもたらす次世代アーキテクチャ
GICTF総会 特別講演 2012, http://www.gictf.jp/doc/20120709GICTF.pdf
![Page 14: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/14.jpg)
分野によっては、法律的な問題もある
データを集めようとすると、法律や政治の問題が避けら
れない
それを解決しようとかんばっている内に、諸外国に技術
的に遅れをとってしまう
14
![Page 15: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/15.jpg)
エッジヘビーコンピューティング
15
1000 Petabytes/Year > 200 Petabytes
In Edge Devices (Surveillance Cameras and Smartphones in
Japan)
In Huge Computing Cloud (300,000 nodes, each node has 2TB HDD,
redundancy is 3)
データを「貯めない」、「一カ所に集めない」
この前提のもとで、
深い分析を実現するコンピューティングを
実現する。
![Page 16: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/16.jpg)
エッジ側が、もっとIntelligentになった、
階層型のアーキテクチャ
16
![Page 17: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/17.jpg)
Deep Learningと
エッジヘビーコンピューティング
17
![Page 18: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/18.jpg)
これまでの機械学習は分野毎に専門家による特徴抽出がされていた
特徴抽出すらも学習により獲得し、生のデータから直接認識
人を超えるような認識、識別、判断、予測を実現
http://ai.stanford.edu/~ang/papers/icml09-ConvolutionalDeepBeliefNetworks.pdf
深層学習(Deep Learning)
18
![Page 19: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/19.jpg)
Functions and Improvements of Visual Recognition
2. Person Detection
1. Attribute Classification
3. Position Estimation on the Map
Higher accuracy compared to other position
estimation methods based on e.g. Wi-Fi
strength, geomagnetism
Can be improved by using multiple cameras
(to be added)
Improvement given by Deep Learning
Will improve further with more learning data
hat hat
no-hat
*fppi means false positives per image.
Date
Error of Each Tag
Raising Hands Gender Hat
Feb. 2014 19% - -
May. 2014 2% 10% 3%
Date Error @ 0.1 fppi*
Feb. 2014 40%
May. 2014 19%
Will improve further with more learning data
19
![Page 20: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/20.jpg)
Evolution of IoT/IoE occurs together with Evolution of
Machine Learning
More data bring higher accuracy on machine learning (esp. deep learning)
In IoT Era,
edge-heavy data is increasing
enormously.
Distributed & Cooperative
Intelligence can bridge
![Page 21: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/21.jpg)
![Page 22: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/22.jpg)
IoT時代に向けた新しいコンピュータを創造する あらゆるモノに知能をもたせ、分散知能を実現する
![Page 23: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/23.jpg)
Preferred Networks, Inc. (PFN)
設立:2014年3月
場所:本郷(東京都文京区)、San Jose(CA, USA)
取締役:西川徹、岡野原大輔、長谷川順一
ミッション:
IoT時代に向けた新しいコンピュータを創造する
あらゆるモノに知能をもたせ、分散知能を実現する
IoT事業にフォーカスするため、
株式会社Preferred Infrastructure(2006年3月創業)よりスピンオフした
23
![Page 24: ビッグデータ処理技術の進化と、 エッジヘビー ...ビッグデータ処理技術の進化と、 エッジヘビーコンピューティング 西川 徹 (株) Preferred](https://reader030.vdocuments.pub/reader030/viewer/2022040907/5e7d2611a3f85e51b840404a/html5/thumbnails/24.jpg)
オンラインとオフラインを「リアルタイム」でつなぐ
24
モノとオンラインが リアルタイムに「協調」する