the economics of a cloud computer 「クラウドコンピュータ」の経済学 -...

82
クラウドコンピュータの経済学 The Economics of a Cloud Computer 日経コンピュータ編集部 Nikkei Computer Magazine 中田 @Nakada_itpro Atsushi Nakada 20101016楽天テクノロジーカンフゔレンス2010 講演

Upload: atsushi-nakada

Post on 18-Nov-2014

8.588 views

Category:

Technology


1 download

DESCRIPTION

2010年10月16日に開催された「楽天テクノロジーカンファレンス」での講演スライドです。 ----- 「クラウドコンピュータ」の経済学 中田敦(日経BP社日経コンピュータ記者)  「クラウドコンピューティング」とは、恐ろしく高性能なのにびっくりするぐらい安く使える「クラウドコンピュータ」を使うこと、です。ではなぜ、クラウドコンピュータは高性能で安いのでしょうか。その理由を、データセンター視点と産業視点の二つから考えてみます。 【プロフィール】  1998年慶応義塾大学商学部卒業後、日経BP社に入社。「日経レストラン」「BizTech」「日経Windowsプロ」「ITpro」を経て、 2008年10月より「日経コンピュータ」記者。共著として「クラウド大全」「クラウド大全第二版」(日経BP社)、「Googleの全貌」(同)がある。 twitter: @Nakada_itpro

TRANSCRIPT

Page 1: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

クラウドコンピュータの経済学The Economics of a Cloud Computer

日経コンピュータ編集部Nikkei Computer Magazine

中田 敦 @Nakada_itproAtsushi Nakada

2010年10月16日楽天テクノロジーカンフゔレンス2010 講演

Page 2: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

自己紹介

中田 敦

Atsushi Nakada

@Nakada_itpro

日経コンピュータ 記者

Nikkei Computer Magazine

Staff Writer

Page 3: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Writing articles about Cloudfor 3 years

2009年4月29日号

2010年7月7日号

2009年9月2日号

Page 4: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Writing articles about Cloudfor 3 years

2010年9月15日号

Page 5: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

はじめにIntroductions

10月に入って、気になったクラウド関連ニュース

Interesting News aboutCloud Computing in December

Page 6: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

10月5日〆トヨタ、スマートグリッド自社開発Toyota builds their own Smart Grid for EV

Page 7: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

日経産業新聞曰くNikkei Shimbun Said

々「スマートグリッドで攻め込まれたら事業の根幹が崩れる」(トヨタ幹部)

々仮にエコカーを取り巻く周辺ンフラを抑えられ、規格や仕様が相手側に支配されれば「車を自由につくれなくなる」(幹部)

If someone build smart grids as the Infrastructure of Car Industries, we can’t make cars by ourselves ---Toyota

Page 8: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

10月9日〆Google、自動運転自動車開発

Google公式ブログから

「Googleの創業目的は、テクノロジーで世界を良くすることです」

「自動車の安全と効率性を改善させます」

Larry and Sergey founded Google because they wanted to help solve really big problems using technology. And one of the big problems we’re working on today is car safety and efficiency.

Page 9: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

10月12日〆Google、巨大送電網建設Google to build Smart Grids

Page 10: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

5000億円、600万KW?

々Googleや丸紅が出資して、大西洋沖の洋上風力発電所と米国東部を結ぶ大規模な海底送電網を建設する

々洋上風力発電所は、独立系発電事業者が建設。それをニュージャージ州、デラウエゕ州、メリーランド州、バージニゕ州に送る

々総事業費は最大5000億円。6000MW(600万KW)を供給する

Google公式ブログより

Page 11: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

500B Yen, 6000MW

Google and Marubeni will invest in the development of a backbone transmission project off the Mid-Atlantic coast. The Atlantic Wind Connection (AWC) backbone will stretch 350 miles off the coast from New Jersey to Virginia and will be able to connect 6,000MW of offshore wind turbines.

Google公式ブログより

Page 12: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

5000億円、600万KW?500B Yen, 6000MW

東京電力の最大電力2009年7月30日

Tokyo Electronic Power Corp

Google/丸紅の最大電力

Google/Marubeni

5450万KW(54,500MW)

600万KW(6,000MW)

東京電力が供給する最大電力の10分の1強を、Google/丸紅連合が供給可能(しかも風力発電)

Page 13: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

なぜこのニュースが気になった?Why am I interested in theese news?

クラウドコンピューテゖングのその次の展開を予見させるから

This is the next step ofthe Cloud Computing.

Page 14: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

What is Cloud Computing?

Using a “Cloud Computer”

Page 15: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

クラウドコンピューテゖングとは?

Personal Computing : Using a PC

Mobile Computing: Using a Mobile Device

Cloud Computing: Using a Cloud Computer

Page 16: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

What do you think abou Cloud?

• some sort of – not Cloud

Computing but a Cloud Computer;

something that is always there and

always be accessed and always

store data and always give it back.

Ken Thompson

Page 17: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Ken Thompson

UNIXオリジナル開発者の一人C言語の元となった「B言語」を開発

現在はGoogleに所属

Page 18: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Ken Thompson said

•それはある種の、クラウド々コンピュー

テゖングではなく、クラウドコンピュータ

の問題だ。

•いつでも「あそこ」にあって、いつでもゕ

クセス可能で、いつでもデータを保存でき

て、いつでも保存したデータを取り出せる。

ケン々トンプソン氏

Page 19: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Ken Thompson said

• I think that is very hard. There is two types

of jobs;

• one where you want to do something huge,

• one job that takes thousands of computers to

do or you want to do thousands of little jobs

and never fail. And those are almost like two

separate problems, like MapReduce

ケン々トンプソン氏

Page 20: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Ken Thompson said

• I am actually more interested in the second,

in trying to get small jobs, the kind of jobs

that a user at home will be restore a file,

look at his date book, or pull a video, little

small jobs that are much more reliable than

anything he can do at home.

ケン々トンプソン氏

Page 21: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

ケン々トンプソン氏曰く

• クラウド々コンピュータは、とても難しいことをやってのけている。クラ

ウド々コンピュータは常に二つのタプのジョブを、とても大規模に行っ

ているからだ

• 一つは、何千台ものコンピュータを連携させて、巨大なジョブを何千個も

の小さなジョブに分割して実行し、かつ各ジョブを失敗させないことだ

• もう一つは、ユーザーが家庭で行うような小さいジョブ、フゔルのバッ

クゕップだったり、カレンダーの閲覧だったり、ビデオのダウンロード

だったり、そうした非常に小さいジョブを、ユーザー個人が家庭のコン

ピュータで実行するよりもより信頼性の高い状態で実行するということだ

ケン々トンプソン氏

Page 22: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

クラウドコンピュータの御利益Benefits of Cloud Computer

例えば

Gmail

●巨大な容量 Big Storage無料版でも最低5Gバト

●高速な検索 Fast Searchどんなに大量にメールがあっても1~2秒で検索

●どこからでも使えるFrom any devicesWebブラウザ携帯電話機

Page 23: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

クラウドコンピュータの御利益Benefits of Cloud Computer

例えば

Google Maps●巨大な容量 Big Data

全世界の地図全世界の航空写真主要都市の街頭写真

●高速な検索 Fast Search全世界の地図を1~2秒で検索

●どこからでも使えるFrom any devicesWebブラウザ携帯電話機

Page 24: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Which is faster?

Desktop Search Web Search

Outlook 2010 Gmail

Car Navigation Google Maps

RSS Reader Google Reader

Windows Photo Gallery Picasa Web

Page 25: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

クラウドを使う理由Why do you use cloud?

Webブラウザで使えるから

クラウドで動かすソフトの方が高速々高機能だから

(しかも安い)

無料で使えるから

Cost FreeUse Web Browser

Cloud provides fast and rich services ( and it saves your money)

Page 26: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Google’s Cloud Computer

Googleが2009年4月1日にEfficient Data Center Summit

々2005年11月からコンテナ利用々コンテナは水冷々冷却に使った水は、

「冷却塔」(チラー)で再冷却々2009年4月にベルギーで

「チラーレスデータセンター」運用開始

々サーバーは自作々12Vのバッテリー内蔵々UPS(無停止電源装置)は

使用しない

http://www.google.com/corporate/green/datacenters/summit.html

Page 27: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Google’s Cloud Computer

Page 28: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Google’s Cloud Computer

日経コンピュータ2009年9月2日号「グーグルは異形のメーカー」

Page 29: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

米Googleの2009年4月1日発表資料「Insights into Google's PUE Results」より

冷却装置の無いデータセンターをベルギーで「運用中」

PUEは「1.1以下」

Googleのクラウドコンピュータ

Page 30: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

The Datacenter as a Computer

Page 31: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

詳しく知りたい方は

Page 32: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

The Computer which Google made

日経コンピュータ2009年9月2日号「グーグルは異形のメーカー」

Page 33: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

The Computer which Google made

独自に建造したデータセンター

分散ロックシステム

Chubby

分散フゔルシステム

Google File System(GFS)

並列プログラミングモデル

MapReduceキー々バリュー型データストゕ

BigTable

プログラミング言語

Sawzall

グーグルプラットフォーム

Web検索 ログ解析 GmailGoogle Maps

ゕプリケーションサービス

論文〆Interpreting the Data: Parallel Analysis with Sawzall(2005年)

論文〆MapReduce: Simplified Data Processing on Large Clusters(2004年)

ホワトペーパー〆The Datacenter as a Computer. An Introduction to the Design of Warehouse-Scale Machines(2009年)

論文〆Bigtable: A Distributed Storage System for Structured Data(2006年)

論文〆The Google File System(2003年)

論文〆The Chubby lock service for loosely-coupled distributed systems(2006年)

論文〆Failure Trends in a Large Disk Drive Population(2007年)

Page 34: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Google Computer Characteristics

• 巨大なクラスタ(システム)を保有し

ないサードパーテゖ々ソフトウエゕ々

プロバダが、ソフトウエゕのテスト

やチューニングを十分な水準で行うの

は困難だ」

自前主義 - by Google own

Page 35: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Google Computer Characteristics

• OSレヤーがあるとすれば、それは

「Cluster-Level Infrastructure」のこ

とだ

• Datacenter must be a general-

purpose computer system.

自前主義- by Google own

Page 36: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Google Computer Characteristics

• 価格性能比を考えると、安いCPUしか

使わない

• プロセッサ使用率は高いほど消費電力

効率が良い → 安い々遅い方が良い

スケールゕウト – Scale Out

Page 37: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Google Computer Characteristics

•MTBF(平均故障間隔)が30年というサー

バーがあったとしても、それが1万台あれば1

日に1台は故障が起きる

•いくらRAIDでデゖスクを冗長化しても、電源

装置やストレージOSなどが「単一障害点」と

して残る

ソフトウエゕベースの耐障害性対策

Page 38: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft follows Google

シカゴの最新鋭データセンター

コンテナ

112台

サーバー台数

22万4000台(コンテナのみ)

「Data Center Knowledge」より引用

Page 39: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft follows Google

Chicagohttp://bit.ly/bNA9vW

Page 40: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft follows Google

San Antoniohttp://bit.ly/bNA9vW

Page 41: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft follows Google

•52万台

日本のPCサーバー出荷台数(2009年度)

•最大50万台(コンテナ=22万4000台、その他=20~30万台)

Microsoftのシカゴ々データセンター

•60Mワット

シカゴDCの消費電力

•110億円(東京電力/家庭用電力の場合)

50Mワットの年間電気料金

Page 42: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

PUE=1.2の意味

PUE(Power Usage Effectiveness)

全部IT機器が消費 = PUE 1.0半分を冷却装置などが消費 = PUE 2.0

サーバーが50MWの電力を使用した場合の電気料金

PUE = 1.2の場合 110億円PUE = 2.0以上の場合 200億円以上

Page 43: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft’s Cloud Computer

輸送用のコンテナではなく、プレハブ方式のモジュールを使用する。側面は「格子戸」のようになっており、サーバー冷却用の外気をここから吸い込む

Page 44: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft’s Cloud Computer

格子戸の内側にはフゖルターが据え付けられていて、外気に含まれるホコリなどを取り除く

Page 45: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft’s Cloud Computer

デル製で、高さ2Uのラックマウントサーバーが数百台格納されている

Page 46: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft’s Cloud Computer

側面から取り込んだ外気をサーバーに送り込んで冷却する。外気の温度が上昇した場合は、格子戸の裏に水を垂らして、取り込んだ外気を冷却する

Page 47: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Microsoft’s Cloud Computer

IT PACはサーバー冷却に外気を使用するので、屋外で運用する

Page 48: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

データセンターの規模の経済Economy of Scale in DC

中規模(1000台クラス)データセンター

大規模(5万台以上)データセンター

倍率

ネットワーク々コスト

1Mビット/秒の通信回線当たり

月額95ドル1Mビット/秒の通信回線当たり

月額13ドル7.1倍

ストレージ々コスト

1Gバトの容量当たり

月額2.2ドル1Gバトの容量当たり

月額0.40ドル5.7倍

管理コスト1管理者当たりの管理台数

140台1管理者当たりの管理台数

1000台以上7.1倍

米国カリフォルニア大学バークレー校(UC Berkeley)Reliable Adaptive Distributed Systems Laboratory調べ"Above the Clouds: A Berkeley View of Cloud Computing"(2009年2月10日), Michael Armbrust, Armando

Fox, Rean Griffith, Anthony D. Joseph, Randy Katz,Andy Konwinski, Gunho Lee, David Patterson, Ariel

Rabkin, Ion Stoica, and Matei Zaharia

Page 49: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

規模が実現する人的コスト削減Scale makes HR cost lower

• 5000 machines / 1 administrator

Server Management Policy in Microsoft

• 壊れたサーバーはその時点で修理/交換しない

• 定期的なメンテナンス時にのみ交換する

• Batch maintenance of Machines

Server Management Policy in Google

「The Datacenter as a Computer」日本語タトル〆「Googleクラウドの核心」より

Page 50: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

他人に使わせて規模の経済を実現!Get others resource to be bigger

2007年4月 Web 2.0 EXPOAmazon.comのジェフ々ベゾス CEO「Amazon .com 12年の運用

経験を元にしたサービスを提供する」

Page 51: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

他人に使わせて規模の経済を実現!Get others resource to be bigger

Amazon クラウド

仮想マシンサービスAmazon EC2

ストレージサービス

Amazon S3

々Amazonの小売りサト

々Amazon Web Services

Amazonが小売りサトを運用するために構築したデータセンターの処理能力やストレージを、外部の第三者が自由に利用できるサービス

Page 52: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

AWS Traffic is bigger thanAmazon.com Traffic in 2008

Amazonの小売りサトの通信量(ネットワークトラフゖック)E-Commerce NW Traffic

Amazon Web Servicesの通信量)AWS Network Traffic

Page 53: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

他人に貸すのは負担ではないの?Is AWS burden for Amazon.com?

Amazonからの回答Answer from Amazon – NO!「まったく負担ではない。むしろ全体のネットワークトラフゖックが増加することで、通信事業者に対するデゖスカウント交渉が容易になり、処理当たりのネットワークコストが低下した」We can get volume discounts in NW cost.

Page 54: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

AmazonもGoogleも本業は別

Amazon.com

Google

Main Business

E - CommerceCloud Services

Main Business

AdvertisingCloud Services

Microsoft

Main Business

Package SoftwareCloud Services

synergetic effect

synergetic effect

相乗効果

Page 55: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Appleもクラウドに邁進

ゕップル

Main Business

Consumer ElectronicsCloud Servicessynergetic effect

ノースカロラナ州に10億ドル(900億円)を投じて、巨大データセンターを建造中

Page 56: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Cloud Computing in 2012

Cloud

EnterpriseDistributed

Computing

NoSQL

KVS

Low Power

Hardware

Consumerlization

Page 57: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Where did New TechCome from?

Ancient

IT Vendors

Enterprise政府、軍、航空宇宙

政府や軍、航空宇宙分野でIT技術が育まれ、それを「ITベンダー」がエンタープラズに提供する

Page 58: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Where will New Tech

Come from?Future

これから

Enterprise

Consumer Market

Cloud ServiceProvider

消費者市場でIT技術が育まれ、それを「クラウドプロバダー」がエンタープラズに提供する

Page 59: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

クラウド2012年のロードマップ

々クラウドで開発された技術がエンタープラズに持ち込まれる動きが

加速する

々本当の意味での「プラベートクラウド」

々代表格は「Hadoop」グーグルの分散処理技術を模倣したOSS「DWH」「基幹系バッチ」への採用が進む

Page 60: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

日経コンピュータのクラウド担当

2010年9月15日号

Page 61: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

OSS、大変化中

今までのOSS = 商用製品を追走

これからのOSS = クラウド育ち

新しい技術を安価に

Google、Amazon.com、Facebook など

技術の発信源

商用OSWindows

UNIX

商用データベースOracle

DatabaseSQL Server

商用オフゖス

MicrosoftOffice

LinuxMySQL

PostgresOpen Office

枯れた技術を、安価に

キャッチアップ キャッチアップ

技術の発信源

分散バッチ処理ソフト

MapReduce

キー々バリュー型データストゕ

IaaS構築ソフト

メーカー

Hadoop

キャッチアップ

Cassandra、Voldemort

ソフトを開発した企業がOSS化

OpenStack Eucalyptus

キャッチアップ

Page 62: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Google生まれの分散バッチ処理技術業務システムに浸透中

RDBのターゲット領域

処理件数(件数/時間)

データベース規模

60万

30万

10万

5万

Hadoopのターゲット

領域

10億件1億件1000万件100万件

データウエゕハウス(DWH)、ビジネスンテリジェンス(BI)

基幹系バッチ処理

新領域(情報爆発、ビッグデータ)

主な事例全社規模でのWebサーバーログ解析基盤:ヤフー、サバーエージェント、電通国際情報サービスPOSデータを使った売れ行き分析:大手流通業

主な事例顧客口座の「値洗い処理」:三菱東京UFJ銀行クレジットカードの不正利用検出:米VISA月末の会計バッチ処理:ウルシステムズが構築中(顧客は小売業など)

主な事例スマートグリッド:米テネシー川流域開発公社(TVA)機械学習(レコメンド処理):楽天など

Page 63: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

基幹バッチを置き換えるHadoop

結果Hadoop

基幹系システム=トランザクション処理システム

RDBMS

バッチ処理システム

々集計々分析々変換々名寄せ

・ポイント基幹系は変更しない

テキスト

CSV

従来に比べて処理時間が大幅短縮

Page 64: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

基幹バッチ、DWHをHadoopが置き換え中

導入企業 用途

米VISAクレジットカードの不正使用を検出2年で7兆3000億件のトランザクションを解析するのに13分しかかからない

米JPモルガンチェース ドキュメント用の保存ストレージとしてHadoopを活用

三菱東京UFJ銀行 口座の値洗い処理(時価による再計算)にHadoopを活用予定

米Yahoo!ンターネット広告のログ解析などに、2万4000台のクラスターを運用

楽天 「レコメンド処理」にHadoopを使用

サバーエージェント 広告代理店向けシステムをHadoopで構築

電通国際情報サービス 広告代理店向けシステムをHadoopで構築

リクルート サーバーログ解析システムにHadoopを採用

Page 65: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Big Dataはどこにでもある

々何日か経ったら捨てていたトランザクションの生データ(POSデータ)

々ログ、ログ、ログ業務システムのログ(社員の働き方そのもの)

々スマートグリッド

Page 66: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

SOCC 2010に行ってきました

Page 67: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

04年8月 06年5月 07年9月 10年5月

月間ジョブ数 2万9000 17万1000 221万7000 447万4000

サーバー作業量(サーバー×年)

217 2002 1万1081 3万9121

月間処理データ量(テラバト)

3288 5万2254 40万3152TB 94万6460

MapReduceによる月間データ処理件数、処理量

ほぼエクサバト(946Pバト)

Googleは1カ月に1エクサバトをMRで処理

Page 68: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

めざせサーバー1000万台データセンター1000カ所

Page 69: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

めざせサーバー1000万台データセンター1000カ所

Google Spannerの目標

想定サーバー台数 100万~1000万台(106 to 107)

想定ストレージ容量 最大1エクサバト(1018バト)

想定データセンター数 世界中に100~1000カ所

想定クラゕント数 10億クラゕント(109台)

Page 70: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Googleが持っているもの

世界最大の「クラウドコンピュータ」

世界最大の「機械学習力」

Page 71: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

コンピュータ将棋女流名人に勝つ、しかし…

Page 72: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

プログラマーも機械学習に「敗北」

「情報処理」8月号「コンピュータ将棋の不遜な挑戦」

「激指では以前から探索ゕルゴリズムの部分で機械学習を利用していたのだが〃評価関数にまで機械学習を導入したことで〃完全に機械学習に魂を売ってしまったようで悔しい気がしなくもない〄

YSSの作者の山下氏が〃自動学習された評価関数によるYSSの将棋を見て〃『自分のプログラムではなくなったような気がする』と嘆息していたのには同感だ」

Page 73: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

プログラマーも機械学習に「敗北」

●いままでのコンピュータ将棋プログラム

●現在のコンピュータ将棋プログラム

将棋知識

プログラマー

チューニング学習

可変長テキスト可変長

テキスト可変長

テキスト可変長

テキスト棋譜

(ログデータ)学習

Page 74: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

Googleが得意なのは大量データを使った機械学習

●昔のWeb検索エンジン

●Google

ンターネット

Webサーファー

ンデックス作成サーフゖン

可変長テキスト可変長

テキスト可変長

テキスト可変長

テキスト

人間によるリンクした

リンクされたの関係性

「ページランク」による順序付け

昔のYahoo!

クラウドコンピュータ

ンデックス作成

Page 75: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

ハードデゖスクの運用に誰より詳しいGoogle

セ氏50度未満なら

ハードデゖスク温度と故障率に相関関係は無い

米Googleの2007年2月の論文「 Failure Trends in a Large Disk Drive Population」より

Page 76: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

年間100万台のサーバーを製造するメーカーと

年間300万台(?)のサーバーを運用するサービス事業者

サーバーに詳しいのはどちら?

Googleがコンピュータ産業に参入した理由

Page 77: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

クラウドは始まりに過ぎない

第一歩〆 クラウドコンピュータ、メデゖゕ/広告業界、小売業界を席捲

第二歩〆 クラウドコンピュータ、コンピュータ産業を席捲中

これから〆 電力?

自動車? 交通?

ヘルスケゕ?

Page 78: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

10月9日〆Google、自動運転自動車開発

Google公式ブログから

「Googleの創業目的は、テクノロジーで世界を良くすることです」

「自動車の安全と効率性を改善させます」

Page 79: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

10月12日〆Google、巨大送電網建設

Page 80: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

臆する必要は無い(はず)

テクノロジー名称 用途

Cassandra ピゕ々ツー々ピゕ(P2P)技術を採用した分散データベース

Haystack 写真ゕプリケーション用の分散ストレージ

Hive 「Hadoop」用のデータウエゕハウスツール

Scribe 大量のサーバーで運用するさまざまなサービスのログデータをリゕルタムで収集するソフト

HipHop for PHP スクリプト言語PHPのソースコードをC++に変換して高速化するソフト

Tornado リゕルタムWebゕプリケーションを実行するゕプリケーションサーバー

Facebookを見よ!

Page 81: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

その動きは日本でも

kumofsFlareHibari

HandlerSocket plug in for MySQLTokyo Cabinet

Roma

Page 82: The Economics of a Cloud Computer 「クラウドコンピュータ」の経済学 - 楽天テクノロジーカンファレンス講演

おしまい

ありがとう

ございました