big databig data: seizing opportunities, preserving values executive office of the president may...

98
BIG DATA: SEIZING OPPORTUNITIES, PRESERVING VALUES Executive Office of the President MAY 2014 ビッグデータ: 機会を逃さず、価値を守る 大統領行政府 20145日本語訳(Ver 0.2次世代パーソナルサービス推進コンソーシアム 一般社団法人情報処理学会 一般財団法人日本情報経済社会推進協会(JIPDEC)

Upload: others

Post on 26-Sep-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

BIG DATA: SEIZING OPPORTUNITIES,

PRESERVING VALUES

ExecutiveOfficeofthePresident

MAY2014

ビッグデータ: 機会を逃さず、価値を守る

大統領行政府

2014年5月

日本語訳(Ver0.2)

次世代パーソナルサービス推進コンソーシアム

一般社団法人情報処理学会

一般財団法人日本情報経済社会推進協会(JIPDEC)

本著は、米国ホワイトハウスが発表したレポート“BIG DATA:SEIZING OPPORTUNITIES,PRESERVING VALUES”を訳したものである。オリジナル

版と日本語版で不一致が認められる場合、オリジナル版のテキストが有効であ

る。本翻訳は参考のための日本語訳であり、正確には原文

(http://www.whitehouse.gov/sites/default/files/docs/big_data_privacy_report_5.1.14_final_print.pdf)を参照されたい。

日本語翻訳協力:

次世代パーソナルサービス推進コンソーシアム

デジタル・アドバタイジング・コンソーシアム株式会社

一般社団法人情報処理学会

本翻訳は、米国ホワイトハウスが「ビッグデータが社会に与える影響」につい

て調査した結果について、広く情報共有されることを目的として翻訳したもの

である。本翻訳が、個人に関する情報を安全・安心に利活用するための制度的・

技術的な課題を検討する上で、大いに参考になることを望む。

原著の著作権については、下記を参照のこと。

Copyright Policy Pursuant to federal law, government-produced materials appearing on this site are not copyright

protected. The United States Government may receive and hold copyrights transferred to it by

assignment, bequest, or otherwise.

Except where otherwise noted, third-party content on this site is licensed under a Creative Commons

Attribution 3.0 License. Visitors to this website agree to grant a non-exclusive, irrevocable,

royalty-free license to the rest of the world for their submissions to Whitehouse.gov under the Creative

Commons Attribution 3.0 License.

http://www.whitehouse.gov/copyright

2014年5月1日

大統領 殿

私たちは社会的、経済的、技術的な革命の真っ只中にいます。人々のコミュニケーショ

ンや交わり、余暇やビジネスの場はインターネットへと移行しています。インターネッ

トは電話をはじめ家庭や都市を取り巻くいろいろなデバイスへと進入し、産業経済を動

かしている工場へも入り込んでいます。この結果、データや新しい知識が爆発的に増え、

世界が変わろうとします。

ビッグデータが私たちの生活や仕事にどのような影響を与え、政府、市民、企業、消費

者の関係をどのように変えようしているかについて、今年1月、私たちは大統領閣下か

ら90日に及ぶ調査を実施するよう委託されました。この報告書は、政府や民間がビッグ

データの利点を 大限に活かし、そのリスクを 小限に抑えるにはどうすればよいかに

焦点を合わせています。さらにどうすればビッグデータが経済の成長や医療、教育の改

善に貢献し、国の安全やエネルギー消費の効率化に寄与できるかを探ります。

ビッグデータが政府のパワーをチェックされないままに肥大化させてしまう危険性は

確かに存在します。その一方で、ビッグデータはこうした問題を解決し、アカウンタビ

リティ、プライバシー、国民の権利を強化する可能性も持っています。正しく利用しさ

えずれば、ビッグデータは歴史を進歩させる原動力となり、我が国の特徴である社会と

経済のダイナミズムを今後もずっと継続させる助けとなります。

ビッグデータの技術は社会のあらゆる領域の変化につながります。ビッグデータによっ

て膨大な量の知識が明るみに出ることから、プライバシー保護の枠組みを新しいエコシ

ステムの中でどのように適用するかという重要な問題が出てきます。ビッグデータが生

み出す問題はこれだけではありません。この報告書が明らかにしたことのひとつは、住

宅購入、クレジット、雇用、医療、教育、市場活動などでの個人情報の使用に関して長

らく適用されてきた国民の権利の保護がビッグデータの分析によって無効になってし

まうかもしれないということです。米国民の機会と可能性はデータとの関係によって拡

大されるべきであり、縮小されるようなことがあってはなりません。

私たちは過去を受け継ぎ、未来を構築します。米国は個人の力の拡大と社会の進歩に向

けてデジタル革命を利用するうえで、他のどの国よりも好都合な位置にあります。ビッ

グデータの技術を受け入れ、同時にプライバシー、公平、自己決定といった基本的な価

値を守るにはどうすればよいかについてここに報告できることは私たちの喜びです。私

たちはこの報告書に提案されているイニシアティブと改革を強く信じています。私たち

を取り巻く世界がビッグデータによって変容する中、ここにいま開始した議論は私たち

の価値を守っていくことにつながるはずです。

JOHN PODESTA

大統領顧問

PENNY PRITZKER

商務長官

ERNEST J. MONIZ

エネルギー長官

JOHN HOLDREN

科学技術政策局局長

JEFFREY ZIENTS

国家経済会議委員長

VI

目 次

目 次 ....................................................................................................................................... VI

I. ビッグデータと個人 ............................................................................................................... 1

ビッグデータとは何か ............................................................................................................... 1

価値を確認する........................................................................................................................ 10

II. オープンデータとプライバシーに対するオバマ政権のアプローチ .................................... 12

オープンデータとオバマ政権 .................................................................................................. 13

米国のプライバシー法と海外のプライバシーフレームワーク ............................................... 17

III. 公的分野のデータ管理 ....................................................................................................... 25

ビッグデータと医療サービス .................................................................................................. 25

学ぶことに関して学ぶ:ビッグデータと教育 ........................................................................ 27

ビッグデータと国土安全保障省 .............................................................................................. 30

法律執行においてプライバシーの価値を守る ........................................................................ 33

ビッグデータの技術がプライバシー法にとって持つ意味 ...................................................... 36

IV. 民間セクターのデータ管理 ................................................................................................ 44

企業と消費者が受けるビッグデータの恩恵 ............................................................................ 44

広告が支えるエコシステム ..................................................................................................... 45

V. ビッグデータのための政策的枠組み.................................................................................... 54

ビッグデータと市民 ................................................................................................................ 55

ビッグデータと消費者 ............................................................................................................. 56

ビッグデータと差別 ................................................................................................................ 57

ビッグデータとプライバシー .................................................................................................. 60

予測されるビッグデータ革命の次の段階 ................................................................................ 62

VI. 結論と提言 ......................................................................................................................... 65

1. プライバシーの価値の保護 ............................................................................................... 68

2. デジタル時代の責任ある教育イノベーション .................................................................. 70

3. ビッグデータと差別 .......................................................................................................... 72

4. 法律執行とセキュリティ ..................................................................................................... 73

5. 公的資源としてのデータ ................................................................................................... 75

付 録 ....................................................................................................................................... 77

VII

1

I. ビッグデータと個人

ビッグデータとは何か

はるか昔に 初の国勢調査が行われ、収穫高が記録されて以来、データの収集と分析は

社会のさまざまな機能を改善するうえで不可欠になっている。17世紀から18世紀にか

けて確立された微積分、確率、統計の基本理論によって、太陽と星の動きをより正確に

予測し、犯罪、結婚、自殺などの人口当たりの比率を判別するための一連の新しいツー

ルが提供された。これらのツールは、多くの場合めざましい進歩を生み出した。19世紀

になり、ジョン・スノウ博士(Dr. John Snow)は当時 新だったデータ科学を駆使し、

ロンドンでコレラが集中的に発生している地域の地図を作成した。当時「瘴気」によっ

て広がると考えられていたコレラの原因を汚染された公共の井戸にまでさかのぼるこ

とにより、スノウ博士はコレラ菌の理論の基礎を築いた1。

経済活動を促進するためのヒントをデータから見つけ出すことは米国で根を下ろした。

フレデリック・ウンズロー・テイラー(Frederick Winslow Taylor)はペンシルバニア

州のミッドベール・スチール社でストップウォッチとクリップボードを使って生産性を

分析し、作業現場での生産高を増加させた。「データ科学は生活のあらゆる面の革新に

つながる」というテイラーの信念はこれによって確かなものとなった2。テオドール・

ルーズベルト大統領の「国の効率を高める」という呼びかけに応え、テイラーは『科学

的管理法』(The Principles of Scientific Management)を執筆した。

科学的管理の原理は、個人の単純な行為から大企業の経営に至るまで人間のあらゆ

る活動に適用できる。…. これらの原理を正しく適用すれば、実に驚くべき結果が

生じる3

今日、データはかつてないほど深く我々の生活に組み込まれている。我々はデータを使

って問題を解決し、生活の質を高め、経済的繁栄を実現しようとする。データ処理能力

の増加、コンピューティングとストレージのコストの低下、各種デバイスに埋め込まれ

たセンサーの増加などにより、データの収集、保存、分析は増える一方であり、今後も

とどまるところを知らないように見える。ある推計によると、2011年に生成し複製さ

れた情報は1.8ゼタバイトを上回る4。2013年には全世界で4ゼタバイトのデータが生成

1 Scott Crosier, John Snow: The London Cholera Epidemic of 1854, Center for Spatially Integrated Social Science, University of California, Santa Barbara, 2007, http://www.csiss.org/classics/content/8. 2 Simon Head, The New Ruthless Economy: Work and Power in the Digital Age, (Oxford University Press, 2005). 3 Frederick Taylor, The Principles of Scientific Management (Harper & Brothers, 1911), p. 7, http://www.eldritchpress.org/fwt/ti.html. 4 John Gantz and David Reinsel, Extracting Value from Chaos, IDC, 2011, http://www.emc.com/collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf.

2

されると推定されている5。

ゼタバイトとは何か

ゼタバイトは1,000 000,000,000,000,000,000バイト(情報単位)である。1バイトはア

ルファベットの1文字に相当する。レフ・トルストイの1,250ページに及ぶ『戦争と平和』

の1兆倍が1ゼタバイトとなる6。あるいは米国民全員が一ヶ月間毎日1秒ごとにデジタル

写真を撮ると想定してみよう。これらの写真をすべて合計するとおよそ1ゼタバイトに

なる。 毎日5億枚以上の写真がアップロードされ、共有されている。さらに1分ごとに200時間

を上回るビデオがアップロードされている。しかし、音声通話、電子メール、テキスト

からアップロードする写真に至るまで個人が自分で毎日生成する情報の量は、個人に関

して毎日生成されるデジタル情報の量に比べれば取るに足りない。

こうした傾向は今後も続く。我々は、各種の機器や車両、増加するきざしを見せている

「ウェアラブル」コンピュータなどが相互に通信する、いわゆる「モノのインターネッ

ト」がまさに誕生しようとする初期の段階にいると言えよう。情報を作成、収集、管理、

保存するコストは技術進歩のおかげで2005年の6分の1に低下している。2005年以降、

ハードウェア、ソフトウェア、人材、サービスへの企業の投資は50%増加し、4兆ドル

に達する。

「モノのインターネット」

「モノのインターネット」(“Internet of Things”)とは、有線や無線のネットワークで

リンクされている組み込みセンサーを使って各種のデバイスが相互に通信する能力を

指す。こうしたデバイスには、サーモスタットや自動車のほか、医師が消化管の健康状

態を監視するために飲み込む錠剤も含まれる。これらのデバイスはインターネットを介

してデータを送信し、編集し、分析する。

「ビッグデータ」の定義は数多くあり、誰が定義するかによって異なってくる。コンピ

ュータの専門家、金融アナリスト、ベンチャー企業にアイデアを提供する起業家などは

それぞれのやり方で「ビッグデータ」を定義している。定義のほとんどは、量、速度、

多様性が増加する一方のデータを収集し、統合し、処理する技術的なパワーを反映して

いる。言い換えれば、「いまやデータはより速く入手でき、その範囲はますます広がり、

以前には不可能だった新しいタイプの観察や測定を含むようになっている」7のである。

5 Mary Meeker and Liang Yu, Internet Trends, Kleiner Perkins Caulfield Byers, 2013, http://www.slideshare.net/kleinerperkins/kpcb-internet-trends-2013. 6 “2016: The Year of the Zettabyte,” Daily Infographic, March 23, 2013, http://dailyinfographic.com/2016-the-year-of-the-zettabyte-infographic. 7 Liran Einav and Jonathan Levin, “The Data Revolution and Economic Analysis,” Working Paper, No. 19035, National Bureau of Economic Research, 2013, http://www.nber.org/papers/w19035; Viktor Mayer Schonberger and Kenneth Cukier, Big Data: A Revolution That Will Transform How We Live, Work, and Think, (Houghton Mifflin Harcourt, 2013).

3

より厳密に表現すれば、ビッグデータセットは「さまざまな種類の大規模で複雑な、垂

直型もしくは分散型のデータセットであり、計測機器、センサー、インターネット取引、

電子メール、ビデオ、クリックストリーム、今日または将来的に利用できるその他のデ

ジタルソースから生成される」8。

ビッグデータに関して大切なのは、それをどう使うかである。技術現象としてのビッグ

データをどう定義するかはさておき、ビッグデータ分析には種々多様な用途が考えられ

ることから、現在の法的、倫理的、社会的な規範がビッグデータの世界の中でプライバ

シーやその他の価値を保護するうえで十分かどうかという重要な問題が浮上してくる。

コンピューティングのパワーがかつてないほど大きくなり、高度化している中、予想も

しない発見やイノベーション、生活の質の向上が可能になっている。しかしこうした高

度な力のほとんどは平均的な消費者の手には届かず、目にも見えない。このことから、

データを保持する側とデータを作為または不作為に提供する側との間にパワーの不均

衡が生まれる。

ビッグデータを扱う状況は千差万別である。こうしたさまざまな状況を理解することが

もうひとつの課題となる。ビッグデータは資産ととらえることもできるし、公共財とと

らえることもできる。あるいは個人のアイデンティティの表現とする見方もある9。ビ

ッグデータの利用は米国の将来の経済発展の推進力だとする見方もあれば、これまで培

ってきた個人の自由に対する脅威だとする見方もある。ビッグデータはこれらのすべて

である。この90日におよぶ調査の趣旨からして、我々が目指しているはビッグデータの

問題のすべて答えることではない。ビッグデータの技術もその技術をサポートする産業

界も常に革新的な変化をしている。この調査では、個人の側と個人に関するデータを収

集し利用する側との関係という も重要な問題に焦点を合わせる。

本調査の範囲

1月17日、合衆国による信号諜報活動を改める問題に関して司法省で行った演説の中

で、オバマ大統領はジョン・ポデスタ(John Podesta)顧問に対して、現在および将

来においてビッグデータが経済、社会、政府の一連の活動に与える影響に関する包括的

な調査を実施するよう求めた。この調査には、ポデスタ顧問のほかに、ペリー・プリッ

ツカー(Penny Pritzker)商務長官、アーネスト・モリツ(Ernest Moniz)エネルギー

長官、ジョン・ホールドレン(John Holdren)科学顧問、ジェフリー・ジーンツ(Jeffrey

8 National Science Foundation, Solicitation 12-499: Core Techniques and Technologies for Advancing Big Data Science & Engineering (BIGDATA), 2012, http://www.nsf.gov/pubs/2012/nsf12499/nsf12499.pdf. 9 Studies Sheila Jasanoff (Harvard Professor of Science & Technology)によれば、ビッグデータに関する政

策の立案がむずかしいのは、その登場場面がさまざまであり、状況に応じて対処すべき問題が異なるから

である。ビッグデータは資産(誰が所有者か)とみなされることもあれば、共通にプールされているリソ

ース(誰がどのような原則で管理するか)とみなされることあり、さらにはアイデンティティ(ビッグデ

ータは我々自身であり、したがってその管理には権利に関する憲法上の問題がからんでくる)とみなされ

ることもある。

4

Zients)経済顧問やその他の政府職員が加わった。これと並行して大統領科学技術諮問

委員会は土台となっている技術に関する調査を実施した。

本調査は基本的にスコーピング(絞り込み)調査として計画され、90日間に渡って学

識経験者、産業界の代表者、プライバシーの擁護者、人権団体、法律執行機関、その他

の政府機関への聞き込みが行われた。これと併せて、大統領科学技術政策室はマサチュ

ーセッツ工科大学、ニューヨーク大学、カリフォルニア大学バークレー校との3つのカ

ンフェランスを組織した。大統領科学技術政策室は「情報提供依頼書」(Request for

Information)を発行し、ビッグデータとプライバシーに関するパブリックコメントを求

めた。その結果、70を超える回答が寄せられた。このほか、whiteHouse.govのプラッ

トフォームを利用して、ビッグデータのいろいろな利用やビッグデータの技術に関する

(あまり厳密でない)世論調査も行われた。「付録」には作業グループが行ったいろい

ろな活動のリストが記載されている。

ビッグデータと通常のデータの相違は何か

この章では、大統領科学技術諮問委員会(President’s Council of Advisors on Science &

Technology:PCAST)がこの調査と並行して別途に作成した報告“Big Data and Privacy:

A Technological Perspective”10に依拠しつつ、ビッグデータのどこが新しいのか、どこ

が通常のデータと異なるのかを明らかにする。

3つのV: 量(Volume)、多様性(Variety)、速度(Velocity)

この調査では、量(volume)が膨大で、多様性(variety)に富んでおり、非常に速い

速度(velocity)で動くため、従来の方法では収集や分析が困難なデータに焦点を合わ

せる。ビッグデータのこうした特徴は「3つのV」としてまとめられている。データの

収集、保存、処理に要するコストの低下に加え、センサー、カメラ、地理空間やその他

の観測技術などによる新しいデータソースと合わせて、我々はほぼどこでもデータが収

集されている世界に暮らしていると言える。収集され処理されるデータの量はかつてな

いほど膨大になっている。データの爆発的増加(ウェブ対応のアプライアンス、ウェア

ラブル技術、高度なセンサーはバイタルサインからエネルギー消費、ジョギングする人

の走行速度に至るまで測定する)が高パフォーマンスのコンピューティングへの需要に

拍車をかけ、高度なデータ管理技術のパワーをさらに押し上げようとしている。

データの量が増えているだけではない。データのソースやフォーマットが多様化してい

るのである。大統領科学技術諮問委員会の報告に指摘されているように、ある種のデー

タは「デジタル生まれ」である。つまり、 初からコンピュータやデータ処理システム

10 President’s Council of Advisors on Science & Technology, Big Data and Privacy: A Technological Per-spective, The White House, May 1, 2014.

5

による利用を意図して生成されている。たとえば、電子メール、ウェブの閲覧、GPS

による位置情報である。他方、「アナログ生まれ」のデータも存在する。これは物理世

界を誕生場所とするデータであり、デジタル形式に変換できる場合が多い。アナログデ

ータの例としては、電話、カメラ、ビデオレコーダなどでキャプチャした音声やビジュ

アル情報がある。ウェアラブルデバイスによってキャプチャされた心拍数や発汗量など

の物理的活動のデータもアナログデータである11。さまざまなソースのデータを統合す

る「データフュージョン」の機能が高度化する中、ビッグデータからいくつかの注目す

べき洞察が生まれる。    

ビッグデータのソースは何か

データのソースとフォーマットはますます多様化し、複雑になっている。データソース

の一部を挙げておこう。ウェブ、ソーシャルメディア、モバイルアプリケーション、連

邦政府、州政府、地方政府の記録やデータベース、個々の商取引や公的記録を集積した

商用データベース、地理空間データ、各種調査、OCR(光学文字認識)によって電子

形式に変換したオフライン文書など。インターネット対応のデバイスが増えたことによ

り、センサーやRFIDチップなどの物理デバイスからデータを収集することが容易にな

っている。モバイルデバイスのGPSチップやCTT(cell-tower triangulation)、無線ネッ

トワークのマッピング、IPP(in-person payment)などからはパーソナル位置データが

得られる12。 データの収集と分析に要する時間も短くなり、その速度はリアルタイムに近づいている。

このため、ビッグデータの分析が個人を取り巻く環境や個人の意思決定に即座に影響を

与える可能性が高くなっている。高速データの例としては、ユーザーがウェブページに

アクセスしてどのような活動をしたかを記録するクリックストリームのデータ、リアル

タイムで位置を追跡するモバイルデバイスのGPSデータ、広く情報を共有するソーシャ

ルメディアのデータなどが挙げられる。顧客も店もデータが瞬時に分析されることを望

むようになっている。実際、電話の位置を瞬時に正確に知らせないようなら、モバイル

マッピングのアプリケーションの意味はなくなってしまう。自動車の安全運転のための

コンピュータシステムでは、リアルタイムの処理は不可欠となる。

新しい機会、新しいチャレンジ

ビッグデータの技術は以前には不可能だったやり方で巨大なデータセットを利用する。

11 「アナログ生まれ」のデータと「デジタル生まれ」のデータのこの区別は、PCAST のレポート Big Data and Privacy, p 18-22 に詳しく説明されている。 12 たとえば次を参照。Kapow Software, Intelligence by Variety - Where to Find and Access Big Data, http://www.kapowsoftware.com/resources/infographics/intelligence-by-variety-where-to-find-and-access-big-data.php; James Manyika, Michael Chui, Brad Brown, Jacques Bughin, Richard Dobbs, Charles Roxburgh, and Angela Hung Byers, Big Data: The Next Frontier for Innovation, Competition, and Productivity, McKin-sey Global Institute, 2011, http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation.

6

実際、ビッグデータは研究者たちがいままで思いもしなかったような洞察を生み出して

いる。しかし、ビッグデータがこれほどまでに高度化し、あらゆるところに浸透してい

る現在、それによって可能にするチャンスとそこから発生する社会的倫理的な問題とを

比較し、うまくバランスさせることが求められている。

ビッグデータの適用が可能にするパワーとチャンス

ビッグデータの分析は、適切に利用しさえすれば、経済成長の促進、消費者サービスや

政府サービスの改善、テロリズムの抑止と人命の救助につながる。たとえば次のような

利点が考えられる。

・ ビッグデータと成長著しい「モノのインターネット」は、産業経済と情報経済

の融合を可能にした。ジェットエンジンと配達トラックはいまではセンサーを

装備している。これらのセンサーは何百ものデータポイントをモニターし、メ

ンテナンスが必要なときには自動的にアラートを発信する13 。これによって修

理がスムーズになり、メンテナンスのコストが低下、安全性が強化されている。

・ メディケア・メディケイドサービスセンターでは予測分析ソフトウェアの使用

を開始した。このソフトウェアは補償詐欺の可能性が高いケースを判別し、請

求額が支払われる前にフラグを立てる。医療従事者はこの詐欺防止システムを

使って不正請求、浪費、濫用のリスクを見つけることができる。このシステム

によってすでに1億1500万ドルの不正支払いが防止されている。これはプログ

ラムの初年度に要した費用の各1ドルについて3ドルが節約されたことを意味

する14。

・ アフガニスタンでの戦争が も激しかったころ、国防高等研究計画局(Defense

Advanced Research Projects Agency:DARPA)はデータ専門家のチームを編

成し、戦場をビジュアルに再現しようとした。Nexus 7と呼ばれるプログラム

の中で、これらのチームは軍隊に直接に組み入れられ、データ分析ツールを駆

使して、具体的な作戦上の問題の解決を助けた。たとえば、Nexus 7のメンバ

ーは、衛星や監視装置から得たデータを組み合わせ、道路上のトラフィックの

流れをビジュアル化して、爆発物の発見とその破壊を容易にした。

13 Salesforce.com, “Collaboration helps GE Aviation bring its best inventions to life,” http://www.salesforce.com/customers/stories/ge.jsp; Armand Gatdula, “Fleet Tracking Devices will be In-stalled in 22,000 UPS Trucks to Cut Costs and Improve Driver Efficiency in 2010,” FieldLogix.com blog, July 20, 2010, http://www.fieldtechnologies.com/gps-tracking-systems-installed-in-ups-trucks-driver-efficiency. 14 The Patient Protection and Affordable Care Act provides additional resources for fraud prevention.

Cen-ters for Medicare and Medicaid Services, “Fraud Prevention Toolkit,”

http://www.cms.gov/Outreach-and-Education/Outreach/Partnerships/FraudPreventionToolkit.html.

7

・ 新生児の集中治療室のモニターから得られた何百万ものデータサンプルを分

析し、命に関わる病気に感染しそうな新生児を判別しようとするプロジェクト

も存在している。医師がベッドの巡回で見つけるには限界がある。大量のデー

タを分析すれば、体温や脈拍数の上昇などの現象が明らかになり、感染症の症

状の早期発見に役立つ。経験を積んだ医師や注意深い医師でも、この種の早期

の症状を従来の診察方法で見つけるのはむずかしい15。

ビッグデータの技術は送電網の管理に関しても大きな可能性を持っており、エネルギー

効率の向上、発展途上国の農業生産性の増加、伝染病の広がりの予測などの分野での応

用も期待されている。

干し草の山の中から1本の針を探す

コンピューティングのパワーが飛躍的に高くなった現在、「干し草の山の中から1本の

針を探す」はただ単に可能になっただけではなく、実際的な意味を持つようになった。

かつては、大規模なデータセットを検索するには、データが合理的に編成されているこ

とに加え、適切な検索のキーワードを使うことが必要だった。正しいクエリを選択しな

ければ、正しい答えは返ってこなかったのである。ビッグデータの技術によって、きち

んと編成されていないデータを含む大量のデータを集め、そこから異常値やパターンを

見つけることが可能になった。こうした発見モデルがプライバシーの脅威となるのは、

針を見つけるには干し草の山が必要になるからである。有意味な発見のためには一定の

量のデータが必要になる。

たとえば、ブロード・インスティチュート(Broad Institute)の遺伝子研究者が指摘し

ているように、特定の病気に特有の遺伝子変異を見つけるうえで遺伝子データセットの

数が十分に大きいかどうかは決定的な意味を持つ。ブロード・インスティチュートで行

われたリサーチでは、3,500のデータ数では統合失調症に関連する遺伝子変異を検出で

きなかった。データ数を10,000に増やすと微弱な関連が見出され、35,000までに増やし

たときに突然に統計的に有意味な結果が得られた。ある研究者が述べているように、「す

べてが変化する変曲点が存在する」16のである。膨大なデータ(特に遺伝子のような微

妙な個人データ)の必要性は研究にとってむずかしい問題を生み出す。この理由はさま

ざまだが、とりわけ大きいのはデータへのアクセスを制限するプライバシー関連の法律

の存在である。

巨大なデータセットからは予期しないデータの傾向や関係が見つかることがある。他方、

15 IBM, “Smarter Healthcare in Canada: Redefining Value and Success,” July 2012, http://www.ibm.com/smarterplanet/global/files/ca__en_us__health care__ca_brochure.pdf. 16 Manolis Kellis, “Importance of Access to Large Populations,” Big Data Privacy Workshop: Advancing the State of the Art in Technology and Practice, Cambridge, MA, March 3, 2014, http://web.mit.edu/bigdata-priv/ppt/ManolisKellis_PrivacyBigData_CSAIL-WH.pptx.

8

データが大きくても、その分析から得られる情報がいつも正確であるとは限らない。パ

ターンが検出されたとしても、そのパターンに意味があるかどうかは確かでない。相関

関係は因果関係と同じではない。ビッグデータのテクニックを使って見つけた相関関係

は、特定の結果や行動を予測する根拠とはならないし、個人を判断する基準ともならな

い。どのデータでも同じであるが、ビッグデータでも、解釈が重要になる。

「完全なパーソナライゼーション」の利点と問題

いろいろな種類のデータをリアルタイムで処理することにより、特定の消費者が求めて

いるメッセージ、製品、サービスを的確に提供することが可能になる。小さなデータを

寄せ集めて、個人のプロファイルを作り上げ、その個人の好みや行動を予測するのであ

る。こうした詳細な個人プロファイルとパーソナライズされた消費者市場で大きな力を

発揮し、人口の特定のグループにぴったり適した製品の提供を可能にする。たとえば、

編み物に情熱を燃やしている会計士や恐怖映画を好むホームシェフといったグループ

をターゲットとしたサービスが可能になる。

しかし、こうした「完全なパーソナライゼーション」は、価格設定、サービス、機会の

提供などにおいて微妙な(あるいは露骨な)差別を生み出すおそれがある。たとえば、

ある調査が示しているように、黒人を示唆するような名前(たとえば“Jermaine”)をウ

ェブで検索すると、白人を示唆する名前(たとえば“Geoffrey”)で検索した場合よりも、

「逮捕」という語を含む広告が表示される確率が高くなる。これは数多くの変数と意思

決定プロセスをベースとしたアルゴリズムの結果であり、どうしてこのように人種的に

偏向した表示が生じるかは調査でははっきりしなかった17。しかし、グループごとに異

なる情報を提供するこうしたやり方は、求職や住宅購入、あるいは単なる情報検索にお

いても、個人を傷つける可能性を持っている。

もうひとつの問題は、ビッグデータの技術によって人々がそれぞれの思想や文化に応じ

て相互に隔離された集団に振り分けられることである。これは「フィルターバブル」と

呼ばれる現象であり、自分たちの偏見や思い込みに反する情報に遭遇する機会が実質的

になくなってしまう18。企業はますます多くのデータを収集、処理し、個人の詳細なプ

ロファイルや好みのリストをつくりあげている。しかし、こうした企業の活動の範囲と

規模はあまり人に知られることがなく、消費者は自分たちに関するデータの収集、利用、

再利用をコントロールする力をほとんど持っていない。

非識別化(de-identification)と再識別(re-identification)

ビッグデータ分析がデータ統合などのテクニックによってさらにパワフルになる中、プ

17 Latanya Sweeney, “Discrimination in Online Ad Delivery,” 2013, http://dataprivacylab.org/projects/onlineads/1071-1.pdf. 18 ynthia Dwork and Deirdre Mulligan, “It's Not Privacy, and It's Not Fair,” 66 Stan. L. Rev. Online 35 (2013).

9

ライバシーを巡る懸念も深刻さを増している。このため、データが個人やデバイスにリ

ンクされている場合に、このリンクを解除しようとするプライバシー保護の技術も登場

している。これが個人を識別する情報の「非識別化」(de-identification)である。しか

し他方で、切り離された情報を再度統合しようとする「再識別」(re-identification)の

技術も存在する。同様に、ばらばらのデータの統合はいわゆる「モザイク効果」を生み

出す。これは、個人を識別する情報を含んでいない複数のデータセットから個人の識別

情報を推測して導出するプロセスを指す。このプロセスを通じてどの個人が何を好むか

が浮かび上がってくる。

個人のプライバシーを守る手段としてのデータの非識別化は 良の場合でも限られた

効果しか持たないというのがおおかたの技術者の見方である19。実際のところ、非識別

化が有効となるのは、再識別を行わないという個々の会社の約束によってであり、さら

にはこれを確かにするために導入されたセキュリティの方策によってである。現在実施

されている技術的ソリューションとしては、データの暗号化、個人識別情報の除去、個

人を識別できないようにするためのデータの攪乱のほか、個人プロファイルやコントロ

ールを通じて自分たちのデータがどう使われるについてユーザーにより大きな権限を

持たせることなどが挙げられる。しかし、非識別化がほんとうに有効になると、データ

の有用性が失われるだけでなく、その由来やアカウンタビリティまでもが失われてしま

う。しかも、一見したところ匿名のデータを再識別する技術が今後どのように進化する

かを予測するのはむずかしい。こうしたことから、個人が自分たちの情報とアイデンテ

ィティをどのようにコントロールできるか、複数のデータセットから導出されたデータ

に基づいた意思決定にどのように対抗できるかについては、大きな不確実性が存在する。

データの永続性

昔は、自分の個人情報を物理的にコントロールしてさえすれば、プライバシーを守るこ

とができた。文書は破棄でき、会話は忘れ去られ、記録は削除できた。しかし、デジタ

ルの世界では、キャプチャされた情報はコピー、共有、転送などによってほぼそのまま

の形でいつまでも保存される。以前は大量のデータの保存には考えられないほどのコス

トがかかったが、いまでは同じ量のデータを米粒大のチップに簡単に安価に保存できる。

この結果、データはいったん作成されれば、多くの場合いつまでも残る。そのうえ、デ

ジタルデータは多くの人々に関係しており、単一の個人によるコントロールはむずかし

い。たとえば、写真の所有者は写真撮影者だろうか、それともその写真に写っている人

だろうか。あるいはその写真を 初に投稿した人や、投稿先のサイトが所有者だろうか。

こうした新しい技術の広がりは、個人とその個人に関するデータの間の関係を根本的に

19 See PCAST report, Big Data and Privacy; Harvard Law Petrie-Flom Center, Online Symposium on the Law, Ethics & Science of Re-identification Demonstrations, http://blogs.law.harvard.edu/billofhealth/2013/05/13/online-symposium-on-the-law-ethics-science-of-re-identification-demonstrations/.

10

変える。

確かにデータはかつてないほど自由に共有され、複製されるようになった。しかし、個

人情報を入手した人々、政府、企業、あるいは友人やパートナーのネットワーク、第三

者がどのような責任を負うことになるかについては、まだ明確になっていない。技術的

な傾向ははっきりしている。個人に関するデータは今後も増え続け、他人のコントロー

ルのもとに永続化する。したがって、データを安全な状態に保つことが非常に重要にな

る。こうした理由から、2014年2月にスタートしたオバマ政権の「サイバーセキュリテ

ィフレームワーク」(Cybersecurity Framework)に代表される政府と民間の協力は、

世界のデータ資産の多くをサポートする重要なインフラストラクチャのセキュリティ

と抵抗力を確保するうえで不可欠の役割を担うと言える20。

価値を確認する

ビッグデータによって生じる問題がどのように深刻かつ重大であっても、現政権はデジ

タル経済の推進をやめるつもりはなく、イノベーションの原動力となるデータの自由な

流れをストップさせるつもりもない。技術の進歩はプライバシーをはじめとする社会的

価値をその進歩をどのように適合させるかという問題をいつも引き起こす。合衆国は、

公共の場、議会、法廷での討論を通じてこの問題に対処してきた。そしてその歴史の中

で、技術の変化に際しても憲法に保証された権利を実現してきた。

第一期のオバマ政権の当初から、現政府は、公的機関と民間の双方に呼びかけて、生産

性が向上し、生活を改善され、コミュニティが潤うようなやり方でデータのパワーを制

御しようとしてきた。その前提のもと、この調査はビッグデータの技術の力に関する調

査にとどまるものではなく、ビッグデータが米国の価値や法的枠組みにどのような問題

を投げかけるかに関する調査として実施された。ビッグデータによって消費者や市民の

環境が変容する中、米国の価値を守り、法律を進化させいくうえでの連邦政府の役割が

この報告の中心となる。

昨年、プライバシーに関する議論の焦点となったのは、政府とりわけ情報機関がどのよ

うにデータを収集、保存、利用しているか、だった。ビッグデータを利用した信号諜報

から生じる問題については1月に大統領が発表した政策ガイダンスに任せることにし、

この報告ではあまりふれない。ただし、その他の場面で政府が公共の利益のためにどの

ようにビッグデータを収集し、利用しているかはこの報告の対象となる。政府が正しく

機能するには国民の信頼が必要であり、個人データの収集と利用について政府には民間

よりも高い規範が適用される。オバマ大統領が明確に述べているように、「我々を信頼

20 President Barack Obama, International Strategy for Cyberspace, The White House, May 2011, http://www.whitehouse.gov/the-press-office/2014/02/12/launch-cybersecurity-framework.

11

してください。我々は収集したデータを悪用しない。と指導者が言うだけでは十分では

ない。」。21   

ビッグデータ利用の広がりは情報機関の枠をはるかに越えている。この報告では、

ビッグデータがからむ問題を幅広い視点から見る。個人のプライバシーは誰からも

干渉されない権利として定義することもできれば、自分のアイデンティティを自分

でコントロールする権利として定義することもできる。あるいはもっと別の定義が

存在するかもしれない。どう定義するかを問わず、ビッグデータを巡る新しい技術

は個人のプライバシーを試すだけにとどまらない。この調査で明らかになった も

深刻な問題のいくつかは、ビッグデータの分析がさまざまな種類の不公平を生み出

すこと(特に不利な立場にある集団にとって)や不可解なアルゴリズムの中で個人

の自律性を奪う不透明な意思決定環境がつくられることに関連している。 

これらは解決不可能な問題ではないが、解決のためには深く考える必要がある。ここで

歴史家メルヴィン・クランツバーグ(Melvin Kranzberg)の「技術の第一法則」を思い

起こすことが重要になる。つまり、「技術は善でもなく悪でもない。中立でもない。」

ということである22。技術は社会の利益のために利用することもできるが、個人を害す

るために利用することもできる。技術がどう進歩しようと、自分たちの基本的な価値を

守るようなやり方で新しい技術を利用できるように政策や法律を制定する力を持って

いるのは米国の国民にほかならない。

ビッグデータは世界を変えるが、個人のプライバシーの保護、公平、差別の防止といっ

た価値への米国民の信念は変わることがない。この報告は、社会の利益を促進するため

のデータの利用を奨励する。市場や既存の制度ではこうした進歩を実現できないケース

では特にそうである。しかしその一方で、米国民の核となる信念を守るうえで有効な枠

組み、構造、リサーチを支持する。

21 resident Barack Obama, Remarks on the Administration’s Review of Signals Intelligence, January 17, 2014, http://www.whitehouse.gov/the-press-office/2014/01/17/remarks-president-review-signals-intelligence. 22 Melvin Kranzberg, “Technology and History: Kranzberg's Laws," 27.3 Technology and Culture, (1986) p. 544-560.

12

II. オープンデータとプライバシーに対するオ

バマ政権のアプローチ 米国の歴史を通じ、技術はプライバーに関する法律と歩を一にして進化してきた。個人

のプライバシーを守りながらイノベーションと経済的繁栄を推進することにかけて、米

国は長らく世界をリードしている。

合衆国憲法修正第4条は「不合理な捜索および押収に対し、身体、家屋、書類および

所有物の安全を保障されるという人民の権利」を保護している。この物理的空間と

有形資産の保護から、個人の幸福と民主主義の社会にとって不可欠の個人のセキュ

リティと尊厳を守ろうとするより広い意識が生まれてくる23。米国ではプライバシ

ーを守るための法的枠組みは進化を続け、憲法、連邦、州、コモンロー(common law)

の要素を含むようになった。したがって「プライバシー」は狭い概念ではなく、自分自

身の領域へのさまざまな侵入を反映した、広い範囲の問題を含んでおり、問題が異なれ

ば保護のあり方も異なってくる。

データ収集および公益のためのデータの利用も米国では長い歴史を持つ。憲法第1条第2

節は、下院の定員を割り当てるための10年ごとの人口調査を定めている。実際には、人

口調査が単に人口を数える調査として実施されたことはなく、いつも公的目的に役立つ

より具体的な人口動態情報を得るための調査として実施されている24。

オバマ大統領の就任以来、連邦政府は政府のデータを市民、企業、新技術開発者に向け

てより多く公開するため、これまでにない大胆な措置をとってきた。2009年以降、オ

バマ政権は何万ものデータセットを公開し、その多くを政府データのポータルサイトで

あるData.govに置いている。政府データを資産とみなし、誰もがアクセスし、検索し、

利用できるようにすること、つまりは政府データをオープンにすることは、民主主義の

強化、経済的機会の増大、市民の生活の質の向上につながる。

オープンデータから価値を引き出すには、データを理解し分析するためのツールが必要

になる。データ分析、ストレージ、暗号化、サイバーセキュリティ、コンピュータの処

23 たとえば下記を参照。City of Ontario v. Quon, 560 U.S. 746, 755-56 (2010) 。(“修正第 4 条は、政府の

役人による一定の恣意的かつ侵入的な行為に対して、個人のプライバシー、尊厳、セキュリティを保証す

る。); Kyllo v. United States, 533 U.S. 27, 31 (2001) (“‘修正第 4 条の核心部分には、自分の家に引きこもり、

政府の不合理な侵入を受けないという権利がある。’”); Olmstead v. United States, 277 U.S. 438, 478 (1928) (Brandeis, J., の反対意見) (“彼らは信念、思想、感情、感覚において米国人を守ろうとした。彼は、政府に

対し、ひとりにしておかれる権利を擁護した。これは文明人がもっとも尊重する権利である”) 24 たとえば、1790 年の人口調査では軍役への適性を判別するために 16 歳以上と 16 歳以下の白人を別途

に数えた。 United States Census Bureau, “History,” https://www.census.gov/history/www/through_the_decades/index_of_questions/1790_1.html; Margo Ander-son, The American Census: A Social History, (Yale University Press, 1988).

13

理能力などの基本科学に政府が多額の投資をしているのはこのためである。

こうした投資をする一方で、オバマ政権はデータの収集、利用、共有が大きな課題を生

み出すことも認識している。連邦政府の研究開発予算は、大規模なデータセットを巡る

技術的・倫理的な問題に対処するための作業にも割り当てられている。プライバシーに

関して世界を長らくリードしている米国の歴史をふまえ、オバマ政権は2012年に消費

者のプライバシーに関して「消費者プライバシー権利章典」(Consumer Privacy Bill of

Rights)をはじめとする画期的な案を発表した25。さらに2014年には、米国の重要なイ

ンフラストラクチャのセキュリティを強化することを目的として、民間との協力のもと

に作成した「サイバーセキュリティフレームワーク」(Cybersecurity Framework)を

発表した26。

この章では、このような政府の各種イニシアティブを概観し、市民や消費者の権利を守

りながら、社会の利益のためにデータの利用するうえでどのような努力がなされている

かを見る。

オープンデータとオバマ政権

オープンデータのイニシアティブ

我々がポケットに忍ばせて持ち運んでいるスマートフォンは、政府のオープンデータを

利用して我々がいまどこにいるかを知らせてくれる。連邦政府は何十年も前に気象デー

タやGPSを誰もが自由に利用できるようにした。この結果、天気予報アプリケーション

から自動車のナビシステムに至るさまざまな新しいツールやサービスが登場した。

かつては政府が収集したデータのほとんどは収集を行った政府機関のうちにとどまっ

ていた。オバマ政権は一連のオープンデータのイニシアティブをスタートさせた。これ

らのイニシアティブによって、医療、エネルギー、天候、教育、治安、金融、開発援助

などいろいろな領域で、以前はアクセスがむずかしかった多くの貴重なデータがオープ

ンになった。オバマ大統領が2013年5月9日に署名した行政命令13642号は、連邦レベル

でのデータ管理に関して重要な新しい原則を確立した。この原則によれば、政府機関は

政府の情報を基本的にオープンにし、機械で読めるフォーマットにすると同時に、プラ

イバシー、機密性、セキュリティに配慮することになる27。データのオープン化の推進

25 President Barack Obama, Consumer Data Privacy In A Networked World: A Framework For Protecting Privacy And Promoting Innovation In The Global Digital Economy, The White House, February 2012, http://www.whitehouse.gov/sites/default/files/privacy-final.pdf. 26 National Institute of Standards & Technology, Framework for Improving Critical Infrastructure Cybersecuri-ty, February 12, 2014, http://www.nist.gov/cyberframework/upload/cybersecurity-framework-021214-final.pdf. 27 President Barack Obama, Making Open and Machine Readable the New Default for Government Infor-mation, Executive Order 13642, May 2013,

14

は大統領の「第2期マネジメントアジェンダ」(Second Term Management Agenda)

の中心的テーマでもあり、合衆国行政管理予算局(Office of Management and Budget)

は各政府機関に対して、他の機関の意思決定を容易にするためにもさらに多くの行政情

報を公開するよう指示した28。

Data.govでは、民間学生ローンに関して消費者金融保護局(Consumer Financial

Protection Bureau)に申し立てられた苦情、アーカンソー州における911番(救急電話

番号)のサービス区域など、どんな情報でも見つけることができる。Data.govを利用す

れば、政府機関や政府のプログラムに関する特別な知識がなくても、探している情報を

オープンデータから取り出すことができる。ソフトウェアの開発者なら、シンプルなツ

ールを使って、データセットに自動的にアクセスできる。

連邦政府機関は公衆からの要求に基づいてデータ公開の優先順位を設定することにな

っている。このために、各政府機関は、電子メールやウェブサイトなどのデジタルのフ

ィードバックの仕組みを用意して、広く意見を集めることを義務づけられる。ここに歴

史上初めて、各種活動家、起業家、研究者などが連邦政府とコンタクトをとり、どのデ

ータを公開すべきかについて意見を述べることができるようになったのである。フィー

ドバックをさらに促進し、公開された政府データの建設的な活用を促すために、オバマ

政権のスタッフは、コーダソン(code-a-thon)、ブレーンストーミングのワークショ

ップ(“Data Jams”)、ショーケースとなるイベント(“Datapaloozas”)をはじめ、政

府データの公開に関する各種ミーティングを立ち上げ、自ら参加している29。

2013年5月の行政命令に従い、行政管理予算局と科学技術政策局(Office of Science and

Technology Policy)は、政府機関が情報を資産として管理するための基本方針を発表し

た。ここには個人データや機密データの保護の継続も規定されている30。政府機関はデ

ータ資産を3つのアクセスレベルに分類している。「パブリック」、「制限付きパブリ

ック」、「非パブリック」がこれら3つのレベルであり、パブリックのカタログだけが

公表される。透明性を推し進めるために、政府機関は形のうえではパブリックではある

http://www.whitehouse.gov/the-press-office/2013/05/09/executive-order-making-open-and-machine-readable-new-default-government. 28 Office of Management and Budget, Guidance for Providing and Using Administrative Data for Statistical Purposes, (OMB M-144-06), February 14, 2014, http://www.whitehouse.gov/sites/default/files/omb/memoranda/2014/m-14-06.pdf. 29 これらのイベントを通じ、連邦機関は自由に利用できるようなった政府のデータソースを広く宣伝する

ことができた。オープンな政府データを利用した新しい製品やサービスの開発に向けた技術者との協力や、

新しいビジネスやイノベーティブなデータの利用を促進するための奨励策に向けた企業との協力を実現す

るとともに、オープンな政府データの新しい利用が国民の生活や国益にどのような具体的な影響を与える

かを示すことができた。 30 たとえば Open Data Policy (OMB M-13-13) では、政府機関はダウンストリームでの情報処理と転送を

サポートするようなやり方で情報を収集または作成すること、内部と外部のデータ資産インベントリを作

成すること、情報管理の責任をはっきりとさせておくことが義務づけられている。機械可読でオープンな

フォーマット、データ標準、一般的なコアと拡張可能なメタデータの使用も規定されている。

15

がまだオンライン化されていないデータセットに関する情報を外部のデータインベン

トリ(データに関する資産台帳)に納めている。

マイデータ(My Data)イニシアティブ

パブリックの政府データをよりオープンにし、機械で読めるようにすることは、現政権

のデータへのアプローチのひとつにすぎない。1974年のプライバシー法によれば、市

民は自分たちの個人情報にアクセスする権利を持つ。しかしアクセスがむずかしかった

り、安全でなかったり、役に立たないようであってはならない。米国民が自分たちの個

人データに安全にアクセスできるように、また個人データの分析に使用する民間のアプ

リケーションやサービスへのアクセスを容易になるように、2010年以降、オバマ政権

は一連のマイデータ(My Data)のイニシアティブを立ち上げた。マイデータのイニシ

アティブは以下からなる。

・ ブルーボタン(Blue Button):ブルーボタンは個人が自分の医療データに安全に

アクセスすることを可能にする。これによって、自分たちのヘルスケアやその費用

の管理が容易になる。その情報を医療サービスの提供者と共有することもできる。

2010年、合衆国退役軍人省(U.S. Department of Veterans Affairs)はブルーリボン

のイニシアティブを立ち上げ、退役軍人が自分の医療記録をダウンロードできるよ

うにした。これまでのところ、ブルーボタンを利用して個人医療情報にアクセスし

た退役軍人の数は540万人を上回る。さらに、ブルーボタンを通じて患者が医療デ

ータへアクセスできるようになっている民間の医療機関も500を上回る。今日、医

療機関、医療研究所、医薬品販売チェーン、週の検疫所などから自分のデジタル医

療情報を入手できる米国人は1億5千万人に達する。

・ ゲットトランスクリプト(Get Transcript):2014年、合衆国内国歳入庁(Internal

Revenue Service)は、ゲットトランスクリプトというツールを通じて納税者が自

分たちの過去3年間の税情報にデジタルにアクセスできるようにした。納税者はゲ

ットトランスクリプトを使って過去の税申告をダウンロードすることができる。こ

の結果、住宅ローン、学生ローン、ビジネスローンへの申し込みや税申告書の作成

が容易になる。

・ グリーンボタン(Green Button):2012年、政府は電力会社と協力してグリーン

ボタンのイニシアティブをスタートさせた。これによって、家庭や企業は電力消費

情報に簡単にアクセスできるようになる。情報は消費者にわかりやすく、コンピュ

ータでの処理が容易なフォーマットになっている。今日、5900万の世帯や企業に電

力を供給している48の会社がグリーンボタンを通じたアクセスを可能にし、エネル

ギー節約を助けている。家庭や企業は、電力消費データを入手することによって、

16

民間のどのツールやサービスがエネルギーの節約に有効かを判断しやすくなる31。

・ マイスチューデントデータ(MyStudentData):教育省は学生や学生ローンの利用

者がFree Application for Federal Student Aid(連邦学生支援のためのフリーアプリ

ケーション)から自分たちの連邦学生ローン情報にアクセスし、ダウンロードでき

るようにしている。ローン、奨学金、登録、過払いなどの情報がユーザーフレンド

リーで機械可読なプレーンテキストのファイルで用意されている。

マイデータのイニシアティブは、人々に自分たちのデータへの簡単で安全なアクセスを

提供するにとどまらず、個人データへのアクセスの強力なモデルを確立し、今後そのモ

デルを民間と公共部門の両方に普及することを目指している。個人や企業、さまざまな

機関の相互のデータのやりとりがますます増えていく中、各自の個人情報へのアクセス

は今後さらに重要になってくる。

ビッグデータのイニシアティブ:「データから知識、そしてアクションへ」

ビッグデータの核心は、データから知識、そしてアクションへとすばやく移行する能力

にある。2012年3月29日、6つの連邦政府機関が協力して「ビッグデータ研究開発イニ

シアティブ」(Big Data Research and Development Initiative)を立ち上げ、大量のデ

ジタルデータへアクセスして、そのデータを整理し、そこから新しい知識を得るための

ツールや技術の改善に向けて2億万ドル超の予算を割り当てた。

この「ビッグデータ研究開発イニシアティブ」がスタートしたあと、国防高等研究計画

局(DARPA)はその1億ドル規模のXDATAプログラムから生み出された研究資料やオ

ープンソースソフトウェアの「オープンカタログ」を作成した。XDATAプログラムは

不完全、未整理の膨大なデータを処理し、分析することを目的としている32。他方、国

立衛生研究所(National Institutes of Health)は生物医学のビッグデータをターゲット

とした5千万ドルの「ビッグデータから知識へ」(Big Data to Knowledge)プログラム

をサポートしている。国立科学財団(National Science Foundation)によるビッグデー

タ研究プロジェクトは 人間のゲノムを処理するコストを40分の1以上削減することに

成功した。エネルギー省は2千5百万ドルの「スケーラブルデータの管理、分析、ビジュ

アル化研究所」(Scalable Data Management, Analysis, and Visualization Institute)を

31 Aneesh Chopra, “Green Button: Providing Consumers with Access to Their Energy Data,” Office of Science and Technology Policy Blog, January 2012, http://www.whitehouse.gov/blog/2012/01/18/green-button-providing-consumers-access-their-energy-data. 32 2013 年 11 月、ホワイトハウスは “Data to Knowledge to Action”のイベントを組織し、政府、民間、学

界、NPO の数多くのイニシアティブを発表した。理系の大学の学生をデータ専門家へと育てること、地球

に関して NASA が収集している大量の宇宙データへのアクセスやその分析により多くの市民や起業家を参

加させることなどの取り組みは今後の飛躍的な進歩を約束している。政府はまた、教育、医療、持続可能

性、情報を知らされたうえでの意思決定、非営利の効果などの難問に積極的に取り組むデータ専門家の数

を増やす努力もしている。

17

設立して、気候データ分析のテクニックを開発し、ハリケーンの予測精度を25%アップ

させた。オバマ大統領が2013年4月に発表したBRAINイニシアティブなど、重要なビッ

グデータを対象とした研究イニシアティブはほかにも数多くある。こうしたビッグデー

タ研究イニシアティブの一環として、国立科学財団はビッグデータの社会的、倫理的、

政治的な側面を探るいくつかのプロジェクトを資金援助している。

米国のプライバシー法と海外のプライバシーフレームワーク

米国におけるプライバシー法の発展

米国のプライバシー法は社会的変化を生み出すとともに、社会的変化の影響を受けるこ

とで形づくられてもきた。産業革命をきっけとする技術革新の波はこうした社会的変化

の一例である。サミュエル・ウォーレン(Samuel Warren)とルイス・ブランダイスが

1890年に発表した『プライバシー権』(The Right to Privacy)という論文のきっかけ

となったのは、持ち運びできるカメラの登場だった。この論文の中で2人は次のように

指摘した。「 近の発明と商売のやり方は、個人を保護し、個人の....『ひとりにしてお

いてもらう権利』を保護するための次のステップへの関心を呼び起こす。いろいろな機

械や装置によって『クロゼットでのささやきが屋上から外に流される』という予言が現

実になってしまうおそれがある」33。この予言的な論文によって、20世紀におけるプラ

イバシーを巡るコモン・ローの礎が築かれ、政府や他の人からプライバシーを守る権利

が確立された34。

20世紀に入り、時間の経過と技術の進歩の中で、合衆国憲法修正第4条における「捜索」

(“search”)とは何かについて判例法が確立されてきた35。1928年、連邦 高裁判所は

「オルムステッド対合衆国の係争」(Olmstead v. United States)において「個人の家

屋の外にある電話線に盗聴器をしかけることは、たとえ政府がその家の内部で行われた

会話の内容を知ったとしても、修正第4条への違反とはならない」との見解を示した36。

しかしオルムステッド事件が有名になったのは、むしろブランダイス判事の反対意見に

よってだった。ブランダイス判事は「憲法は、政府からの干渉に対して、ひとりにして

おいてもらう権利を付与している。これはもっとも包括的な権利であり、文明人がもっ

とも好む権利である」と述べている37。

オルムステッド事件に示された裁判所の見解は、1967年の「カッツ対合衆国の係争」

33 Samuel Warren and Louis Brandeis, “The Right to Privacy,” 4 Harvard Law Review 193, 195 (1890). 34 See William Prosser, “Privacy,” 48 California Law Review 383 (1960). 35 Wayne Lafave, “Search and Seizure: A Treatise On The Fourth Amendment,” §§ 1.1–1.2 (West Publish-ing, 5th ed. 2011). 36 Olmstead v. United States, 277 U.S. 438 (1928). 37 Ibid at 478.

18

(Katz v. United States)によって覆されるまで米国の法律となっていた。カッツ事件

で裁判省が示したのは「公衆電話ボックスの外に令状なしにしかけられたFBIの録音装

置は、その装置が物理的に電話ボックス、ボックス内の人、あるいはその人の財産に侵

入していないとしても、電話ボックスを使う人の側の『プライバシーが守られるという

合理的な期待』に反する捜索となる」という見解だった。この係争では、社会が合理的

とみなした場合にはプライバシーに関する個人の主観的な期待が保護されるとなった

のである38。

民事裁判所は、市民が他の市民をプライバシーの侵害を理由として訴えることを長い間

認めていなかった。つまりプライバシーは訴因にはなりえなかったのである。「はなは

だしく重大な」プライバシーの侵害が訴訟理由として認められたのは、1934年の不法

行為法(第一)リステイトメント(Restatement (First) of Torts)においてであった39。

ほとんどの州でプライバシーは訴因として認められるようになった。ただし、単一の不

法行為が訴因となるわけではなく、訴訟のためには次の「4つの複合」の不法行為が必

要になる40。

1. 個人の隔離されたまたは孤独な状態への侵入、あるいは私事への侵入。

2. 個人に関してその個人を恥ずかしいと思うような私事を公に暴露すること。

3. 個人に虚偽の光を当てて公衆の目にさらすこと。

4. 他の人の利益になるように個人の肖像を盗用すること。41

今日、「4つの複合」は企業による個人情報の広範な収集、使用、開示から発生するプ

ライバシーの問題を十分に対応していないと批判する人もいる。他方、従来は人間が行

っていた処理が、自動的なデータ処理によって厳密なコントロールのもとに置かれるこ

とから、事実上プライバシーに関する懸念は少なくなっていると主張する人もいる42。

公正な情報取扱い原則(FIPP)

コンピューティングが進化し、政府や民間でのその利用が広がるにつれ、プライバシー

の問題をどう取り扱うかが改めて世界的な政治的課題となってきた。1973年、米国の

保健教育福祉省は「記録、コンピュータ、および市民の権利」(Records, Computers, and

38 Katz v. United States, 389 U.S. 347, 361 (1967) (Harlan, J., concurring); see also LaFave, supra note 35 § 2.1(b) (“[L]ower courts attempting to interpret and apply Katz quickly came to rely upon the Harlan elabora-tion, as ultimately did a majority of the Supreme Court.”). 39 Restatement (First) Torts § 867 (1939). 40 Prosser, supra note 34 at 389 (1960). 41 Ibid. See also Restatement (Second) Torts § 652A (1977) (Prosser’s privacy torts incorporated into the Restatement). 42 Ibid.

19

the Rights of Citizens)43というタイトルの報告書を作成した。この報告書は「個人デ

ータを自動的に処理するシステムから生じる害」を分析し、情報を使用するための一定

のセーフガードを推奨した。これらのセーフガードは一般に「公正な情報取扱い原則」

(Fair Information Practice Principles:FIPPs)と呼ばれており、今日のデータ保護の

土台となっている。

FIPPは個人データを取り扱う際の基本的な保護手段を定めており、いろいろな形で国

内法や国際合意に取り込まれている。FIPPsによれば、個人は自分に関してどのような

データが収集され、どのように利用されるかを知る権利を持つ。さらにデータのある種

の利用に異議を唱え、間違った情報を訂正する権利も持つ。情報を収集する側はデータ

の信頼性とセキュリティを維持する義務を負う。FIPPsは1974年のプライバシー法

(Privacy Act)のベースとなっている。プライバシー法は、連邦政府が記録システムに

格納されている個人情報どのように維持、収集、使用、転送すべきかを規定している44。

1970年代の後半になると、米国以外のいくつかの国でもプライバシーに関する法律が

制定された45。1980年、経済協力開発機構(Organization for Economic Cooperation and

Development:OECD)は「プライバシー保護と国境を越えた個人データの流れに関す

るガイドライン」46を発表した。FIPPsをベースとしたこのOECDのガイドラインは、

この30年間、各国の国内法、特定の分野の法律、ベストプラクティスなどにヒントを与

えてきた。1981年には、欧州理事会は「個人データの自動処理にかかわる個人の保護

のための協定」(協定108)を策定した。これはFIPPsのアプローチを欧州におけるプ

ライバシーを巡る緊急の課題に適用したものだった。

いくつかの重要な相違があるものの、米国のプライバシー保護と欧州のモデルに準じた

国のプライバシー保護はどちらもFIPPsをベースとしている。欧州のアプローチは「プ

ライバシーは基本的な人権である」という考え方に基づいており、トップダウンの規制

と分野を越えた規則を通じて、データの使用を制限し、使用の際の明示的な同意を求め

ている。これに対し、米国は分野別のアプローチを採択し、医療やクレジットなど、そ

れぞれの分野に特有のプライバシーのリスクを規制しようとしている。このため、デー

タの使用一般に適用される幅広い規則は少なく、各業界でのイノベーティブな製品やサ

ービスが可能になる。その反面、分野と分野の隙間では情報の使用が規制されないまま

に放置される可能性が出てくる。

43 See, e.g., K.A. Taipale, “Data Mining and Domestic Security: Connecting the Dots to Make Sense of Da-ta,” V The Columbia Science and Technology Review, (2003), http://papers.ssrn.com/sol3/papers.cfm?abstract_id=546782. 44 Pub. L. 93-579 (codified at 5 U.S.C. § 552a). 45 Organization for Economic Cooperation and Development, Thirty Years After The OECD Privacy Guide-lines, 2011, p. 17, http://www.oecd.org/sti/ieconomy/49710223.pdf. 46 Ibid at 27.

20

これらの分野別の法律や各種の国際合意を貫く共通の原則となっているのはFIPPsで

ある。FIPPsはアジア太平洋経済協力(Asia Pacific Economic Cooperation:APEC)が

2004年に採択したプライバシー原則に組み込まれているほか、米国と欧州連合および

米国とスイスの間に取り交わされた「セーフハーバーフレームワーク」(Safe Harbor

Frameworks)の土台ともなっている。このフレームワークは、FIPPsを巡るグローバ

ルな同意を軸として米国の法律と欧州の法律を橋渡ししている47。

米国における分野別のプライバシー法

米国では1970-80年代に、分野別の狭い範囲の法律が、不法行為をベースとしたコモン

ローに取り代わりはじめた。これらの分野別の法律は特定のタイプの組織やデータだけ

に適用されるプライバシー保護策を制定している。ごく少数の例外を除き、米国の州と

連邦政府は主として分野別のプライバシー法に依拠している48。

1970年に制定された公正信用報告法(Fair Credit Reporting Act:FCRA)は、 クレジ

ットや保険の調査、被雇用者の背景状況のチェック、テナントの審査などに使うために

消費者報告会社が収集する情報に関して、正確性と公正さを高め、プライバシーを保護

する。公正信用報告法は消費者に、自分たちのデータへアクセスして間違った情報を訂

正する権利を与えることによって消費者を保護する。消費者報告会社は作成する報告書

が正確で完全であることを期さなければならない。報告書の使用にも制限が設けられて

いる。報告書の内容に基づいて消費者に不利益な措置(たとえばクレジットの拒否)が

なされるときには、その消費者に通知することも求められる。

1996年の「医療保険の相互運用性と責任に関する法律」(Health Insurance Portability

and Accountability Act:HIPAA)は、特定の「カバーされた組織」による個人の医療デ

ータの利用と開示をターゲットとし、自分の医療データの使用を個人が理解し、コント

ロールしやすくするための基準を設定している49。HIPAAの核心となるのは「必要 小

限」の使用と開示である50。議会と保健福祉省は医療データの保護を定期的に見直して

47 APEC のプライバシー原則は 2004 年の APEC Privacy Framework と 2011 年に承認された APEC Cross Border Privacy Rules システムに関連している。See Asia-Pacific Economic Cooperation, “APEC Privacy Principles,” 2005, p. 3, http://www.apec.org/Groups/Committee-on-Trade-and-Investment/~/media/Files/Groups/ECSG/05_ecsg_privacyframewk.ashx; 米国と欧州、米国とスイスのセーフハーバーフレームワークについては Consumer Data Privacy In A Net-worked World, p 49-52; export.gov/safeharbor を参照。これらの強制力のある自己証

明プログラムは米国商務省によって管理されており、米国の組織が欧州やスイスのデータ保護法をスムー

ズに遵守できるようにするために、欧州委員会やスイス連邦データ保護情報委員との協議のうえで作成さ

れた。 48 たとえば、カリフォルニア州は州憲法でプライバシー権を設定している。Cal. Const. art. 1 § 1. 49 See U.S. Department of Health and Human Services, Health Information Privacy, “Summary of the HIPAA Privacy Rule,” http://www.hhs.gov/ocr/privacy/hipaa/understanding/summary/index.html 50 この原則によって、「カバーされた組織」は本来の目的に必要な 小限の医療情報だけを使用、開示、要

求するために妥当な努力をすることが求められる。See U.S. Department of Health & Human Services, Health Information Privacy, “Min-imum Necessary Requirement,”

21

いる。1998年の児童オンラインプライバシー保護法(Children’s Online Privacy

Protection Act:COPPA)と連邦取引委員会(Federal Trade Commission)が導入した

規則によって、13歳以下の児童を対象とするオンラインサービスあるいは児童の個人デ

ータを収集するオンラインサービスでは、親の証明可能な同意が必要になった。金融の

分野では、グラム・リーチ・ブライリー法(Gramm-Leach-Bliley Act)によって、金融

機関は顧客のプライバシーを尊重すること、顧客の非公開の個人情報のセキュリティと

機密性を守ることを義務づけられた。教育、通信、ビデオレンタル、遺伝子情報などに

関しても、それぞれの他の分野のプライバシー法が確立されている51。

消費者プライバシー権利章典

2012年2月、ホワイトハウスはConsumer Data Privacy in a Networked World: A

Framework for Protecting Privacy and Promoting Innovation in the Global Digital

Economy52(『ネットワーク化された社会における消費者データのプライバシー:グロ

ーバルなデジタル経済の中でプライバシーを守り、イノベーションを促進するためのフ

レームワーク』)という報告書を発表した。この「プライバシーブループリント」は次

の4つの要素から構成されている:「公正な情報取扱い原則」(FIPPs)をベースとす

る消費者プライバシー権利章典(Consumer Privacy Bill of Rights)、これらの原則を個々

のビジネス状況に適用するための政府主導のマルチステークホルダー(複数利害関係

者)プロセス、プライバシー権を効果的に適用するためのサポート(消費者プライバシ

ーに関する基本法の確立など)、国境を越えたデータの流れをサポートするための国際

的なプライバシー保護体制。

プライバシーブループリントの基本となる消費者プライバシー権利章典では、消費者を

保護するために以下の権利が明確に定められている。

・ 個人によるコントロール:消費者は自分に関するどのようなデータが収集され、ど

のように使用されるかをコントロールする権利を持つ。

・ 透明性:消費者はプライバシーとそれを保護する対策について理解しやすい情報を

入手する権利を持つ。

・ コンテキスト(状況)の尊重:消費者は、自分がデータを提供したコンテキスト(状

況)に整合するやり方で個人データが収集、使用、開示することを期待する権利を

持つ。

http://www.hhs.gov/ocr/privacy/hipaa/understanding/coveredentities/minimumnecessary.html. 51 これには次のものが含まれる: The Fair Credit Reporting Act of 1970, the Family Educational Rights and Privacy Act of 1974, the Electronic Communications Privacy Act of 1986, the Computer Fraud and Abuse Act of 1986, the Cable Communications Policy Act of 1984, the Video Privacy Protection Act of 1998, and the Genetic Information Nondiscrimination Act of 2008. 52 See Consumer Data Privacy In A Networked World, p 25.

22

・ セキュリティ:消費者は個人データが安全かつ責任あるやり方で取り扱われること

に対する権利を持つ。

・ アクセスと正確性:消費者は使用可能なフォーマットの個人データにアクセスし、

データの機密性およびデータが不正確な場合に消費者に不都合な結果が生じるリ

スクに応じたやり方でデータを訂正する権利を持つ。

・ 的を絞った収集:消費者は企業が収集し保管する個人データに合理的な制限を課す

る権利を持つ。

・ アカウンタビリティ:消費者は消費者プライバシー権利章典を遵守するための適切

な措置を導入している企業に個人データを取り扱わせる権利を持つ。

消費者プライバシー権利章典は、法律の専門用語をちりばめた従来のプライバシーフレ

ームワークに比べてより消費者重視になっている。たとえば、権利章典では「アクセス

と正確性」に関する権利が規定されているが、これは従来の「データの品質と完全性」

という言い回しよりも読者にとってわかりやすい。同様に、権利章典では企業はデータ

を収集したときの「コンテキスト(状況)」を尊重しなければならないとなっており、

従来の「目的に特定された」という表現はなくなった。

消費者プライバシー権利章典は「公正な情報取扱い原則」(FIPPs)に依拠しつつ、実

生活で我々を取り巻いているオンライン環境により適切に対応しようとしている。権利

章典は、融通のきかない単一の規則の集合に企業をしばりつけるのではなく、一般的な

原則を確立して、その原則の具体的な運用は企業に任せている。権利章典の「コンテキ

スト(状況)」の原則は他の6つの原則と一体になって、自分たちが予測しているとお

りにデータが収集され利用されることを消費者に保証する。コンテキスト(状況)の原

則は企業にとっても利点がある。個人データを収集したときの顧客との関係や状況に変

わりがなければ、そのデータを使って新しいサービスを開始できるからである。

インターネットの複雑さ、そのグローバルな広がり、たえまない進化からして、伸縮自

在で時宜を得た、イノベーションを容易にする政策が必要になる。この課題に応えるた

めに、「プライバシーブループリント」はすべての関係者を集めて、消費者プライバシ

ー権利章典を具体的なビジネスのコンテキストの中でどのように適用するかを定めた

任意でしかも実効性のある行動規範をとりまとめた。消費者プライバシー権利章典の背

景には、幅広い基本的な原則と具体的な行動規範を組み合わせることによって、消費者

を保護しつつイノベーションを促進することが可能になるという考え方がある。

グローバルな相互運用性を促進する

オバマ政権が消費者プライバシー権利章典を発表したころ、他の国や国際団体もそれぞ

23

れプライバシーフレームワークの見直しを開始していた。2013年、OECDはそのプライ

バシーガイドラインを見直し、FIPPsにならったプライバシー保護適用のメカニズムを

付け加えた。同じく2013年に発表されたAPECの「国境を越えたプライバシー規則のシ

ステム」(Cross Border Privacy Rules System)も大筋はOECDのガイドラインに沿っ

ている53。欧州理事会は「協定108」の見直しに着手している。安全な国際取引を促進

するには、これらのさまざまなプライバシーフレームワークの相互調整が不可欠になる。

欧州連合もデータ保護規則の改革に着手している54。欧州連合の現行のデータ保護指令

(Data Protection Directive)によると、欧州住民のデータを非欧州の国に転送するには、

転送先の国がデータを守るのに十分なプライバシー法またはメカニズムを用意してい

ることが必要になる。米国と欧州の間で取り交わされたセーフハーバーフレームワーク

はこうしたメカニズムに該当する。2014年1月、米国と欧州は、透明性、実効性、法的

確実性を通じたデータ保護の強化と取引の拡大をめざし、セーフハーバーフレームワー

クをさらに拡大するめの話し合いを始めた。米国同様に欧州でもビッグデータの技術と

コンピューティングやストレージの能力の上昇にいかに対応するかという問題が浮上

する中、この交渉はいまも続いている55。

2014年3月、連邦取引委員会(Federal Trade Commission)は欧州連合およびAPECの

スタッフと一緒に、欧州とAPECのプライベートフレームワークの要件をマッピングし

た文書を欧州とAPECが承認したことを発表した56。このマッピングにより、欧州と

APECの両方の国で事業しようとする企業は2つのフレームワークの重なっている部分

とギャップを簡単に発見できるようになる57。こうした試みによって企業が遵守すべき

義務が明らかになり、グローバルなプライバシーフレームワーク間の相互運用性の実現

に拍車がかかる。

結論

今日でもプライバシーにとっての 大のリスクは依然として「スモールデータ」にある。

53 Organization for Economic Cooperation and Development, “OECD Work on Privacy,” http://www.oecd.org/sti/ieconomy/privacy.htm. 54 European Commission, “Commission Proposes a Comprehensive Reform of the Data Protection Rules,” January 25, 2012, http://ec.europa.eu/justice/newsroom/data-protection/news/120125_en.htm. 55 See Joined Cases C-293/12 and C-594/12, Digital Rights Ireland Ltd. v. Minister for Communications, Marine and Natural Resources, et al. (Apr. 8, 2014) この中で欧州裁判所は、電子通信に適用されたデータ

保存要件を無効と判断した。要件の範囲が「私生活の尊重および個人データの保護という基本的な権利に

特別に重大なやり方で」抵触しているという根拠からである。 56 European Commission, Article 29 Data Protection Working Party, Press Release: “Promoting Cooperation on Data Transfer Systems Between Europe and the Asia-Pacific,” March 26, 2013, http://ec.europa.eu/justice/data-protection/article-29/press-material/press-release/art29_press_material/20130326_pr_apec_en.pdf. 57 Article 29 Data Protection Working Party, Opinion 02/2014 on a referential for requirements for Binding Corporate Rules, February 27, 2014, http://ec.europa.eu/justice/data-protection/article-29/documentation/opinion-recommendation/files/2014/wp212_en.pdf.

24

たとえば、個人の銀行口座情報をターゲットとしてお金を不正に引き出す攻撃である。

こうした攻撃は大量のデータ、高速なデータ処理、情報の多様性などには関係せず、ビ

ッグデータの場合のような高度な分析も必要としない。スモールデータのプライバシー

は、米国では公正な情報取扱い原則(FIPPs)、分野別の法律、法律や規則の厳格な適

用、グローバルなプライバシー保護のメカニズムによって守られている。

プライバシーの専門家、政策立案者、技術者たちの目下の関心事は、FIPPsをベースと

するフレームワークのもとで、ビッグデータをいかに効果的に管理するかである。この

報告書の残りの部分では、ビッグデータが政府や民間でどう利用されているかを探り、

続いてビッグデータが現在のプライバシーフレームワークに与える全体的な影響を考

察する。

25

III. 公的分野のデータ管理 政府は平和を維持し、食の安全を確保し、空気と水をクリーンな状態に保つ。政府が公

布する法律や規則は経済と政治の秩序を保つ。ビッグデータの技術は政府が提供するほ

ぼすべてのサービスの質を高める力を秘めている。

この章では、医療、教育、国土の安全、法の執行などで政府が自らの義務を遂行するう

えで、ビッグデータがすでにどのようにその力を発揮しているかを見る。さらに、ビッ

グデータによって生じる課題も検討する。政府は何をなすべきで、何をなすべきでない

か、技術の変化の中で市民の権利をどのようにして守るかなどは、合衆国の歴史そのも

のと同じくらい古い問題である。生まれたばかりの合衆国の法律や規範をつくる中で、

「建国の父」たちはプライベートな領域への政府の不適切な干渉を遮断するために骨を

折った。ビッグデータの多くの側面は建国の父たちを驚かすだろうが、憲法と権利章典

がムーアの法則やゼタバイトと同様に議論の中心になっていると聞いても彼らは驚き

はしないだろう。

公的分野でのビッグデータ使用の核心は、政府と個人の力の均衡に関する懸念にある。

いったん特定の目的のために個人の情報を収集すると、別の目的のためにもその情報を

利用しようとする誘惑は非常に強くなる。緊急事態のときには特にそうである。政府が

データを悪用したもっとも恥ずべきケースは第二次世界大戦にまでさかのぼる。他には

漏らさないという保証付きで収集された人口調査データが、日系米人が住んでいる地域

を特定するために使われたのである。その結果、日系米人は戦争が終わるまで収容所に

拘留された。

公益のために権力と権威を行使する際、政府は国民を保護するという責任を負う。した

がって、ビッグデータを政府がどのように利用するか、その利用をどのようにコントロ

ールし制限するかに関して注意深い考察が必要になる。チェックされなければ、ビッグ

データは国民に対する政府の力を拡大する武器となってしまう。他方、ビッグデータは

アカウンタビリティを強化し、プライバシーや国民の権利を尊重するシステムを構築す

るためにも利用できる。

ビッグデータと医療サービス

ビッグデータは長らく医療サービスの一部となっている。ここ数年、立法を通じて医療

記録の電子化を促す試みがなされてきた。これによって、医師、研究者、患者が利用で

きるデータの量が大幅に増加する。医療負担適正化法(Affordable Care Act)の成立に

より、一貫性のない孤立した個々の治療に対する支払い(「サービスに対する料金」の

モデル)から「よりよい健康」という結果をベースとした支払いへの医療費のモデルの

26

移行が始まった。これらの流れは一体となって「学習する」医療システム、つまり診療

データから有効と判断された治療法が医療サービス提供者に迅速にフィードバックさ

れるシステムを生み出す。

ビッグデータは食事療法、運動、予防ケアなどの生活習慣の要因の発見を助け、治療の

ために医師を訪れる必要を少なくする。ビッグデータの分析は、小さなサンプルや従来

方式のリサーチでは見つからない有効な臨床治療、薬の処方、公衆衛生措置を見つける

うえでも役に立つ。医療費支払いの観点からすれば、ビッグデータを利用することによ

って、患者を治療する医師の高いパフォーマンスが記録され、治療の量をベースとする

のではなく、患者の健康状態という結果をベースとする支払いが容易になる。

広がりを見せはじめている予防医学はビッグデータの究極の用途と言えよう。ビッグデ

ータのパワフルな技術は、人間の健康状態や遺伝情報の中に深く入り込み、特定の個人

がどのような病気にかかりやすいか、特定の治療に対してどのように反応するかを予想

する助けとなる。予防医学は多くの複雑な問題を引き起こす。従来、共有され分析され

る情報の対象となっている人が誰であるかを明かさないのが医療データでのプライバ

シー保護の基本だった。しかし、発病の前に、あるいは症状が現れ始めた早い段階にど

のような病気であるかを特定するために、特定のグループやカテゴリーに属する人々の

データが使われるケースが増えている。

しかし予防医学によって発見される情報は単一の個人のリスクを越え、同様の遺伝子を

持つ他の人々にも影響する。場合によっては、データ収集の対象となった人々の子供や

子孫にも関係してくる。ゲノムデータを医療データにリンクするバイオレポジトリは、

医学研究や治療の分野での個人のプライバシーを巡る重要な問題の先端に位置してい

る58。

現在医療で使われている情報をカバーしているプライバシーフレームワークは、こうし

た新しい展開に対応し、そこから派生する研究を促進するのに十分ではない。医療の向

上のためにビッグデータを利用するには、生活習慣、ゲノム、医療、金融などの複数の

種類のデータを取り入れた高度な分析モデルが必要になる。生活習慣と健康の間には強

い関連があることから、個人データと医療データの区別があいまいになっている。こう

したタイプのデータはときには相反するさまざまな連邦法や州法の対象となる。たとえ

ば、医療保険の相互運用性と責任に関する法律(Health Insurance Portability and

Accountability Act:HIPAA)、グラム・リーチ・ブライリー法(Gramm-Leach-Bliley Act)、

公正信用報告法(Fair Credit Reporting Act)、連邦取引委員会法(Federal Trade

Commission Act)などがこの問題に関係してくる。いろいろなソースのデータを組み

58 Bradley Malin and Latanya Sweeney, “How (not) to protect genomic data privacy in a distributed network: using trail re-identification to evaluate and design anonymity protection systems,” Journal of Biomedical Informatics (2004), http://www.j-biomed-inform.com/article/S1532-0464(04)00053-X.

27

合わせて使うときには、数多くの法律に従う必要があり、非常に複雑になる。このため、

医療産業でのデータの使用を専門とする特別な機関を創設して、ビッグデータの分析を

通じた医療の進歩とコストの削減を促進しようという考えが出てくる。他方、医療機関

はこれらの法律にはしばられていない他分野の多くの組織とも関係している59。この結

果、医療データのプライバシーに関する消費者の期待から反するようなやり方で、個人

の各種の医療データが多くの企業に流れたり、場合によっては州政府によって販売され

たりする。

医学は進歩しても、我々の健康に関する情報が我々の生活のプライベートな部分に属す

ることに変わりはない。ビッグデータがますますパワフルな発見を可能にする中、医療

のパートナーにも情報が流れている状況のもとで、プライバシーがどのように保護され

ているか再検討することが重要になる。医療のリーダーたちは、ソースがどこであるか

を問わず、すべての医療情報に一定のレベルのプライバシー保護を与えるための幅広い

信頼の枠組みを構築する必要を訴えている。このためには、「医療保険の相互運用性と

責任に関する法律」や「遺伝子情報差別禁止法」(Genetic Information Non-Discrimination

Act)で規定されている以外の保護を追加する必要が出てくるかもしれない。あるいは、

データの相互運用性とコンプライアンスの要件を合理化することも求められる。大統領

科学技術諮問委員会は、医療情報の技術を調べ、数多くのタイプの記録にまたがる情報

への安全なアクセスを容易にするための共通の標準とアーキテクチャが必要との結論

に達した60。

医療データのプライバシーフレームワークを現代化するには、医療サービスや保険を国

民に提供している多くの関係者の間での慎重な交渉が必要になるが、そこから生じる経

済や医療の分野での利益を考えれば、努力してみる価値は十分にある。

学ぶことに関して学ぶ:ビッグデータと教育

K-12(幼稚園から高校まで)のレベルでも大学のレベルでも、今日の教育では教室の内

外でさまざまな技術が利用され、学習プロセスを助けている。今では教材へのアクセス、

教育ビデオの鑑賞、クラス活動へのコメント、共同研究、宿題などがオンラインで行わ

れている。

技術をベースとする教育ツールやプラットフォームは、生徒と教師の両方に新しい重要

59 Latanya Sweeney(Professor of Government and Technology in Residence at Harvard University)は医

療産業における情報の流れを調べた。HIPAA の規制された組織の外でのデータの流れの図は

www.thedatamap.org に掲載されている。 60 President’s Council of Advisors on Science & Technology, Realizing the Full Potential Of Health Infor-mation Technology to Improve Health Care for Americans: The Path Forward, The White House, December 2010, http://www.whitehouse.gov/sites/default/files/microsites/ostp/pcast-health-it-report.pdf.

28

な能力を与える。わずか数世代の進化を経て、これらのツールは生徒の学習ペースをリ

アルタイムで判断して適切な教材を提示できるようになった。より幅広い聴講生に対応

するためのツールの拡張、コース内容の不断の改良、生徒の側からの授業への参加の強

化なども可能である61。

新しいタイプのデータは、教育のパーソナライゼーションにとどまらず、「学習」に関

する学習を大きく前進させた。「大規模オープンオンラインコース」(massive open

online course:MOOC)や他の技術ベースの学習プラットフォームでの生徒の経験から

引き出したデータを詳細に追跡することにより、従来の教育研究に比べて、生徒の学習

曲線をより正確に、より大きなスケールで理解するためのドアが開かれる。生徒の学習

活動へのアクセスを把握し、いろいろな学習目的を達成するための 適の期間を知り、

別の学習方法に向けた教材選択の経路を発見することも可能になる。こうした情報を利

用し、同じような困難に遭遇している生徒を救う道も開ける。教育省はすでにこうした

技術の利用法を探っており、「国家教育技術計画」(National Education Technology Plan)

でオンライン教育のデータを集め、この種の研究の方法論を確立するために仮想学習実

験所(Virtual Learning Lab)の計画を作成している62。

テクノロジーが教室の奥深くまで入っているにつれ、教育現場でのビッグデータ革命か

ら生徒のプライバシーをどう守るという問題が出てくる。教育は伝統的に州や地方のコ

ミュニティの領域だったが、オンラインの学習ツールやオンライン講座をサポートする

ソフトウェアの多くは営利企業によって提供されている。ここから、オンラインの教育

プラットフォームから出てくるデータストリームを誰が所有し、どのように利用できる

かという複雑な問題が発生する。「家族教育権とプライバシーの法律」(Family

Educational Rights and Privacy Act)、「生徒の権利保護修正法」(Protection of Pupil

Rights Amendment)、「児童のオンラインプライバシー保護法」(Children’s Online

Privacy Protection Act)などに定められたプライバシーのセーフガードを教育記録に適

用することは困難な課題を生み出す。

ビッグデータの時代に子供のプライバシーを守る

今日の子供は字を読めるように前からデジタル機器にふれた 初の世代である。米国で

は、子供や十代の若者はモバイルアプリケーションやソーシャルメディアプラットフォ

ームの熱心なユーザーとなっている。こうしたテクノロジーを利用する中で、子供たち

61 President’s Council of Advisors on Science & Technology, Harnessing Technology for Higher Education, The White House, December 2013, http://www.whitehouse.gov/sites/default/files/microsites/ostp/PCAST/pcast_edit_dec-2013.pdf. 62 Department of Education, Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics: An Issue Brief, October 2012, http://www.ed.gov/edblogs/technology/files/2012/03/edm-la-brief.pdf. For information about the National Education technology plan, see www.tech.ed.gov/netp.

29

に関する詳細なデータ(センシティブデータを含む)がオンラインに蓄積され、処理さ

れる。この種のデータは子供たちの学習を大きく促進し、新しい機会を切り開く可能性

を持っている。反面、子供たちが成人になったときの消費者プロファイルの作成にデー

タが利用されたり、別の形で子供たちの将来に問題が生じるおそれもある。平均的に見

て若者は成人と同じように、あるいは成人以上に企業や政府によるデータの利用に気づ

いている。にもかかわらず、若者は親、教師、大学の管理者、新兵募集担当官、ケース

ワーカーなどの監視の目にさらされている。里子やホームレスの若者など、弱い立場の

子供はデータの悪用や「なりすまし」などの被害に遭いやすい。厳重な監視のもと、若

者はある程度のプライバシーを確保しようと、いろいろな方法を試みている。たとえば、

コンテンツ自体へのアクセスを自分で制限することはできないにしても、特定の友人だ

けにわかるやり方で情報を共有しようとする63。

若者はまさに若者であるということから、安全にかつ若いときのミスが将来までつきま

とうという心配なしに、いろいろなことを探り、安全に実験するための自由を必要とす

る。「児童オンラインプライバシー保護法」(Children’s Online Privacy Protection Act)

は、ウェブサイトの運営者やプリケーションの開発者に対し、13歳以下の児童から個

人情報を収集する際には事前に親または保護者の同意を得るよう求めている。子供たち

に対する害が存在するかどうか、存在するとすればどのような害か、テクノロジーとと

もに成長することがマイナスではなくプラスになるようにするにはどのような政策の

フレームワークが必要かについてはまだ社会的な合意は形成されていない。

医療の場合と同様、ユーザーがデジタル教育プラットフォームを利用することから、特

定のタイプの学習への適性や他の生徒や学生と比較した場合の成績など、非常に個人的

な情報が明らかになることがある。学習障害があるかどうか、長時間集中することがで

きるかどうかなどを判別することもできる。どの時間帯に何時間くらいオンラインツー

ルにログインしているかがわかれば、その生徒の生活習慣を推測できる。こうしたデー

タを利用して生徒の学習機会を改善するには教育機関はどうすればよいか。これらのプ

ラットフォームを利用する子供や若者、特にK-12(幼稚園から高校まで)の生徒は、自

分たちのデータが安全に保護されていることをどうすれば確信できるのか。

データの所有権と適切な利用という複雑な問題に答えるために、教育省は2014年2月、

オンライン教育サービスのためのガイドラインを発表した64。このガイドラインによれ

ば、学校と学区(district)が生徒のデータに関係する第三者と契約を結ぶには、「家族

63 danah boyd, It’s Complicated: The Social Lives of Networked Teens, (Yale University Press, 2014), www.danah.org/books/ItsComplicated.pdf. 64 Department of Education, Protecting Student Privacy While Using Online Educational Services: Require-ment and Best Practices, February 2014, http://ptac.ed.gov/sites/default/files/Student%20Privacy%20and%20Online%20Educational%20Services%20%28February%202014%29.pdf.

30

教育権とプライバシーの法律」(Family Educational Rights and Privacy Act)と「生徒

の権利保護修正法」(Pupil Rights Amendment)に定めてある要件を満たすことが前提

となる。子供たちが利用できるオンラインの学習ツールとサービスが増えるにつれ、州

政府と地方政府はこれらの問題も注意深く監視している65。学校と学区は正当な教育上

の目的のために安全に保護された生徒情報だけを共有でき、さらにその情報への「直接

のコントロール」を維持しなければならない。この新しいガイダンスの登場をもってし

ても、ビッグデータの世界の中で子供のプライバシーを守るには何がベストかという問

いに答えが出たわけではない。

政府はこの答えを積極的に求め続け、教育省を通じて、ビッグデータによる脅威から生

徒や学生を守り、かつビッグデータのイノベーションを学習に活かすように努力してい

る66。教育省アーン・ダンカン(Arne Duncan)長官が述べているように、「生徒や学

生のデータは、どこに保存するにしても、他に漏洩しないように、貴重品として扱わな

ければならない。データは商品でない」のである67。つまり、生徒や学生の個人情報や

オンライン活動を不適切な使用から守る必要がある。教育というコンテキストで収集さ

れた情報についてはとりわけこのことが重要になる。

ビッグデータと国土安全保障省

飛行機で合衆国に入っている乗客と合衆国国内を飛行機で移動する乗客の数は1日200

万人に達する。陸上経由で入国する人の数は1日に百万人を上回る。これらの人の身元

を確かめ、危険な人物でないかどうかを判別するのは国土安全保障省(Department of

Homeland Security:DHS)の仕事になる。このためには膨大な量のデータを数秒のう

ちに処理することが必要になる。国土安全保障省の仕事は「干し草の山の中で1本の針

を探す」にとどまらず、「数多くの干し草の山の中でもっとも危険な1本の針を探す」

ことになる。これはビッグデータに問われている古典的な問題と言える。

国土安全保障省(DHS)が収集したデータの効率的で適法な利用は大きな課題である。

65 たとえば、カリフォルニア州は 近、一定のオンラインサービスについて、マーケッティングを目的と

して未成年者の活動に関する情報を収集すること、あるいは未成年者にオンライン広告を表示すること禁

止する法律を制定した。この法律は、未成年者がウェブサイトまたはサービスに投稿した情報を削除する

ことも求めている。このため、この法律は「削除法」と呼ばれている。 66 教育省はいろいろなコンテキストでのデータのイノベーションと利用を探っている。アプリケーション

プログラミングインターフェイス(API)を通じて教育データをより広く活用することもこうした取り組み

のひとつである。See David Soo, “How can the Department of Education Increase Innovation, Transparency and Access to Data?,” Department of Education Blog, http://www.ed.gov/blog/2014/04/how-can-the-department-of-education-increase-innovation-transparency-and-access-to-data/. 67 Department of Education, Technology in Education: Privacy and Progress, Remarks of U.S. Secretary of Education Arne Duncan at the Common Sense Media Privacy Zone Conference, February 24, 2014, https://www.ed.gov/news/speeches/technology-education-privacy-and-progress.

31

DHSは9/11事件を受け22の政府機関を集めて創設された。今日、DHSのもとにあるデ

ータベースの多くは物理的に離れた場所に置かれている。そのうえ古いOSで動いてい

るデータベースも多く、各種のセキュリティ関連の分野にまたがって情報を統合するこ

とがむずかしい。そのうえDHSは多種多様なミッションを抱えており、そのぞれぞれが

異なる法律に従う。いずれの場合も、情報は承認された目的のためにのみ、米国民およ

び合衆国に入国する外国人あるいは合衆国に居住する外国人のプライバシーと市民的

自由を守るやり方で利用されなければならない。情報の適正な使用を監督するのは、

DHS本省にある6つのオフィスである。

2012年の初頭、DHSの 高情報責任者(Chief Information Officer:CIO)、政策局の代

表者、諜報局の代表者、プライバシー担当オフィサー、市民的権利担当オフィサー、法

律監視オフィサーが一堂に会し、「ネプチューン」(Neptune)と「ケルベロス」(Cerberus)

というパイロットプラグラムを通じて 初の全省規模のビッグデータフレームワーク

の作成に着手した68。ネプチューンは非機密扱いの情報がいろいろなソースから流れ込

む「データの湖」としてつくられた69。ネプチューンには数多くのセーフガードが組み

込まれている。たとえば、複数のデータタグを適用できるほか、どのユーザーがどの情

報にどの目的でアクセスできるかを判別する詳細な規則が定めてある。データにはすべ

て厳密なスキームに従ったタグが付いている。データの使用を定めた規則は、承認され

た目的やミッションのための使用かどうか、「知る必要」があるのかどうか、ユーザー

は適切なジョブを割り当てられているのか、ユーザーの身元は証明されているのかなど

を中心とする。このようにデータのタグをユーザー属性やコンテキストと組み合わせる

ことにより、どの情報がどこで誰によって使用されるかをコントロールできる。

68 Department of Homeland Security, Privacy Impact Assessment for the Neptune Pilot, September 2013, http://www.dhs.gov/sites/default/files/publications/privacy-pia-dhs-wide-neptune-09252013.pdf; “Privacy Impact Assessment for the Cerberus Pilot,” November 22, 2013, http://www.dhs.gov/sites/default/files/publications/privacy-pia-dhs-cerberus-nov2013.pdf. 69 第一段階ではそれぞれ別の機関の 3 つのデータベースがネプチューンに入れて、データにタグを付けた

うえ保存した。国土安全保障省は機密情報を扱うケルベロスにこのタグ付けされたデータを送った。これ

によって、DHS は非機密情報と機密情報を比較できるようになった。

32

データ管理のモデル

ビッグデータのパイロットプログラムに向けた情報へのタグ付けの標準を作成するた

め、国土安全保障省はデータシステムのオーナー(データスチュアートと呼ばれる)と

プライバシー、市民的権利、法的監視のそれぞれのオフィサーを集めた。このグループ

は、データベースの各フィールドについてその属性をチャートし、いろいろなユーザー

コミュニティにどのようにアクセスを許可するかを定めた。この情報をエンコードする

ためのタグのセットを作成したあと、グループは特定の使用制限や法律または規制の対

象となる特別なケースを考慮するのに必要な追加の規則や保護策を検討した。タグ付け

によって、厳密なアクセスコントロールが可能になるとともに、ソースデータとのリン

クおよびデータ収集のそもそもの目的の保存が可能になる。この結果、データがどのよ

うな権限でどこへ行き、どこから来るかを管理する一連の規則ができあがる。

各データベースのフィールドは、「コアとなる人物データ」(名前、生年月日、市民権

など)、「拡張された人物データ」(住所、電話番号、メールアドレスなど)、および

「詳細な遭遇データ」(DHSとの電子的手段でのやりとりあるいは実際の遭遇から出

てきたデータ)の3つのカテゴリに分類される。 もセンシティブなものは遭遇データ

である。遭遇データには、警察が特定の人物を取り調べたときの観察データやその人物

が米国のセキュリティにとってどのような脅威となっているかについての情報が入っ

ている。これらのデータタグを通じて、誰がどの情報にどのような理由でアクセスでき

るかを決める厳密な規則が作成される。これら2つのパイロットプログラムでは、アク

セスを決定するための規則の大半は、DHSのさまざまなユーザーコミュニティを通じ

て一貫している。たとえば、多くのユーザーは、自分たちのミッションを遂行するうえ

で、特定のデータセットに入っているコアの人物データへのアクセスを必要とする。し

かし、規則のいくつかでは、使用の制限を考慮した詳細なカスタマイズが行われる

ネプチューンとケルベロスのパイロットプログラムでは、ユーザーが実行できるサーチ

のタイプについても重要なコントロールが設定されている。基本捜査の係官は基本的な

人物情報を確認するために特定の人物をサーチするだけですむかもしれない。しかし、

入国審査や税関の捜査官の場合は、犯罪捜査のために人物の特徴を調査する必要も出て

くるだろう。DHSのインテリジェンス分析担当者の場合は、米国への脅威に関連する情

報を分析する際に、アイデンティティ、特徴、傾向をサーチすることもあろう。システ

ム管理者がシステムに入っているデータにアクセスする必要はない。データベースのア

ーキテクチャによって、システム管理者は個々のレコードにアクセスしなくてもITシス

テム全体をメンテナンスできるようになっている。

これらのパイロットプログラムで開発された機能は、DHSが2002年に継承したデータ

ベースの機能をはるかに越えている。これらのビッグデータのパイロットプログラムが

33

始まる前は、いろいろな部署にあう複数のデータベースにまたがるサーチは容易でなか

った。複数のデータベースからのデータの統合がむずかしかったことは言うまでもない。

かつては、システム管理者がユーザーにユーザー名とパスワードを与え、全面的なアク

セスを許していた。ユーザーのアクセスを監視して追跡することもいつも行われていた

わけではない。今ではDHSはミッションでの必要性に応じてより厳密なアクセス権を与

えることができる。 も重要なのは、高度なレポジトリに入っているデータを注意深く

編成し、タグ付けすることにより、法律を遵守し、サーチ活動をしっかりと監視しなが

ら、新しいタイプの予測と異常分析を実行できるようになったことである。

DHSがデータを扱うこのように慎重なシステムを構築できたのは偶然ではない。DHS

にはプライバシーを専門に扱うオフィスと市民的権利と自由を専門に扱うオフィスが

設けられている。どちらのオフィスも複雑な問題を処理するための専門家からなる70。

各パイロットプログラムには詳細なプライバシー影響評価が用意され、プログラムの実

行に先立って公表される。DHSはパイロットプログラムについて公開説明会(パブリッ

クブリーフィング)を開き、一般からの質問を受け付けた。プライバシーと市民的自由

のオフィサーはパイロットプログラムのプランを承認しただけではなく、将来の機能の

拡張に向けて組み込まれるツールやウィジェットについても同意した。これらはすべて、

プライバシーと市民的自由を 初から考慮に入れて、DHSのミッションを促進していく

助けとなる。

法律執行においてプライバシーの価値を守る

ビッグデータは、法律の執行においても強力なツールになる。 近では、国防高等研究

計画局(DARPA)のMemexプログラムが開発した高度なウェブツールのおかげで、連

邦法律執行機関による人身売買網の摘発に大きな前進が見られた。この種のツールは、

我々におなじみの「表層ウェブ」(surface web)だけでなく、公開されている情報の

うち、通常の検索エンジンでは検索できない「深層ウェブ」も徹底的に探す。多種多様

なウェブサイトを検索できることから、こうしたツールは通常の方法では見つけるのが

むずかしかったり、時間がかかったりする多分野にわたる情報を見つけることができる。

人身売買の可能性のある組織を見つけたら、法律執行機関の既存のデータベースと照ら

し合わせ、警察官は売春やその他の不法行為との関連を探ることができる。既に、この

種のツールは、アジアを発祥地とし、米国のいつかの都市にまで進出していた人身売買

網の摘発に貢献している。これは、ビッグデータが、世の中で も弱い立場の人たちの

保護に役立つことの力強い例である。

70 詳細については次を参照。Department of Homeland Security’s Privacy Office website, http://www.dhs.gov/privacy, and Office for Civil Rights and Civil Liberties, http://www.dhs.gov/office-civil-rights-and-civil-liberties.

34

ビッグデータの技術は、我々の安全を守っている法律執行機関やその他の機関に効果的

なツールを提供する。しかし、ビッグデータの適切な利用はむずかしい問題を投げかけ

ることにもなる。複数のデータソースを組み合わせれば、被疑者の犯行時の活動がより

鮮明になるだけでなく、特定の個人を精査して被疑者のプロファイルを作成することも

容易になる。パターン分析は犯罪組織の構成を暴露するほか、将来の犯罪の可能性を予

測するうえでも役に立つ。幅広いデータセットを収集することで、犯罪者の逮捕が容易

になるだけでなく、捜査対象ではない人に関する詳細な個人情報を集めることができる。

法律の執行にあたってビッグデータの技術を利用する際には、治安を守ることや公平に

法律を適用することだけでなく、人々の市民的自由やプライバシーの正当な要求も考慮

しなければならない。

国の安全がかかっている場合には、ビッグデータの利用もおのずから異なってくる。テ

ロリストのネットワークの摘発、攻撃が切迫していることの警告、大量破壊兵器の拡散

を防止するために、グローバルデータを利用する強力なインテリジェンスシステムは、

犯罪の発生率が高い地域により多くの警察の力を割り振ろうとしている法律執行機関

のシステムとは、法務当局や監督が異なり、プライバシーの保護も異なる。しかし、目

的が異なるとしても、法律執行とインテリジェンスのどちらでも、プライバシーと人権

をどう守るかについては重要な類似性がある。どちらの場合も、プライバシーと法律を

担当するオフィサーがシステムの使用を承認しなければならない。どちらでも、多くの

場合、保管する情報量を減らすために「 小化の規則」が適用され、アクセス制御する

ためにデータにタグ付けする技術が利用されている。

新しいツールと新しいチャレンジ

新しい技術の使用、特に法律執行の場での使用は、重要な憲法解釈の問題を引き起こし

てきた71。2013年の 高裁判所で争われた、警察が裁判所の令状なしに被疑者の車に

GPSトラッカーを取り付けた事件に関してアリート(Alito) 高裁判事は次のように述

べている。「この事件で起こった同様のことを18世紀の状況の中で考えるのはほとんど

不可能である。警官が馬車のどこかに身を潜ませて、馬車のオーナーの動きを観察する

ために長時間そこにとどまっていることなど想像できるだろうか。」72 アリート判事

はこう続ける。「1791年にもこの種のことが生じたかもしれない。しかし、そのため

には巨大な馬車と非常に小さい警官が必要だっただろう。」73

「非常に小さい警官」の意味は深い。GPSトラッカー、CCTV、見つけることができな

71 今のところ、本報告書で定義されている「ビッグデータの技術」をその全体において考慮している法解

釈は少ない。考慮されているは、ビッグデータの利用で大きな役割をはたしている GPS トラッカーなどの

先進技術である。 72 United States v. Jones, 132 S.Ct. 945, 958 (2012) (Alito, J., concurring). 73 Ibid at n.3.

35

いほど小さいセンサーなど、いたるところに設置された監視装置は、プライバシーへの

合理的な期待や法律執行のための技術の適正な使用と限界などに関連して、今後ますま

す訴訟の種になるものと思われる。

ここ数十年の間に、監視装置のコストは急速に低下し、そのサイズも格段に小さくなっ

ている。この結果、米国の70以上の都市で、発砲音を正確に聞き分けるオーディオセン

サーが設置され、犯罪の発生が疑われる場所に即座に警官を派遣することが可能になっ

ている74。アクセスのスピードがアップし、ストレージのコストが低下する中、地方の

警察署でさえ、ナンバープレートやその他の車両情報を全市規模でリアルタイムに収集、

保存し、あとで利用するといったことが可能になっている75。

こうした技術がもたらす恩恵は巨大である。行方不明者の捜索から大がかりな追跡まで、

連邦、州、地方政府、法律執行機関による高度な監視技術の利用は、犯罪に対してより

すばやく、より効果的な対応を可能にしている。オンライン犯罪に対しても、信頼でき

る裁きを与えるチャンスが大きくなる。オンラインの犯罪者は新しい技術を利用するこ

とにかけては誰よりも早いことから、法律執行機関にはデジタル証拠に遅滞なくアクセ

スすることが求められる。

監視に加えて、犯罪予防技術も法律執行機関によって利用されている。これは犯罪を予

想し、介入し、防止するための技術である。ロサンゼルスとメンフィスの警察署で使わ

れているプログラムのような分析ソフトウェアは、予測分析によって地理的な「ホット

スポット」を検出する76。多くの都市での経験が示しているように、「ホットスポット」

のパトロールを強化すれば、窃盗や強盗などの財産犯罪が著しく減少する。

是か否が問われるところではあるが、予測分析はいまでは特定の人が犯罪を犯す傾向を

持っているかどうかを分析するのにも使われている77。ギャングに関連する殺人の蔓延

に対応するために、シカゴ市は予測警備の焦点を地域から人(アイデンティティ)にシ

フトする試みを実行した。警察やその他のデータを利用し、ソーシャルネットワークを

分析することにより、シカゴの警察署は暴力的な犯罪につながりそうな要因を抱えてい

るおよそ400人のリストを作成した。この結果、警察は公的な記録に残されている逮捕

74 米国の 70 以上の都市で、SST Solutions が開発し ShotSpotter と呼ばれている銃声検知技術が使われて

いる。詳しくは www.shotspotter.com を参照。 75 International Association of Chiefs of Police, Privacy Impact Assessment Report for the Utilization of Li-cense Plate Readers, September 2009, http://www.theiacp.org/Portals/0/pdfs/LPR_Privacy_Impact_Assessment.pdf. 76 司法省の研究開発機関である National Institute of Justice は、法律執行機関による予測警備の使用に関す

る詳細な情報を提供している。詳しくは www.nij.gov/topics/law-enforcement/strategies/predictive-policingを参照。 77 Andree G. Ferguson, “Big Data and Predictive Reasonable Suspicion,” 163 University of Pennsylvania Law Review, April 2014, http://ssrn.com/abstract=2394683.

36

歴や有罪歴以外に、一定の要因を抱えている特定の個人に対する警戒を強めた78。

予測分析は犯罪捜査の他の領域でも使われている。フィラデルフィアの警察は、仮釈放

された人のうち誰が再度犯罪に手を染める可能性が高いかを分析するソフトウェアを

使い、その人に対する監視を強化している79。このソフトウェアは、年齢、犯罪歴、地

理的位置など、20数種類の変数を使っている。

これらの新しい技術については、いつどのように利用すべきかについて議論がたえない80。この技術は警察やその他の公的なリソースをより正確に割り振ることを可能するこ

とで、有害な犯罪の防止を助ける。しかし、合衆国の憲法と権利章典は、減じてはなら

ない一定の権利を保障している。

犯罪傾向を予測し、それに応じて事前に警察力を割り振るために警察が一連の新しいデ

ータやアルゴリズムを使用することは重要な結果をもたらす。ここで必要なのは、監視

と捜索に関して憲法の一部となっている「個人を特定した容疑」(individualized

suspicion)81を慎重に検討することである。権力の遍在、さらには「自分の活動、動き、

団体との結びつきなどが法律執行機関によって監視されている」という根拠ある思い込

みは、言論や結社の自由にゆゆしい影響を与える。次の節では、技術の変化によって法

律の特定の領域の中に生じるあつれきを論じる。

ビッグデータの技術がプライバシー法にとって持つ意味

第三者が所有するデータへのアクセス

個人的な文書や記録は、家に保存される紙の形から、家のコンピュータのハードディス

クに保存される電子ファイルへと進化した。さらにいまでは、いろいろな種類のコンピ

ュータファイルとなり、ローカルだけでなくクラウドにも保存され、家の内や外の数多

78 この予測警備技術の利用は National Institute of Justice と Chicago Police Department からの一連の許可

によって可能になった。 近のものには技術捜査官の Miles Wernick が関連している。詳しくは

http://www.nij.gov/topics/law-enforcement/strategies/predictive-policing/Pages/research.aspx を参照。 79 統計手法を使った政府の犯罪予測については次を参照。Eric Holder, Mary Lou Leary, and Greg Ridgeway, “Predicting Recidivism Risk: New Tool in Philadelphia Shows Great Prom-ise,” National Criminal Justice Reference Service, February 2013, https://ncjrs.gov/pdffiles1/nij/240695.pdf. 80 シカゴのパイロットプログラムの問題点については次を参照。Jay Stanley, “Chicago Police ‘Heat List’ Renews Old Fears About Government Flagging and Tagging,” American Civil Liberties Union, February 2014, https://www.aclu.org/blog/technology-and-liberty/chicago-police-heat-list-renews-old-fears-about-government-flagging-and; Whet Moser, The Small Social Networks at the Heart of Chicago Violence,” Chicago Magazine, December 9, 2013, http://www.chicagomag.com/city-life/December-2013/The-Small-Social-Networks-at-the-Heart-of-Chicago-Violence. 81 ビッグデータの分析は「容疑」とみなされる範囲の拡大にすぎないと論じる向きもあるが、ここで言及

しているプログラムは他の犯罪要因が見当たらない個人の仲間付き合いに大きく依存するアルゴリズムを

使っている。

37

くのデバイスからアクセスできるようになっている。リモート処理やクラウドストレー

ジの技術が、パーソンルコンピューティングやレコード管理において当たり前に利用さ

れるようになった現在、法律がこうした発展にどう対応すべきかについて考える必要が

ある。

どのような保護が必要かの判断の大部分は、個人がある行為を「プライベート」だと合

理的に期待しているかどうかによって決まる。1967年の「カッツ対合衆国事件」では

ポッター・スチュアート(Potter Stewart)判事と同じく多数の意見が次のように示し

ている。「修正第4条は『人民』を保護するものであり、『場所』を保護するものでは

ない。人が意図的に一般に公開することは、自分の家であれ、オフィスであっても、、

修正第4条の保護の対象とならない。...しかし、人がプライベートにしておきたいと思

っていることは、公共の場所だとしても、憲法上保護される。」 82

第三者と共有された情報に対して修正第4条がどのように適用されるかは、後続する2

つの 高裁判決によってさらに詳細になった。1976年の「合衆国対ミラー事件」(United

States v. Miller)で、 高裁は修正第4条は、「第三者に明らかにされ、その第三者が政

府機関に持ち込んだ情報については、たとえその情報が特定の目的のために利用され、

かつ第三者が信頼を裏切らないとの仮定のもとに明らかにされたものであったとして

も」、政府がその情報を取得することを妨げないと判断した83。この3年後、「スミス

対メリーランド事件」(Smith v. Maryland)で、 高裁は「電話をかける人は自発的に

電話会社へ電話番号を伝えているため、人がダイヤルする電話番号はプライバシーに対

する合理的な期待によっては保護されない。」と判断した。 高裁はここでも「自ら進

んで第三者に明かした情報については、プライバシーを期待できない」という一貫した

見解であることを確認したのである84。

「ミラー」(Miller)と「スミス」(Smith)の判例はしばしば 高裁の「第三者ドクト

リン」と呼ばれている。この数十年間維持されているこのドクトリンによると、電話会

社、銀行、場合によっては個人などの第三者に誰かが情報を自発的に開示した場合、政

府が第三者から令状なしにその情報を取得しても、修正第4条の個人の権利を侵害した

ことにはならない。法律執行機関はいまなおこの第三者ドクトリンをよりどころとして、

米国民の安全を守るために犯罪捜査や治安に必要な情報を取得している。連邦裁判所も、

いろいろなコンテキストの有形情報と電子情報の両方にこのドクトリンを適用してい

る。

こうした背景のもとに、米国議会と州の立法府は、一定のタイプの情報についてセーフ

ガードを追加するための法律を制定した。たとえば、連邦政府が保存している個人情報

82 Katz v. United States, 389 U.S. 347, 351-52 (1967). 83 United States v. Miller, 425 U.S. 435, 443 (1976). 84 Smith v. Maryland, 442 U.S. 735, 743-44 (1979).

38

を保護する1974年の「プライバシー法」(Privacy Act)、保存されている電子通信記

録(およびその他の情報)を保護する1986年の「電子通信プライバシー法」(Electronic

Communications Privacy Act)、電話のダイヤリング情報(およびその他の情報)を保

護する「ペン/トラップ法」(Pen/Trap Act)などである。修正第4条には第三者の手に

渡った個人情報を保護する強い権利が欠如していることから、こうした立法はその欠如

を補う法律的な手段となっている。

技術が進歩する中、とりわけ個人的なやりとりの電子的な記録が爆発的に増えている中、

第三者ドクトリンを見直すべきだと主張する人も出てきている85。2010年、第6巡回区

控訴裁判所(Sixth Circuit Court of Appeals)は「合衆国対ウォーシャク事件」(United

States v. Warshak)について、インターネットサービスの加入者は電子メールのやりと

りにおいて「手紙や電話の場合と同様の」合理的なプライバシーの期待を持っていると

し、「相当の根拠」に基づく令状なしに政府が商用インターネットサービスのプロバイ

ダから加入者の電子メールの内容の提示を強要することはできないと判断した86。 近

の 高裁判所のケースでは、ソトマイヨール(Sotomayor)判事が補足意見として、「第

三者への情報の開示の現状はデジタル時代に適していない。現状では、必須のタスクを

遂行する過程で人々は第三者に対して詳細な個人情報を開示しなければならないよう

になっている」と述べている87。

ユーザーの同意があれば別だが、令状なしで通信の電子的内容にアクセスできるという

見解を示している裁判所は我々の知る限りでは存在していないが、ウォーシャクのケー

スのあとも、第三者ドクトリンはこうした通信のメタデータに適用され続けており、若

干調整してセルサイトの位置情報やWiFi信号にも適用されている88。

ビッグデータとプライバシーに関する本報告から、政府が電子データの開示を求めるこ

85 Fred Cate and C. Ben Dutton, “Comments to the 60-Day Cybersecurity Review,” Center for Applied Cy-bersecurity Research, March 2009, http://www.whitehouse.gov/files/documents/cyber/Center%20for%20Applied%20Cybersecurity%20Research%20-%20Cybersecurity%20Comments. Cate.pdf; Randy Reitman, “Deep Dive: Updating the Electronic Communications Privacy Act,” Electronic Frontier Foundation, December 2012, https://www.eff.org/deeplinks/2012/12/deep-dive-updating-electronic-communications-privacy-act. 86 United States v. Warshak, 631 F.3d 266 (6th Cir. 2010). 87 この意見は 高裁の判決の一部ではないが、第三者ドクトリンを巡る議論の始まりを示している。United States v. Jones, 132 S.Ct. 945, 957 (2012) (Sotomayor, J., concurring). 88 第三者ドクトリンはセルサイトの位置情報に向けて調整され、何回も適用されている。 近の Fifth Circuit による In re Application of the United States for Historical Cell Site Data, 724 F.3d 600 (5th Cir. 2013) (セルサイトのデータは相当な根拠に基づく令状がなくても取得できると判断); United States v. Norris, No. 2:11-CR-00188-KJM, 2013 WL 4737197 (E.D. Cal. Sept. 3, 2013) (プライベートな無線ネットワークに侵

入した被告がそのネットワークを介した自らの送信に関してプライバシーを合理的に期待することはでき

ないと判断)。さらに、第三者ドクトリンは現代でも有効性を持っていると主張する学者もいる。たとえばProfessor Orin Kerr in Orin S. Kerr, “The Case for the Third-Party Doctrine,” 107 Mich-igan Law Review 561 (2009)、Orin S. Kerr, “Defending the Third-Party Doctrine: A Response to Epstein and Murphy,” 24 Berkeley Technology Law Journal 1229 (2009). 次も参照。United States v. Perrine, 518 F.3d 1196, 1204 (10th Cir. 2008); United States v. Forrester, 512 F.3d 500, 510 (9th Cir. 2008).

39

とから生じるプライバシー、市場の信頼、法の支配などの問題の奥の深さが明らかにな

ってきた。今後求められるのは、技術に後れをとらないように法律と政策を見直し、 リ

モートに(たとえばクラウドに)保存されているコンテンツデータの保護とホームオフ

ィスやハードディスクに保存されているコンテンツデータの保護をどう関連付けるを

検討することである。このことは電子メール、テキストメッセージ、その他の通信プラ

ットフォームについてあてはまる。この30年間、これらは個人のプライベートな通信の

重要な手段となっており、多くの場合リモートに保存されている。

データとメタデータ

平均的な米国人はいろいろな形で1日に何回も企業とやりとりする。オンラインで商品

を購入することあれば、デジタル写真をアップロードすることもあろう。こうしたやり

とりからレコード(記録)がつくられる。レコードの中には、薬品の購入などのように

非常に個人的な情報を含むものもある。通常の活動の中で、ユーザーは多くの「デジタ

ル排気」、つまりトレースデータも排出する。トレースデータとはユーザーの活動のあ

とに残る断片的な情報であり、たとえば地理座標、携帯電話の通信信号、サーバーログ

に記録されたIPアドレスなどである。ばらばらの小さなデータからでもかなりのことを

見分けることのできる強力な分析ツールの登場によって、第三者が収集し保存している

データの組み合わせと分析から個人に関するより詳細な情報が明らかになるという可

能性が生まれている。

同じように奥の深い問題は、一定のタイプのデータ、とりわけ「メタデータ」(通信や

ドキュメントの内容ではなく、通信やドキュメントそのもの関する記録)に対してもい

まよりも強力なプライバシー保護を適用すべきかどうかということである。「メタデー

タ」とはデータそのものの特性を記述する用語である。テレコミュニケーションでの典

型的な例を見てみよう。電話での通話を開始し終了する電話番号はメタデータとして通

話の内容ほどの意味を持っておらず、通話内容とは異なるプライバシー保護を適用され

てきた。しかし、ビッグデータの時代となった今日、この前提とその結果としての政策

のどちらもそれほどストレートではなくなった。

専門家の意見は分かれているが、メタデータはこれまで考えられていたよりも機密性が

高いとする議論は政策の見直しのきっかけとなるだけの説得力を持っている。情報活動

のコンテキストでは、大統領はすでに情報活動諮問会議(Intelligence Advisory Board)

に対し、問題を検討して、メタデータとプライバシーに関する現在の想定が長期的にも

有効かどうかを提言するよう指示している。本報告は、情報活動の枠を越えてこの問題

を調査すること、およびデータと情報に対して適用する法律やその他の保護策の範囲を

個人に関する情報の程度をベースとして検討することを推奨する。

商用データサービスの政府による利用

40

民間の強力なプロファイリングとデータマイニングのテクノロジーは商用目的に使わ

れるだけではない。州、地方、連邦の諸機関は、多くの種類の民間のデータベースへの

アクセス権を購入して、土地のマネジメントから各種給付金の管理に至るいろいろな公

共目的に使用している。これらのデータベースの中のデータのソースは公開されていな

い場合もある。あるいは独占的なビジネス情報として意図的に隠されている場合すらあ

る。こうしたことから、商用データサービスを政府(法律執行機関や情報機関を含む)

が利用することに対して、懸念の声を上げている法学者やプライバシーの擁護者も存在

する89。

財務省は連邦予算の支出における無駄遣い、不正、濫用を防止するプログラムに取り組

み、間違った人への支払い、間違った金額の支払い、正式な書類なしの支払いを減らそ

うとしている。このため財務省は、各種データベースをチェックして受給適格者の識別、

不正やミスの防止に役立たせる「オンストップショップ」(one-stop-shop)を連邦政

府の諸機関に用意し、“Do Not Pay”(支払うな)のポータルサイトを開設した。このポ

ータルサイトに用意されているデータベースはいまのところすべて政府のデータベー

スであるが、将来的には商用データベースも使われるかもしれない。

財務省のプログラムを支援するため、合衆国行政管理予算局(Office of Management

and Budget:OMB)はプログラムの中で個人のプライバシーを守るための詳細なガイ

ダンスを発表した90。このガイダンスは「データベースに間違った情報や古くなった情

報が入っているなど、商用データソースによってプライバシーの新しいリスクが出現し

たり、リスクが増加したりする可能性がある」ことを認めている。Do Not Payのポータ

ルサイトに商用データベースを含める場合について、ガイダンスは、公示してコメント

を求めその後30日に渡って点検してから承認するとしている。このほかの要件としては、

データベースがプログラムに適しており、プログラムにとって必要であること、データ

ベースが十分に正確であり、対象となっている個人に公平であること、憲法修正第1条

に保証されている権利を個人がどのように行使しているかを示す情報がデータベース

の中に入っていないこと(たたし、そのデータの使用が制定法によって明示的に許可さ

れている場合を除く)などがある。

商用データベースを通じて提供されるセンシティブな個人情報が増える中、このガイダ

ンスは、政府が民間のデータを使って意思決定する際のプライバシー保護に向けた重要

89 次を参照。Robert Gellman and Pam Dixon, “Data Brokers and the Federal Government: A New Front in the Battle for Privacy Opens,” World Privacy Forum Report, Oct. 30, 2013; Chris Hoofnagle, “Big Brother's Little Helpers: How Choicepoint and Other Commercial Data Brokers Collect, Process, and Package Your Data for Law Enforcement,” 29 North Carolina Journal of International Law and Commercial Regulation 595 (2003); Jon Michaels, “All the President's Spies: Private-Public Intelligence Partnerships in the War on Ter-ror,” 96 California Law Review 901 (2008). 90 Office of Management and Budget memorandum M-13-20, Protecting Privacy while Reducing Improper Payments with the Do Not Pay Initiative (Aug. 13, 2013), http://www.whitehouse.gov/sites/default/files/omb/memoranda/2013/m-13-20.pdf.

41

な一歩となる。より広い範囲のさまざまな機関やプログラムに向けてもこれと同様の

OMBガイダンスを用意する必要がある。こうしたガイダンスを通じて、データがどこ

から来ているかに関係なく、国民が政府に期待しているプライバシー保護が現実のもの

となる。

内部からの脅威と継続チェック

2013年にワシントンの海軍施設で発生した銃乱射事件では、犯人の請負業者は過去の

逮捕歴や問題行動にもかかわらずシークレットセキュリティクリアランス(secret

security clearance:セキュリティ通過許可)を所持していた。こうしたことから、公的

な信頼を必要とする職務に携わっているスタッフをもっと頻繁にチェックするという

動きに拍車がかかり、その緊急性が増した91。セキュリティクリアランスを与えられた

内部の人間によるトラブルや暴力事件はこれがはじめてではない。たとえば、チェルシ

ー・マニング(Chelsea Manning)によるウィキリークス(WikiLeaks)への情報漏洩、

ニダル・ハサン(Nidal Hasan)少佐によるフォートフッド(Fort Hood)の銃撃事件、

そして米国の情報活動史上 大の規律違反であるエドワード・スノーデン(Edward

Snowden)による国家安全保障局(NSA)の機密情報の漏洩などである。

連邦政府の職員と請負業者は、リスクのレベル、職務の機密性、センシティブな施設や

システムへのアクセスの必要性などに応じ、いろいろなレベルの審査を通過する。現在、

「トップシークレットクリアランス」を持っている職員や業者は5年ごとに、「シーク

レットクリアランス」を持っている職員や業者は10年ごとに再審査されることになって

いる。審査から審査までの機関がこのように長いと、職員に関する新しい重要な情報を

見つけるのはむずかしい。

いくつかのパイロットプログラムが示しているように、適切な政府あるいは商用のデー

タベースやソーシャルメディアへの自動的なクエリを実行することにより、規則違反や

変則性(「不名誉情報」と呼ばれる)を見つけるのが容易になる。不名誉情報が見つか

れば、該当の人物がセンシティブな職務に携わることの適切性が疑われる。たとえば、

国防省は 近、「自動継続評価システム」(Automated Continuous Evaluation System)

というパイロットプログラムをスタートさせ、3,370人の軍人、軍属、請負業者をサン

プルとして調べた。この結果、全体の21.7%に報告されていない不名誉情報が見つかっ

た。これは前回の審査から今までの間に発生した不名誉情報である。99人については、

重大な金銭的問題、家庭内暴力、薬物依存、売春容疑などが見つかり、クリアランスの

91 Department of Defense, Security From Within: A Report of the Independent Review of the Washington Navy Yard Shooting, November 2013, http://www.defense.gov/pubs/Independent-Review-of-the-WNY-Shooting-14-Nov-2013.pdf; Department of Defense, Under Secretary of Defense for Intelligence, Internal Review of the Washington Navy Yard Shooting: A Report to the Secretary of Defense, November, 2013, http://www.defense.gov/pubs/DoD-Internal-Review-of-the-WNY-Shooting-20-Nov-2013.pdf.

42

撤回や停止などの措置がとられた92。

政府は 近人材の適格性とセキュリティ慣行に関するレビューを発表し、連邦政府の全

部門での継続的なチェックを拡大するよう呼びかけた93。政府の報告書は、すべての政

府機関とすべてのセキュリティレベルで継続的チェックの慣行を採用するよう求めて

いる。ただし、こうしたプログラムで使用される情報の正確な範囲(特にソーシャルメ

ディアのソース)はまだ決まっていない。

この種の改革によって、セキュリティクリアランスを与え維持することについて今まで

とは根本的に異なるプロセスがつくり出され、セキュリティと安全性が強化される。す

べての連邦機関で継続的チェックが拡大される中、職員や請負業者のプライバシーを慎

重に考慮する必要が出てくる。クリアランスを拒否または撤回されたときに抗告するプ

ロセスには、再審査のきっかけとなった不名誉情報を拒否または訂正する権利を組み込

んでおく必要がある。継続的チェックにパワーを与えるビッグデータ分析の使用にあた

っては、社会の利益をまもることともに、社会の利益を守るために働いている人たちの

市民的自由とプライバシー権を守ることにも考慮しなければならない。

結論

公的分野でビッグデータを使うことから生じるやっかいな問題への取り組みの中で、公

共サービスの改善、経済の成長、我々のコミュニティの健康や安全の向上など、ビッグ

データの技術がもたらす大きなチャンスを見失うおそれが出てくる。こうしたチャンス

はほんものであり、ビッグデータを巡る議論の中心に置かれなければならない。

ビッグデータの巨大なパワーは、政府の活動のすべての場面でサービスをより効率的に

し、不正、無駄遣い、濫用をより高い比率で見つけ出すことができる。ビッグデータは

まったく新しい形の価値の創出にも貢献する。天候パターンに関する詳細なデータは気

候変動への科学的洞察を助ける。ビッグデータを通じてエネルギー資源や天然資源の使

用への理解を深めれば、効率の大幅なアップが可能になり、エネルギー消費が減少する。

データの移動、保存、分析は今後もより効率的になり、よりパワフルになる。たとえば、

エネルギー省は、今までにない分析ツールをつくり出すために、コンピュータのメモリ

とスーパーコンピューティングのフレームワークの開発に取り組んでいる。これによっ

てビッグデータの革命はさらに速く進行する。

政府のほぼどの部門もビッグデータを利用して市民へのサービスを改善できる。ビッグ

データ革命は、科学技術にかかわるミッションに取り組んでいる部局や機関だけでなく、

92 Ibid. 93 Performance Accountability Council, Suitability and Security Processes Review, Report to the President, February 2014, http://www.whitehouse.gov/sites/default/files/omb/reports/suitability-and-security-process-review-report.pdf

43

政府全体に関係する。おそらく今までデータ分析の幅広い利用とは無縁だった部局や機

関こそ、ビッグデータの恩恵を受ける機会がもっとも大きいだろう。

ビッグデータのパワーは連邦のレベルにとどまらない。州や自治体もビッグパワーによ

って変わる。もっとも斬新なやり方でビッグデータを使ってサービスの向上につなげて

いるのは都市や町である。都市、町、郡へ資金的技術的援助を提供する連邦の組織やプ

ログラムは、ニューヨーク市の「データ分析オフィス」(Office of Data Analytics)や

シカゴ市の「スマートデータ」プロジェクトの成功にならい、町を変身させるビッグデ

ータのパワーを 大限に利用するようでなければならない。

ビッグデータを公益に利用するには、スキルを持った人々が必要になる。こうした人々

への需要は大きいが、その供給は少ない。政府機関や非営利組織が技術的なスキルをも

った人たちをどのくらい引きつけているかを調べた 近の調査は、穏やかならない結果

を示している94。公共サービスに深い関心を示し、政府で働けるチャンスを喜んで迎え

入れている若い技術者も多く存在するが、民間が提供する条件はずっと魅力的で、技術

者はどうしても公的分野ではなく市場のビッグデータにそのスキルを応用しようとす

る傾向がある。このため、連邦政府としては、技術への投資と並んで、技術者のために

より魅力的な労働環境をつくり出し、技術の専門家を遠ざけている障害を除去する必要

がある。政府におけるビッグデータの可能性をフルに引き出すには、まさにこうした専

門家の創造力と技術的想像力が必要になる。

94 Ford and MacArthur Foundation, A Future or Failure?: The Flow of Technology Talent into Government and Civil Society, December 2013, http://www.fordfoundation.org/pdfs/news/afutureoffailure.pdf.

44

IV. 民間セクターのデータ管理 ビッグデータは、グローバル経済全体を通した重大な出来事である。今後2年間にビッ

グデータの技術とサービス市場は、急速に拡大を続けると予測される。95 この章では、

ビッグデータがどのように、消費者と企業が利用できる製品とサービスを形作るのか検

討し、消費者が自らに関する情報の収集、分析、利用について明確に把握できないとき

に生じるいくつかの課題に注目する。

オバマ政権は、民間セクターの技術革新、生産性、価値を促進させるためにビッグデー

タを利用する米国の指導的立場を支持している。しかし、ビッグデータの世界において

情報の継続的収集、移転、別目的利用は、パーソナルデータの個人によるコントロール

に関する重要な疑問と、無力な市民層の搾取に利用されるリスクも引き起こす。ビッグ

データは、経済成長と技術革新の強力な原動力になる一方で、消費者のデータを管理す

る企業と消費者の間に大きな不均衡を生む可能性を残している。

企業と消費者が受けるビッグデータの恩恵

ビッグデータは、企業と消費者の双方に価値を創出している。ビッグデータの恩恵は、

大企業と中小企業双方において、業界の範囲を超えて、データやデータ処理ツールへの

アクセスのさらなる民主化として実感できる。大企業には、ビッグデータの技術に投資

するいくつかの動機がある。それは、経営データと取引データの分析、オンラインにお

ける消費者行動への洞察の収集、極めて複雑な新製品の市場投入、会社内の機械とデバ

イスに対するより深い理解の獲得である。

テクノロジー企業はビッグデータを利用して数百万の音声サンプルを分析し、より信頼

性と精度の高い音声インタフェースを提供している。銀行は不正の検知を改善するため

にビッグデータの技術を使用している。医療サービス事業者は、患者の治療に役立てる

ためにさらに詳細なデータを活用している。製造業者では、保証管理と設備の監視を改

善するためばかりでなく、製品を市場に届けるロジスティクスの 適化にもビッグデー

タが使用されている。小売業者は、オンラインとオフライン両方における消費者との幅

広いやりとりを利用し、さらにぴったりなレコメンデ―ションと 適な価格を提供して

いる。96

消費者にとって、ビッグデータは日常生活に影響を与える製品とサービスの拡大に拍車

をかけている。ビッグデータによって、サイバーセキュリティの専門家は、膨大な量の

95 Dan Vesset and Henry Morris, Unlocking the Business Value of Big Data: Infosys BigDataEdge, IDC, 2013, http://www.infosys.com/bigdataedge/resources/Documents/unlocking-business-value.pdf 96 同上

45

ネットワークおよびアプリケーション・データを活用して異常と脅威を識別することで、

クレジットカード読取装置から送電網に至る幅広いシステムを守ることができている。97 また、米国では 29%に近い市民が銀行口座を「持っていない」かあるいは「持てな

い」でいるが、その中の一部の人は、信用度を確立する目的で、賃貸料や公共料金、携

帯電話料金、保険料、保育費、授業料の支払いといった従来とは異なる幅広い情報を使

用して、融資の資格を獲得している。98

多くのセンサーを使用するこうした新しい技術は、ネットワークに埋め込まれる。現在

の照明インフラは、音、速度、温度の他にも一酸化炭素濃度を検出でき、エネルギー効

率と公衆安全を改善するべく、駐車場や学校、公道からデータを引き出している。自動

車はさまざまな運転データと利用データを記録し報告しているため、より進んだ交通シ

ステムと安全性の改善に道を開くだろう。現在の家電製品は、いつ照明を暗くすべきか

を千マイル先から教えてくれる。これらは、政策を適合させる必要がある種類の変化で

ある。米連邦取引委員会(Federal Trade Commission)は、新しい技術が出現した際に、

消費者を保護してきたこれまでの長い歴史を踏まえて、Internet of Things から生じる政

策の問題に対処する作業をすでに開始している。

次の章では、オンライン広告業界とデータサービス業界について論じる。これらの業界

にはそれぞれ、古くから確立されている規制の枠組みの中で、巨大なデータセットを利

用してきた有意義な歴史がある。

広告が支えるエコシステム

商業的 Web の黎明期以来、オンライン広告はインターネットの発展にとって重要な要

因となってきた。ある調査は、広告が支えるインターネットは米国で数百万の雇用を維

持し、インタラクティブ・マーケティング産業が米国経済にもたらす額は毎年数十億ド

ルに上ると推定した。99ビッグデータがこの産業に根を張って繁栄することはごく自然

である。消費者の居場所、消費者が使用するデバイス、消費者が興味を示す数百ものカ

テゴリーといったますます詳細化していくデータと、強力な分析機能との組み合わせは、

広告主にさらに効率的な消費者リーチを可能にしている。高額な TV 広告や全国流通誌

の見開き広告は、正確にセグメント化されて即座に計測されるオンライン広告と比べる

と粗雑に見える。ある調査によると、広告主はターゲットを絞ったオンライン広告には

97 Centre for Information Policy Leadership, Big Data and Analytics: Seeking Foundations for Effective Privacy Guidance, February 2013, p. 3-4, http://www.hunton.com/files/Uploads/Documents/New_files/Big_Data_and_Analytics_February_2013.pdf. 98 FDIC, 2011 FDIC National Survey of Unbanked and Underbanked Households, 2012, http://www.fdic.gov/householdsurvey/2012_unbankedreport_execsumm.pdf. 99 John Deighton and Leora Kornfeld, Economic Value of the Advertising-Supported Internet Ecosystem, Interactive Advertising Bureau, 2012, http://www.iab.net/economicvalue.

46

60~200%の追加費用を支払う意思があるという。100

消費者は、非常に多くの無料コンテンツ、製品、サービスを提供する頑丈なデジタル・

エコシステムの恩恵を受けている。インターネットは全国または国際的な広告を、主要

企業ばかりでなく家族経営の店舖や新興ブランドの手にも届くようにした。その結果と

して、消費者は究極的により競争的で革新的な市場で、より幅広い企業から、より便利

で役に立つ広告を目にしている。

このエコシステムを機能させる役割を多くのプレイヤーが担っている。それは消費者や、

消費者が直接関わる企業、分析やセキュリティといったサービスを提供したり、あるい

はデータを取得し共有する事業者が含まれている。ユーザーが訪れる Web サイトのパ

ブリッシャーと、ユーザーのページ上に表示される広告に料金を支払う広告主の間には、

数え切れないほど多くの別の企業が関係している。アドネットワークとアドエクスチェ

ンジは、パブリッシャーと広告主の間のやりとりを容易にする。広告のコンテンツとキ

ャンペーンは、広告代理店あるいは 適化事業者(optimizer)、メディアプランナーに

よって制作されて配信される。広告の効果は、さらに別の専門企業によって計測されて

分析される。101

一般的に、消費者が直接関わる企業は、ニュースの Web サイト、ソーシャルメディア、

オンラインまたはオフラインの小売業者で、消費者から直接情報を収集するため「ファ

ーストパーティー」と呼ばれる。しかし、先に説明したように、幅広い多くの企業が、

ファーストパーティーに代わってデータを処理するビジネスを行っているために間接

的に情報を収集する場合や、(ほとんどの場合は統計化や非識別化した形になるが)異

なる取引関係の一部としてデータにアクセスできる場合がある。こうした「サードパー

ティー」企業には、デジタル・エコシステムの多くの「ミドルプレーヤー」や、支払い

処理を扱う金融取引会社、注文を引き受ける企業などを含んでいる。ファーストパーテ

ィーは、広告用のプロファイル開発やその他の利用のためにデータを自ら利用したり、

他の企業に転売する場合がある。ユーザーは大抵の場合、この市場の各レベルにおいて

自分がどれほどの商品価値を持つか理解していない。

消費者と透明性の課題

オンライン広告業界は 10 年以上もの間、自己規制の枠組み内で、消費者に選択肢と透

明性を提供するよう努力してきた。エコシステムの端から始まって、そこで消費者は

Web サイトのパブリッシャーと配信される広告の広告主を判別でき、プライバシーポ

100 J. Howard Beales and Jeffrey Eisenach, An Empirical Analysis Of The Value Of Information Sharing in the Market for Online Content, Navigant Economics, 2014, https://www.aboutads.info/resource/fullvalueinfostudy.pdf. 101 LUMA Partners, “Display Lumascape,” http://www.lumapartners.com/lumascapes/display-ad-techlumascape.

47

リシーと通知のその他の形態は、彼らの情報がどのように使用されるかを消費者に知ら

せている。企業はこの自主規制の体制下において、ユーザーの好みを推測するために

様々な Web サイトをまたがってユーザーの行動に関する情報を収集する「行動ターゲ

ティング(behavioral)」広告あるいはネットワーク型の(multi-site)広告に関わるときの

基本原則に同意している。こうした原則には、個人データの収集慣行に関するユーザー

への通知、いくつかのトラッキング形態からオプトアウトできる選択肢のユーザーへの

提供、子供の情報あるいは医療、金融データといったセンシティブ情報の使用制限、デ

ータの削除や非識別化といった要件が含まれている。

オンラインの透明性とプライバシーの選択を改善するテクノロジーは、発展のペースが

遅く、また多くの理由から消費者の間に広まっていない。たとえば、広告主とアドネッ

トワーク事業者が採用している自主規制の体制下において、多くのオンラインの行動タ

ーゲティング広告(behavioral ad)には標準化されたアイコンが含まれており、ターゲ

ットを絞り込む目的で収集されている情報と、消費者がこうした収集をオプトアウトで

きるページへのリンクを示している。102 オンライン広告業界によると、このアイコン

は広告上に数十億回表示されているが、この機能を使用しているかこの意味を理解して

いるユーザーはごく少数だという。大手オンライン企業の一部が運営しているアドネッ

トワークも、ユーザーがどのように広告のターゲットになっているかわかり、またオプ

トアウトできる機能を持つ詳細なダッシュボードをユーザーに提供している。103 しか

し、これらも消費者の注意をほとんど引いていない。ユーザーがこうしたプライバシー

機能を使用しない理由については多くの説がある。そのいくつかは、大半のユーザーに

とってプライバシー・ツールは隠されているか、そこまでたどり着くことが難しすぎる

からだと主張している。104 また、ユーザーはただサービスを使用するために通り抜け

なければならない、プライバシーポリシーや設定の連続に「プライバシー疲れ」を起こ

していると主張する者もいる。105 また、多くのユーザーは無料のコンテンツ、製品、

サービスの強力なセレクションを楽しんでいるとき、パーソナライズされた広告を煩わ

しく感じることはないとも考えられる。

多くの情報源を横断した情報収集の上昇曲線と、精度を増したターゲティング広告の能

102 業界のオプトアウト・プログラムに関する情報の参照先: http://www.youradchoices.com/. 103 See Google Ads Settings at http://www.google.com/settings/ads; Yahoo! Ads Interest Manager at https://info.yahoo.com/privacy/us/yahoo/opt_out/targeting/; Microsoft at http://choice.microsoft.com/enus/opt-out. 104 参照例: Pedro Leon, Blase Ur, Richard Shay, Yang Wang, Rebecca Balebako, and Lorrie Cranor, “Why Johnny Can't Opt Out: a Usability Evaluation of Tools to Limit Online Behavioral Advertising,” Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, 2012, http://dl.acm.org/citation.cfm?doid=2207676.2207759. 105 参照例: Sarah Kidner, “Privacy Fatigue Hits Facebook: Have You Updated Your Settings?,” Which? Conversation, Oct. 18, 2011, http://conversation.which.co.uk/technology/facebook-privacy-settings-privacyfatigue/; Aleecia McDonald and Lorrie Cranor, “The Cost of Reading Privacy Policies,” 4 Information Society: A Journal of Law and Policy for the Information Society, 543, 544, 564 (2008).

48

力を考えると、消費者に対する透明性と意味ある選択への課題は深刻である。消費者が

使用するブラウザと、広告目的の Web ページのサーバーの間を流れるデータを、消費

者がもっとよく管理できるような比較的ストレートな技術的手段-ブラウザの「Do Not

Track」設定として知られている-を用いることでさえ問題がある。不正(fraud)防止

機能とオンライン・セキュリティ機能は、悪意のある活動を追跡して防止するにあたっ

て同じデータ・フローに依存しているからである。

Do Not Track の課題

Do Not Track プライバシー設定の裏にあるアイデアは、消費者が自身の web 上での

活動を、サイトを横断してトラッキングされないように制限できる、使いやすいソリ

ューションを提供することにある。いくつかのブラウザは、サードパーティーのクッ

キーをデフォルトでブロックするか、許可するか消費者が選択できる Do Not Track

機能を備えている。また、トラッキングしないようにサービスに指示する信号を消費

者が送れるブラウザもある。Do Not Track 技術は確かに分かりやすいが、この技術を

使用するユーザーを受け入れる Web サイトのポリシー要件まわりのコンセンサスを

得ることは非常に難しいことがわかっている。一部の Web サイトは、Do Not Track

機能を設定している訪問者の意思を尊重することに自発的に賛成しているが、それを

認めないか、部分的にトラッキングを許可するポリシーを採用している Web サイト

もあるため、消費者の期待を混乱させ、プライバシー擁護派を苛立たせている。

W3C のワーキンググループは、科学技術者、開発者、広告業界の代表者、プライバ

シー擁護派を交えて、Do Not Track 信号の標準の草案作りに3年以上を費やした。ワ

ーキンググループは 近、Do Not Track 技術仕様の 終草案を公表した。この案は現

在 W3C の承認を待っている。

その間、EU は 2009 年の E プライバシー指令(E-Privacy Directive)を修正し、クッ

キーやその他のオンライントラッキング装置が「ユーザーが要求したサービスの提供

に厳密に必要である」場合(たとえばオンライン・ショッピングカートなど)を除き、

それらの使用にはユーザーの同意を必要とした。この指令の遵守は一様ではないが、

多くの欧州企業の Web サイトはクッキーの使用に対して一度明示的な同意を取得し

ている。しかし、このソリューションは扱いにくいと広く認識されており、指令が

初に構想したプライバシーについてユーザーに意味ある選択肢を提供していないと

一部の団体は批判している。

不完全ながら、こうした努力は、企業が個人の情報を収集し利用するやり方に対し、

個人がそれをコントロールできる技術的手段創出への関心の高まりを反映している。

データサービス・セクター

主にオンライン広告に力を入れている企業と並んで、消費者に関する情報や公的記録、

49

その他のデータセットから引き出されたより幅広いサービスを提供する関連企業もあ

る。「データサービス」セクターは「データブローカー」とも呼ばれ、多くの情報源か

らデータを収集し、総合して分析し、その情報かそこから導き出した情報を共有すると

いったビジネスを行っている。一般的に、こうした企業は情報の収集対象である消費者

と直接的な関係を持っていない。むしろ、製品のマーケティング、個人の身元確認、「人

捜し(people search)」サービス、不正の検出といったサービスを他の企業や政府機関

に提供する。一部のこうした企業は、「消費者報告機関」として特定の業務も行ってお

り、クレジット申請や保険、雇用、健康管理などを目的とする報告書を提供している。

規制の観点から大きく分けると、データサービスには3つのカテゴリーがある。

1. 公正信用報告法(Fair Credit Reporting Act)で規制されている消費者報告サー

ビス。同サービスは一般的に、異なるシステムにおいて、他のデータサービス

事業者とは別の遵守ルールのもとで収集され利用されたデータについて、デー

タを保持し、分析し、報告を行う。

2. リスク低減サービス。身元確認、不正検出、人捜し、照合サービスなど。

3. マーケティング・サービス。潜在的な消費者を識別し、広告ターゲティング情

報を高め、その他の広告に関連したサービスを行う。

公正信用報告法は、第2章で論じたように、消費者の積極的権利を規定している。信用、

保険、または雇用の適正を決定するレポートを提供する消費者報告機関は、レポートに

基づいて消費者が融資を拒否されたり信用コストが引き上げられるといった不利な行

為が行われる際は、公正信用報告法あるいは信用機会平等法(Equal Credit Opportunity

Act)に基づいて消費者に通知することが求められる。また、消費者には、自分のファ

イルの中身と信用度の評価を知り、誤った情報の修正と削除を求める権利が法律で認め

られている。106 公正信用報告法は、消費者に不利な情報を一定の期間の後に削除する

ことを信用調査機関に義務付けている。これにより、支払い遅延と財産差押えは7年後

に、破産は 10 年後に消費者のファイルから削除される。人種、性別、宗教といった特

定のタイプの情報は、信用度の確定要素に使用されてはならない。

こうした法定権利は、リスク低減サービスやマーケティング・サービスには存在しない。

データサービス会社は、消費者の身元確認に使用されている情報に消費者がアクセスし

修正するメカニズムを実際に提供している。いくつかの企業は、マーケティング・サー

ビスにおいて個人情報が使用されることに対し、消費者がオプトアウトすることを認め

ている。

106 Federal Trade Commission, “A Summary of Your Rights Under the Fair Credit Reporting Act,” http://www.consumer.ftc.gov/articles/pdf-0096-fair-credit-reporting-act.pdf.

50

無規制のデータブローカー・サービス

データブローカーはマーケターを支援する目的で、ブランドとの対話の可能性がある消

費者や、オンライン Web からソーシャルメディア、モバイルまでに至る多くの異なる

チャネルからサービスを探している消費者のプロファイルを提供している。データブロ

ーカーは、購買パターン、Web サイト/モバイル/ソーシャルメディア上の行動履歴、ア

ドネットワーク上の反応、またはダイレクトな顧客サポートといったデータを集め、公

的記録やその他の商業的に利用できる情報源からの情報でそれを「強化する」。強化さ

れた情報は、消費者のプロファイルを作成するために利用される。次に消費者の活動や

関与はモニタリングされ、マーケターが消費者にメッセージを正しいタイミングで送る

のを助けている。

こうしたプロファイルは数千以上のデータの断片を含み、非常に詳細になることがある。

いくつかの大手データ会社は、数億人の消費者プロファイルを所有している。こうした

会社はアルゴリズムを用いて情報を分析し、消費者を正確なカテゴリーに分類する。カ

テゴリーには、データの利用者が広告のターゲット対象である消費者を識別しやすくす

るために、内容が分かるような名前が付けられることが多い。そうしたカテゴリーには、

「人種上の第2都市住人(Ethnic Second-City Strugglers)」、 「引きこもり:独身

(Retiring on Empty: Singles)」、 「養育問題:子連れの片親(Tough Start: Young

Single Parents)」、 「信用危機:都市家族(Credit Crunched: City Families)」、「地

方でぎりぎりの生活(Rural and Barely Making It)」などがある。107 こうした商品には

個人の事実に基づく情報の他にも、他のデータから推定し「モデル化された」要素も含

まれている。次に、データブローカーは特定の条件を満たす消費者の「オリジナル・リ

スト」を販売する。また、企業が情報を管理する個人についてさらに完全なプロファイ

ルを作り上げることを支援するために、特定の消費者に関する追加データが購入できる

「追加データ」サービスを提供することもある。108

信用調査機関とは何か?

1950 年代以降、現在「消費者報告機関」として知られる信用調査会社は、個人の信

用、保険、雇用の適性を決定するために使用する情報を収集してまとめた報告書を提

供してきた。ある典型的なシナリオは、信用報告機関が、支払い遅延の有無、所有す

る口座の数と種類と所有期間、債権取立を受けた経験の有無、未払い負債の有無とい

った個人の信用履歴に関する情報を収集する。次に、統計プログラムを使用してプロ

ファイルがよく似た消費者のローン返済履歴と比較し、ローンを期日どおりに返済す

107 U.S. Senate Committee on Commerce, Science & Transportation, Majority Staff, “A Review of the Data Broker Industry: Collection, Use, and Sale of Consumer Data for Marketing Purposes,” p. ii, December 18, 2013. 108 同書 22 ページ

51

る信用度として、個人に適切なスコアを割り当てる。このスコアは、消費者に対しど

んな条件で融資を認めるかどうか融資者が判断する基準となり、消費者が家や車を購

入する能力や、節約する能力を導きだす。

消費者の特徴をまとめるこの正確なプロファイリングは利益を生むが、恐らく個人の認

識や同意なしに、アルゴリズムを使用して個人をプロファイルするために、民間セクタ

ーの、、情報を収集して利用する強力な能力も表している。ビッグデータ技術のこの応

用は、不適当、無責任、不正に用いられるならば、ターゲットとなった個人にとって重

大な結果を招く恐れがある。連邦取引委員会は 2012 年のプライバシー・レポートの中

で、データブローカーはもはや公正信用報告法でカバーされていないサービスにおいて、

より透明性を高め、管理しているデータの機微性と利用方法に応じて、消費者に妥当な

アクセスと選択肢を提供することを推奨した。109

アルゴリズム、代替スコアリング、差別の亡霊

特に「サードパーティー」のデータサービス会社における、消費者データの収集と利用

周辺で現在構築が進んでいるビジネス・モデルとビッグデータ戦略は、こうした実務に

おいて透明性と説明義務を保証する方法が重要な論点となっている。強力なアルゴリズ

ムは、ビジネスに利用できる広大なデータの中から価値を引き出し、消費者に力を与え

ることができるが、自動決定による差別のコード化の可能性も高まる。データに対する

アクセスの増大と強力な分析によって、法律で規制されている従来の信用格付けの範囲

を超えて個人を「格付けする(score)」多くの製品がある。110 こうした製品は、消費

者の支払い能力にはじまり、ソーシャルメディアの投稿を基準にした「ソーシャル・イ

ンフルエンサー」度といった、ありとあらゆることを統計的に特徴付けようとする。

こうしたスコアは、マーケティング目的で作成されることもあるが、実際には公正信用

報告法や信用機会平等法(Equal Credit Opportunity Act)による保護の及ばないところ

で、個人が住宅を見つけるチャンスに影響を与えたり、雇用保障を予測したり、健康を

予測するといったやり方で、規制された信用スコアと同様に利用することができてしま

う。111 こうしたスコアに含まれるデータのタイプと、個人に属性を割り当てるために

使用されるアルゴリズムに関する詳細は、企業によって厳密に保持され、消費者の目に

109 Federal Trade Commission, Protecting Consumer Privacy in an Era of Rapid Change: Recommendations for Business and Consumers, 2012, http://www.ftc.gov/reports/protecting-consumer-privacy-era-rapidchange-recommendations-businesses-policymakers. 110 Frank Pasquale, The Black Box Society: The Secret Algorithm Behind Money and Information, (Harvard University Press, 2014). 111 Pam Dixon and Robert Gellman, “The Scoring of America: How Secret Consumer Scores Threaten Your Privacy and Your Future,” World Privacy Forum, April 2014, http://www.worldprivacyforum.org/wpcontent/uploads/2014/04/WPF_Scoring_of_America_April2014_fs.pdf.

52

はほとんど触れない。つまり多くの場合、説明義務のある意志決定チェーンにおいて、

被害を識別したり、実体を把握するための意味ある方法は存在しないということだ。

この透明性と説明義務の欠如が原因で、個人について集められた情報や分析の後でその

データが提案することに対して、個人が理解したり異議を唱える手段はほとんどない。112 また、オンライン広告業界は自主的にポータルを提供しており、公正信用報告法は

規制対象にポータルを要求しているが、消費者がデータサービス会社と連絡を取ること

のできる業界全体のポータルは存在しない。これは、間違いや漏れが自身のスコアや、

結果的に市場での取引能力に影響し続けている、情報泥棒の犠牲者にとって特に有害に

なるだろう。

アルゴリズムとは何か?

簡単に言うと、アルゴリズムは、データに適用される命令とステップ(段階)のシー

ケンス(順序)によって定義される。アルゴリズムは、情報をフィルタリングするカ

テゴリーを生成し、データを処理し、パターンと関係性を調べ、一般的には情報分析

を支援する。アルゴリズムが使用するステップは、アルゴリズム制作者の知識や動機、

偏向、求められる結果によって与えられる。アルゴリズムの結果は、こうした要素の

どれも明らかにしなかったり、間違った結果の可能性や、恣意的な選択の可能性、そ

れが生み出す判断の不確実性を明らかにしない場合もある。レコメンデーション・エ

ンジンからコンテンツ・フィルターに至るすべてを強化するいわゆる「学習アルゴリ

ズム」は、その中を通るデータセットによって進化し、各変数に異なる重み付けを行

う。コンピュータが生成した 終的な生産物あるいは決定は、行動の予測から機会の

否定までありとあらゆることに使用され、科学的客観性という雰囲気を維持しながら

偏見を隠すことができる。

こうしたすべての理由から、市民権擁護団体は、こうしたアルゴリズムによる決定がデ

ジタル・エコノミーにおいて「赤線引き(特定地域の住民や民族には融資しないなどの

差別)」の亡霊を出現させること(中立的なアルゴリズムを装って社会で も立場の弱

い階層が差別を受ける可能性)を危惧している。113 近、一部のオフライン小売業者

は、推定される居住地区に基づいて同じ製品に異なる割引率を生成するアルゴリズムを

使用していることが発覚した。特定の近隣地区では競争がないことを理由に価格の違い

が生まれるのかもしれないが、実際は、収入の高い地区の消費者は収入の低い地区の消

112 政府会計局(Government Accounting Office、GAO)は、2013 年 9 月の情報再販業者に関するレポート

で、プライバシー法および規制のギャップ分析を実施した。参照先:GAO, Information Resellers: Consumer Privacy Framework Needs to Reflect Changes in Technology and the Marketplace, GAO-13-663, 2013, http://www.gao.gov/assets/660/658151.pdf. 113 The Leadership Conference on Civil and Human Rights, “Civil Rights Principles for the Era of Big Data,” http://www.civilrights.org/press/2014/civil-rights-principles-big-data.html.

53

費者よりも割引率が大きかった。114

同じ製品を別の場所で別の値段で提供することは、完全に正当な理由がある。しかし、

消費者をセグメント化し、ほとんど気づかれないほどシームレスに消費者体験を階層化

する能力には、さらなる検討が必要になる。差別的な価格設定と、その他の差別の可能

性がある商慣行につながるときはなおさらである。また、モノとサービスの価格設定以

外にも、アルゴリズムで導き出された決定が、教育や労働を含めた既存の社会経済的格

差をどのように悪化させるかもしれないか調査することも重要である。

結論

広告に支えられたインターネットは、役に立つサービスやニュース、エンターテインメ

ントへの無料アクセスを提供することにより、消費者のために膨大な価値を生み出して

いる。より正確なターゲティング広告は企業にとって大きな価値があり、自社の製品や

サービスを購入してくれそうなオーディエンスに効率的にリーチすることができる。し

かし、民間セクターにおけるビッグデータの利用は、社会的弱者が不当な標的にされな

いことを確実にする必要がある。適格性を決定するアルゴリズムの使用増大には、たと

え差別する意図がなくても、恵まれない集団にとって差別的な結果となる可能性があり、

注意深い監視が必要になる。連邦取引委員会は、この複雑な問題について業界と社会に

引き続き関わり、データブローカー業界において出現する慣行にさらに注意を払い続け

る必要がある。我々は、この重要な問題に関する同委員会の次期レポートに期待してい

る。規制のされていない消費者スコアリングに関する情報への、消費者アクセスを増加

させる実際的な方法を見極めるためには追加作業が必要で、消費者が不正確な情報を修

正したり削除したりできる能力を特に重視するべきである。同様に、スコアやアルゴリ

ズムの使用の広がりにつれて、これらのツールが、民間と公共の両セクターに与えてい

る影響と今後予測される影響を把握するために、これらのツールの使用によって生じる

不利な結果を測定する追加調査が必要である。

114 Jennifer Valentino-Devries and Jeremy Singer-Vine, “Websites Vary Prices, Deals Based on Users' Information,” The Wall Street Journal, December 24, 2012, http://online.wsj.com/news/articles/SB10001424127887323777204578189391813881534.

54

V. ビッグデータのための政策的枠組み 瞬く間に情報時代は、個人の生活と幅広い経済にデータがどのように影響するのかを根本

から作り直した。世界には 6,000 以上のデータセンターが点在している。データの国際的

な流れは多岐に渡っており、途切れることはない。こうしたデータは、提供するサービス

を改善して生活と仕事の質を向上させるために、かつてないほどの規模で企業、政府、起

業家によって活用されている。

ビッグデータの応用は、全体として国家にとって戦略上重要な規模で社会的および経済的

価値を生み出す。技術革新は米国経済を活性化する力である。これから数年間でビッグデ

ータは産業と製造業の生産性を大きく引き上げ、産業と情報経済の統合をさらに加速させ

る。

政府は、あらゆる政策手段を用いてビッグデータの技術の発展を支援すべきである。政府

機関は、政府のオープンデータイニシアティブを引き続き推進する必要がある。また、連

邦政府は、特に教育、医療、エネルギーにビッグデータを応用する際、ビッグデータの技

術を支援する研究開発にも投資しなければならない。先の章で説明したように、既存の政

策を調整することにより、ビッグデータのいくつかの新しい応用が可能になる。それは公

共利益、特に医療ではっきりしている。ビッグデータのための政策的枠組みにとって、進

行中の革命に拍車をかけるために、そして、繁栄するビッグデータに導かれるイノベーシ

ョンに対して取り除くべき障害を識別するために、公民両セクターの協力が必要になる。

影響力の強いその他の生産要因と同じように、ビッグデータは個人、組織、社会に対して

それぞれ異なる価値を生む。ビッグデータの応用の多くは有益であることに疑う余地はな

いが、利用方法によっては、公正、公平、自主性といった基本的価値とプライバシーに影

響が出る。

ビッグデータの技術は、より偏在的で侵略的で価値の高いデータ収集を可能にする。収集

されて引き出されるデータのこの新しい貯蔵場は、利益を生み出す巨大な可能性を持って

いるが、一様に規制されている訳ではない。いくつかの民間および公共機関は、ビッグデ

ータを処理するために多くのデータとリソースにアクセスできるが、これにより個人と組

織の間に不均衡が高まる可能性がある。

影響力の強い技術が公正に使用されることと、公共財を獲得できるあらゆる分野に用いら

れることを保証するのは政府の責任である。今後政策を展開する場所として、特に以下の

4つの分野が考えられる。

1. 市民に対して容認できない利用を防止しながら、公共財に対してビッグデータを活

用する方法

55

2. 基本的価値に影響する方法でビッグデータが消費者環境を変化させる範囲

3. ビッグデータの技術によって可能になる恐れのある新しい形の差別から市民を守る

方法

4. 1970 年代から広く使用されている通知および同意の枠組みである現代のプライバ

シー保護の基本原則にビッグデータが与える影響

ビッグデータと市民

ビッグデータは、政府が公共サービスをいかに強化し、まったく新しい価値を創出できる

ようにする。しかし、ビッグデータのツールによって、政府権限が際限なく大きくなる可

能性が高まることに疑いの余地はない。現在の警察は、冷戦時代に超大国が使用したより

も強力な監視ツールを使用することができる。政府による国民監視を容認するアリート

高裁判事の判決を思い出させるような、生活のあらゆる領域に「小さな保安官」を展開す

る新しい監視手段は、警察権限の方向を変えるアルゴリズムによって市民のプロファイル

が作られる方法と共に、言論の自由と結社の自由を定めた憲法修正第1条にビッグデータ

が与える影響について多くの問題を引き起こす。

プライベートな書類が広く家庭で保管されていたときに、電子情報への法律執行機関のア

クセスを管理する多くの法律が議会を通過した。電気通信におけるプライバシー保護法

(Electronic Communications Privacy Act、ECPA)の一部である通信記録法(Stored

Communications Act)は、電子メールとクラウド・サービスを含む電気通信の内容を取得

するルールを明確にしている。ECPA が 初に成立したのは 1986 年であり、個人が保管す

る通信のプライバシーの保護に役立ってきた。しかし、時間が経つにつれて、規定された

項目の一部は時代遅れになり、今日の技術を使用するやり方をもはや反映していない。

ECPA を更新する方法を検討するとき、プライバシーを含めたさまざまな利害が関係してく

る。そして、法律執行機関と行政執行機関は、市民の安全を守り、刑法と民法を執行する

ことが必要である。電子メール、テキストメッセージ、その他のプライベートなデジタル

通信は、個人の主な通信手段となり、個人のファイルを保存するためにクラウドの利用が

拡大している。こうした通信も同一基準の保護を受けなければならない。

これと同様に、メタデータに提供されている多くの保護が調整されたのは、パーソナル・

コンピュータ、インターネット、携帯電話、クラウド・コンピューティングが普及する前

の時代に対してであった。そのとき、今日では当たり前になっているデジタルデータの形

跡が個人の内密な詳細を暴くことになるとは誰も想像しなかった。現在は、法執行機関に

よるメタデータの利用のほとんどは、犯罪容疑者が使った電話番号を調べるなど、依然と

して「スモールデータ」世界に根ざしている。将来は、「ビッグデータ」世界の一部になる

56

メタデータは、捜査との関連がますます高まるため、メタデータに与えるべき保護措置が

問題になる。現在の通信の内容は、文字であれ音声であれ、高いレベルの法的保護を受け

ているが、メタデータに対する保護レベルはさほど高くない。

政府によるビッグデータの技術の利用を考えるとき、政府権限をどのように規制するべき

かという大きな問題が持ち上がる。ビッグデータの技術には、説明義務、プライバシー、

市民の権利を強化できる解決策も含まれている。こうした解決策には、データを収集また

は生成した当局ごとにデータをタグ付けする高度な手順、目的とユーザーを基準にしたデ

ータ・アクセス制限、どの利用者がどのデータにどんな目的でアクセスしたかの追跡、考

えられる濫用を管理者に警告するアルゴリズムがある。こうした方法は、市民の権利を保

護し、ビッグデータの技術の使い方を規制するために今日の連邦政府内の一部ですべて使

用されているが、さらに多くの機関が使用する必要がある。ビッグデータは責任を持って

利用されれば、市民に与えられた自由と権利の実際の保護手段の全体的な拡大につながる

と共に、公共サービスを提供する形を良い方向に変えることになる。

ビッグデータと消費者

ビッグデータの利用を促進する収集と分析の技術は、社会と経済のあらゆる分野で使用さ

れている。その多くは、消費者としての市民に向けられている。今まで も論議されてき

たビッグデータ分析の1つはオンライン広告産業における分析で、消費者が Web サイトを

閲覧したり、携帯電話を使いながら街を回るときに、カスタマイズされた広告を提供する

ために使用される。しかし、収集された情報とその利用は実に幅広いうえに即座に変化し、

現実世界のデータとオンライン活動から引き出されたデータとの組み合わせがますます進

んでいる。

その 終結果は、個人に関して編集された内密情報の膨大な増加である。こうした情報は

すべての種類のビジネスに大きな価値を持っており、売買、交換、取引の対象になる。現

在では、そうしたデータから引き出した結論を商品化する産業が存在する。今日の市場で

販売される商品には、特定の個人に関する多くの消費者スコアがあり、個人の特徴、傾向、

他に与える社会的影響力の程度、消費癖、財産の他にも、賃貸や職業保障や虚弱性に関す

る適性までも記されている。こうした格付け作業のいくつかは厳しく規制されているが、

他の目的でデータを使用する規制はさほど厳しくない。

プロファイリングとターゲットを絞った広告の拡大と、消費者を追跡してオンラインと物

質世界を移動するときにサービスを提供する方法に関連した利益は計り知れない。広告と

マーケティングは、インターネット上の多くの無料のものを効率的に補助し、ソフトウェ

アと消費者アプリの産業全体に活気を与えている。ある人がこの研究を通して鋭く指摘し

ているように、「私たちはインターネットで検索するときに、一銭も払いたくない」のだ。

57

データ収集は、オンラインで身元を確実に検証するのにも重要である。データサービス業

界と金融業界は、消費者がコンピュータとモバイル機器を使って安全に取引できるように

あらゆる手を尽くしている。民間セクターで取引に使用される同じ検証技術は、市民が安

全に政府のオンラインサービスとやりとりすることも可能にし、外出しなくてもすべての

公共サービスが利用できる新しい世界を開いている。

しかし、このように商業サービスの提供を組織化するにはコストもかかる。消費者に関す

るあまりも多くの情報を混ぜ合わせると、データ漏洩の可能性が必然的に高まり、データ

漏洩に関する州によってまちまちの基準に代わって連邦レベルでの規制の必要性が重要に

なる。データの収集、保管、集約、転送、販売のこの新しい相互連結エコシステムでは、

非常に多くの参加者が消費者に被害を与えることができる。平均的な消費者は、収集また

は保持されているデータの範囲に気づいているとは思われず、誰が保持しているかさえ知

らないように見える。そして、保管されている自分のデータの範囲や正確さを確かめるチ

ャンスがほとんどなく、消費者の体験や市場アクセスについて決定するアルゴリズムに個

人情報がどのように使われるのかを推察する能力が限定されている可能性もある。

消費者の文脈でビッグデータの活用拡大を可能にする政策を検討するとき、この収集され

た情報を利用する方法について重要な線引きをする必要がある。ビッグデータがマーケテ

ィング目的で消費者をセグメントに別け、その結果、モノとサービスの購入に一層適合し

た機会が提供されることと、その情報が消費者の雇用、住宅、医療、信用、教育の適格性

やそれらを得るための条件の決定に使われることは別のことであり、後者ははるかに重大

な問題であることは恐らく間違いない。

ビッグデータと差別

ビッグデータは計り知れないほどの社会財を生み出すことに加え、政府と民間セクターが

所有するビッグデータは多くの種類の損害の原因になり得る。こうした被害は金銭的損失

といった分かりやすい物質的なものから、個人生活への侵入と風評被害といった分かりに

くいものまである。この研究の重要な結論は、ビッグデータの技術にはプライバシーの侵

害を超えて個人やグループに対する差別といった社会的被害を引き起こし得ることである。

この差別は、ビッグデータの技術を構築して利用する方法に伴う意図しない結果である場

合も、弱者層を狙った意図的結果である場合もある。

ビッグデータの技術が、不注意による差別につながらないことを確実にした組織の分かり

やすい例はボストン市で、市長の新都市機構オフィス(Office of New Urban Mechanics)

と協力して実験的なアプリケーションを開発した。115 モバイルアプリケーションの Street

115 New Urban Mechanics, http://www.newurbanmechanics.org/を参照。

58

Bump は、スマートフォンの振動加速度計と GPS 機能を使い、舗装の凹凸を含めた道路状

態に関するデータを収集し、市の公共事業部に送信する。これは市行政が公共サービスの

提供改善にクラウドソーシングを独創的に使用している好例である。しかし、Street Bump

チームは、このアプリを一般に配布すると問題が起きる可能性にも気づいた。貧困者層や

高齢者層がスマートフォンを持っていたり、このアプリをダウンロードしたりする可能性

は低いため、行政サービスはスマートフォンの所有者が多い近隣地区に機械的に振り分け

られる結果を生む可能性があった。

ボストン市と Street Bump アプリの開発者が優れている点は、アプリを公開する前にこの

ことを理解したことである。アプリは市全体に一様にサービスを提供する道路調査員に

初に配られ、現在は市民が補足データを提供している。その目的は不公平な結果を防止す

ることにあり、それに値する成果が出た。アプリは今までに 36,992 の「凹凸」を記録し、

路面の穴ではなくマンホールや電気ガス水道設備の蓋がドライバーにとって 大の障害物

になっていることを市が把握する助けとなっている。

潜在的な差別のさらに深刻なケースは、個人が身元認証をするときに複雑なデータベース

とやりとりするときに発生する。複数の苗字を持つ個人や結婚して苗字が代わった女性は、

誤った情報の確率が高くなる。たとえば、国土安全保障省(Department of Homeland

Security)と社会保障局(Social Security Administration)は、電子認証プログラムでデータ

ベースを共同運用しており、以前から市民権保護論者の懸念材料になっている。

電子認証により、雇用主は新規採用する従業員に米国で合法的に働く資格があることを確

認できる。特にシステムが処理するクエリの数と、常に変更されている複数の情報源から

集められる情報量を考えると、電子認証プログラムが返した結果の圧倒的多数は適切かつ

正確であるため、雇用主は採用する従業員に合法的な労働資格があることを確認できる。

しかし、電子認証の性能を改善するための定期的な評価により、グループが異なると初期

認証の確率が異なることが判明した。2009 年の評価では、システムによって雇用資格が

初は誤って確認されなかった米国市民の率は 0.3%であったのに対し、非市民では 2.1%で

あった。とは言え、数日後にはこうした労働者の資格の多くが確認された。116

国土安全保障省と社会保障局は、細心の注意を払ってこの問題に対処している。プログラ

ムのより 近の評価では、さらに多くの市民が自分の労働資格をより短時間でより正確に

確認できることがわかった。初期認証の誤り率は5年間で米国市民が 60%、非市民が 30%

Street Bump に関するすべての情報は、White House Chief Technology Officer の職員による前プロジェク

ト管理者 James Solomon へのインタビューによる。 116 Westat Corporation, Findings of the E-Verify Program Evaluation, December 2009, 国土安全保障省へ

の提出レポート, http://www.uscis.gov/sites/default/files/USCIS/E-Verify/EVerify/Final%20E-Verify%20Report%2012-16-09_2.pdf.

59

それぞれ低下した。117 こうした技術的問題を未解決のまま放置すれば、特定の個人とグル

ープに対して雇用とその他の重要なニーズにさらに高い障壁が築かれることになろう。こ

のため、ビッグデータ・システムの正確さ、透明性、誤り修正は絶対に重要である。

意図的でない差別のこうした2つの例は、ビッグデータの技術を応用するとき、差別の意

図がなく、不公平な影響を予想しない場合でさえ、結果を監視することが重要になる理由

を示している。しかし、意図的な差別のためにビッグデータが利用される懸念に値するま

ったく別の分野がある。

雇用、信用、保険、医療、住宅、教育という特定の領域で社会として公正さを求めるため

に、多くのステップが導入されてきた。法律と規制による既存の保護は、こうした状況の

それぞれで個人データが利用できる方法を管理している。予測アルゴリズムはいくつかの

方法で使用することが許されているが、アルゴリズムに入れられるデータと、アルゴリズ

ムによって行われる決定は、ある程度の透明性、訂正、誤り修正手段の対象になる。雇用、

信用、保険といった重要な決定に対し、消費者にはそうした決定が行われた理由と決定に

使われた情報を知る権利と、それに誤りがある場合はその元となった情報を修正する権利

がある。

こうした保護措置がある理由は、米国の長い差別の歴史にある。米国では 20世紀初頭から、

銀行と金貸し業者は顧客の状況を想定するために土地のデータを使用してきた。1975 年に

住宅抵当貸付公開法が成立するまでは、個人の信用能力の代わりにどんな地区に住んでい

るかに基づいて貸付を拒否することの方がはるかに一般的であった。銀行が文字どおり境

界線を引いた、いくつかのケースでは線を引き続けた境界線付近の地区の住民を融資対象

から除外する「赤線引き」は、アフリカ系、ラテン系、アジア系市民とユダヤ人を差別す

る強力なツールとして数十年間にわたって行われた。

居住地区が民族または人種の代用に役立つのとちょうど同じように、消費者、従業員、賃

借人、信用の受け手のいずれかとして望ましくないグループを「デジタルで赤線引き」す

るためにビッグデータの技術が使われる新たな恐れがある。このレポートの重要な成果は、

ビッグデータによって新しい形の差別と略奪的慣行が可能になるということである。

差別にもつながる同じアルゴリズムとデータマイニング技術は、いくつかのグループが差

別の状況を識別して経験上から確認し、被る損害を特徴付ける権利を強化する助けにもな

る可能性がある。市民権保護団体は、代表するコミュニティに対する公正な扱いを求める

ために、ビッグデータのこの新しい強力なツールを利用することができる。ビッグデータ

117 Westat Corporation. Evaluation of the Accuracy of E-Verify Findings, July 2012, 国土安全保障省への提

出レポート, http://www.uscis.gov/sites/default/files/USCIS/Verification/E-Verify/EVerify_Native_Documents/Everify%20Studies/Evaluation%20of%20the%20Accuracy%20of%20EVerify%20Findings.pdf.

60

がすべての米国市民に対してより大きな平等性を確立するか、既存の不平等を悪化させる

かは、今後数年間にビッグデータの技術を応用する方法と、法律に定められる保護の種類

と、その法律を施行するやり方にかかっている。

ビッグデータとプライバシー

ビッグデータの技術は、「モノのインターネット」に付けられたセンサーと共に、以前はプ

ライベートであった多くの領域に入り込んでいる。家庭の Wi-Fi ネットワークからの信号は、

何人の家族が部屋にいて、どこの座っているのかを明らかにする。需要反応システムから

集められた電力消費データは、その家の住人が家の中のいつ歩き回るのかを示している。118

顔認証技術は、人が外出するとすぐにオンラインで画像の中からその人を識別することが

できる。音声と画像のインタフェースを備えた常時接続のウェアラブル技術と、あらゆる

装置のネットワーク化は、情報の収集を今以上に拡大させるだけになろう。センサーだら

けのこの海では、それぞれのセンサーの使用は合法的であるため、情報収集を規制する考

えは不可能ではないにせよ非常に困難である。

偏在的な情報収集に向かうこの傾向は、ある程度は技術自身の性質によって主導されてい

る。119 生成されたデータがアナログにせよデジタルにせよ、データは以前では考えられな

かった方法で再利用されて他のデータと組み合わされている。こうした利用には、 初に

収集した意図的な動機を超えているものもある。データの潜在的な将来の価値は、デジタ

ルの土地収奪を引き起こしており、組織の優先度は可能な限り多くのデータを収集して活

用することに移行している。企業は市場ポジションを 大限に高めるために、どの種類の

データを所有しているのか、そしてどのデータが必要なのかを常に調べている。データ保

管のコストが急激に下がり、将来のイノベーションが予測できない世界では、可能な限り

多くの情報を収集するという論法には強い説得力がある。

ビッグデータの持つもう1つの現実は、データが一度収集されると匿名性を維持すること

が非常に難しくなることである。巨大なデータセットの中で個人を特定できる情報を隠す

ために進められている有望な研究があるものの、うわべは「匿名」に見えるデータを再識

別するためにさらに進んだやり方が現在使われている。データを融合する能力のための集

合的な投資は、プライバシー保護を高める技術への投資よりも何倍も大きい。

118 Stephen Wicker and Robert Thomas, “A Privacy-Aware Architecture for Demand Response Systems,” 44thHawaii International Conference on System Sciences, January 2011, http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5718673&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5718673; National Institute of Standards and Technology, Guidelines for Smart Grid Cyber Security: Vol. 2, Privacy and the Smart Grid , 2010, http://csrc.nist.gov/publications/nistir/ir7628/nistir-7628_vol2.pdf. 119 President’s Council of Advisors on Science & Technology, Big Data and Privacy: A Technological Perspective, The White House, May 1, 2014, whitehouse.gov/bigdata.

61

これと同時に、こうした傾向は、40 年以上に渡ってプライバシー慣習をまとめ上げる大黒

柱となった通知および同意の枠組みの詳細な調査を要求するかもしれない。再識別が非識

別化よりも強力になりつつある過度な構造的収集の技術的状況では、個人データの収集と

保管に重点を置くことは重要であるが、個人のプライバシーの保護にはもはや十分でない

かも知れない。大統領科学技術諮問委員会(President’s Council of Advisors for Science &

Technology)は「通知と同意は、ビッグデータで可能になる正に決定的な利点、つまり、

新しくて不明瞭な予期せぬ強力なデータ利用に負ける」と述べている。120

連邦政府のプライバシー強化技術研究

オバマ政権はプライバシーを強化する技術の研究開発を優先している。ネットワーキング情報技術研究

開発(Networking and Information Technology Research and Development、NITRD)プログラムを通した

プライバシー保護研究に毎年費やされる額は政府機関全体で 7,000 万ドルを超過している。121 この研

究の幅広い対象範囲は、セキュリティの延長としてのプライバシーのサポート、企業のプライバシー法

遵守に関する調査、医療におけるプライバシー、プライバシー保護を可能にする技術の基礎研究である。

以下の表は、政府機関で進行している NITRD の研究プログラムのいくつかを示している。大統領科学

技術諮問委員会は、ビッグデータの技術の再調査の中で、プライバシー関連技術と、その利用を取り巻

く社会科学的問題の研究を米国が強化することを推奨している。

研究エリア セキュリティの延

長としてのプライ

バシーのサポート

企業のプライバシ

ー法遵守に関する

調査

医療におけるプラ

イバシー

プライバシーの調

査研究

政府機関 空軍研究所(Air

Force Research

Laboratory)、国防

高等研究計画局

(Defense

Advanced

Research Projects

Agency)、国家安全

保障局(National

Security Agency)、

情報先端研究プロ

ジェクト活動

(Intelligence

エネルギー省

(Department of

Energy)、国土安全

保障省

(Department of

Homeland

Security)、米国技

術標準局(National

Institute of

Standards and

Technology)

遠隔医療および

先端技術研究セン

ター(Telemedicine

and Advanced

Technology

Research

Center)、全国医療

IT 調整オフィス

(Office of the

National

Coordinator for

Health Information

Technology)、国立

全国科学基金

(National Science

Foundation)

120 同書 36 ページ 121 Networking and Information Technology Research and Development, Report on Privacy Research within NITRD, April 2014, http://www.nitrd.gov/Pubs/Report_on_Privacy_Research_within_NITRD.pdf.

62

Advanced

Research Projects

Activity)、海軍研究

事務所(Office of

Naval Research)

衛生研究所

(National Institute

of Health)

年間推定資金額

(総額 7,700 万ド

ル)

3,400 万ドル 1,000 万ドル 800 万ドル 2,500 万ドル

主要プロジェクト

の例

匿名化技術

機密の協力および

通信

準同型暗号

プライバシー保護

データ集約

トラフィックセキ

ュア経路指定

自動プライバシー

遵守

場所 -プライバシ

ー・ツール

個人を特定できる

情報の保護

法遵守の基準

小規模電力会社の

自主行動規範

収集と利用の制限

プライバシーのた

めのデータ区分

患者の同意とプラ

イバシー

患者データの品質

医療データの匿名

性の保護

プライバシーのた

めのアルゴリズム

構築とツール

プライバシーの経

済学

社会心理学構成概

念としてのプライ

バシー

プライバシー政策

分析

クラウド・コンピ

ューティング、デ

ータ統合、データ

マイニングのため

のプライバシー・

ソリューション

予測されるビッグデータ革命の次の段階

消費者とファーストパーティーが現在普通にやりとりする情報の大部分に対して、通知と

同意の枠組みはプライバシーを十分に保護している。しかし、大統領科学技術諮問委員会

が指摘しているように、技術の軌道は、消費者や個人と直接接触しない関係者によるさら

に多くのデータの収集、利用、保管に移行しつつある。122 家電製品による周囲のデータの

122 President’s Council of Advisors on Science & Technology, Big Data and Privacy: A Technological Perspective, The White House, May 1, 2014, p. 20, whitehouse.gov/bigdata.

63

収集など、通知と同意の枠組みが無効になる恐れがある状況では、データを利用する文脈、

つまり学者と技術者がプライバシーについて現在論議している政策転換にもう一度注意を

向ける必要があるのかも知れない。123 データを利用する文脈は非常に重要である。あるシ

ナリオで社会的に有益なデータであっても、別のシナリオでは大きな被害を起こす場合が

ある。データ自身はいわゆる「両用」で、良い方にも悪い方にも使うことができる。

責任ある利用の枠組みをさらに重視することには多くの潜在的な利点がある。これにより

責任は、市場で現在構造化されているような同意の注意書きを理解またはそれに異議を唱

える手段を十分に備えていない個人から、データを収集、保存、利用する関係者へ移行す

る。責任ある利用の重視は、データの管理とそれが引き起こす被害についてデータの収集

者と利用者にアカウンタビリティを維持させ、そのアカウンタビリティは、データ収集時

に適切な同意を得たかどうかに狭義に限定されない。

責任をさらに重視することは、収集の文脈を無視することではない。データを、責任を持

って利用することは、 初の収集の文脈を尊重することを意味するようになる。消費者プ

ライバシー権利章典の「文脈の尊重」原則に規定されているように、事実上「当然(no

surprises)の」ルールがあり得る。消費者の文脈で収集されたデータは、雇用データで突

然利用されることはなくなる。データ利用に対する重点のこの移行は、技術的発展によっ

てサポートされる。 新のデータタグ付けスキームは、ユーザーによって既に認められた

データの収集と利用の文脈に関する詳細を暗号化することができる。したがって、許可さ

れた利用に関する情報は、データがどこに向かおうとデータに付随する。データタグ付け

スキームなどが十分に発達して広く使用されれば、ビッグデータが提示するジレンマはす

べて解決されるわけではないが、いくつかの重大な課題に対処する助けとなろう。

恐らく も重要なことは、ビッグデータの文脈において責任ある利用に重点を移すことに

より、考慮すべき困難な問題、つまり、ビッグデータの社会的に有益な利用とプライバシ

ーに対する被害と、より多くのデータがより多くのモノに関して必然的に収集される世界

をもたらすその他の価値の間で、どのようにバランスをとるかという問題に真正面から向

き合えるようになることである。どのような状況でも収集または利用しない情報と、同意

なしに収集または利用できる情報と、同意があるときのみ収集または利用できる情報を区

別する、同意に基づく分類が必要だろうか?この分類は、癌治療の医療研究者と、消費財

の広告ターゲットを絞り込む市場関係者に対し、どのように違えるべきだろうか?

オバマ大統領は消費者プライバシー権利章典を公表したとき、「個人情報を以前よりももっ

と自由に共有できる世界に住んでいても、プライバシーは時代遅れの価値だとする結論を

拒否しなければならない。プライバシーは初めから民主主義の中心であり、現在はこれま

123 Craig Mundie, “Privacy Pragmatism: Focus on Data Use, Not Data Collection,” Foreign Affairs, March/April, 2014, http://www.foreignaffairs.com/articles/140741/craig-mundie/privacy-pragmatism.

64

で以上に必要とされている」と述べた。この真実は、ビッグデータが動かす世界ではなお

さらである。

65

VI. 結論と提言 オバマ大統領が2014年1月17日に発表したビッグデータとプライバシーに関するホワ

イトハウス報告書は、ビッグデータの技術の幅広い影響を調査するために作成された。

大統領は、ビッグデータ革命が公民両セクター全域で広まりつつあることと、その影響

を信号情報収集に関する政府レポートと合わせて検討する必要性を認めた。

ホワイトハウスのビッグデータ作業グループは、ビッグデータの技術が政府、商業、社

会をどのように変化させているのかについて90日間にわたる調査を開始した。我々の望

みは、ビッグデータが提供するチャンスと、ビッグデータで拍車がかかる進化を理解す

ることと、どの種の技術が既に存在し、何がすぐに姿を表すと予測できるのかをしっか

りと把握することであった。大統領科学技術諮問委員会は、基本となる技術を評価する

ために類似のレポートを作成した。その結果は、このレポートの多くの技術的主張を裏

付けている。

ビッグデータ・ツールは、以前は不可能であった洞察を新規および既存のデータセット

から引き出す驚くべき強力なチャンスを提供する。ビッグデータは、医療と教育、農業

とエネルギー消費、企業のサプライチェーン構築と設備監視において、発展と発見を促

進することができる。ビッグデータは、公共サービスの提供を合理化し、あらゆるレベ

ルの行政で税金の効率的な使用を拡大し、国家安全保障を実質的に強化できる可能性を

持っている。ビッグデータを有望にするには、行政データを国の資源と見なし、そこか

ら社会的価値を派生させることができる人が責任を持って利用できるようにする必要

がある。また、ビッグデータは、さらなる技術革新を次々と導く次世代のコンピュータ・

ツールと技術を形作る機会も提示している。

ビッグデータは多くの困惑も引き起こしている。多くのセンサー技術は、正にその性質

から電話、家庭、オフィス、都市全域の街路灯およびビルの屋根に設置され、ますます

多くの情報を収集している。情報分析が進化し続けていることは、現在使用するばかり

でなく将来使用する可能性のためにできる限り多くの情報を集める動機になっている。

技術的に言うと、ビッグデータは機能として偏在して永続するためにデータ収集を主導

し、我々自身と我々の生活について驚くべき数の物事を明らかにするために、裏に隠れ

たデジタルの足跡を収集して分析し、組み合わせる。こうした進化は、長年にわたるプ

ライバシーの概念に挑戦し、ユーザーが自分のデータの収集に 初に許可を与える”通

知と同意”枠組みについて問題を提起している。しかし、こうした傾向は、人々が自分

のデータの扱いと管理に関わる方法を編み出すことを必ずしも妨げるものではない。

このレポートの重要な結果は、ビッグデータは重大な社会財に対して使用できるが、社

会的被害をもたらしたり、差別する意図がなかった場合でさえ不公正な影響を与える結

66

果を生むようなやり方でも使用できることである。小さな偏りが積み重なって、恵まれ

ない特定のグループに対する幅広い結果に影響する可能性がある。社会はこうした潜在

的な被害を防ぐ措置を講じなければならない。それには、市民と政府であろうと、消費

者と企業であろうと、従業員と会社であろうと、個人と組織の間で権限が適切に釣り合

わされることを確実にする必要がある。

ビッグデータ革命は始まったばかりである。我々は多くの年月を費やしてこの技術の範

囲全体、つまり、この技術が医療、教育、経済を活性化するやり方と、特に、プライバ

シー、公正性、非差別、自主決定を含む米国の核となる価値への影響の理解に取り組ん

でいく。

この初期の段階でさえ、このレポートの作者たちは、多くの領域で行政がどのように進

むのかを告げることができるビッグデータに関して、重要な結果が既に明らかになりつ

つあると考えている。特に、ビッグデータの世界で利益を 大に高めて被害を 小に留

める方法について、米国市民の間に全国的な議論を生む5つの重要な領域がある。

1. プライバシーの価値の保護:米国内と、相互運用可能な国際的なプライバシー

フレームワークの両方を通して、市場における個人情報を保護することにより、

我々のプライバシーの価値を維持する。

2. 責任ある確固とした教育:特に幼稚園から高校までの学校は、学習機会を高め

るためにビッグデータを使用する重要な場であることを認識し、その一方で個

人データの利用を保護し、デジタル・リテラシーとスキルを伸ばす。

3. ビッグデータと差別:ビッグデータの使用で可能になる恐れのある新しい形の

差別を防ぐ。

4. 法律執行とセキュリティ:法の執行、公衆安全、国家安全保障でビッグデータ

の責任ある利用を確実にする。

5. 公的資源としてのデータ:データを公的資源として活用し、公共サービスの提

供改善に役立て、ビッグデータ革命を促進させる研究と技術に投資する。

67

政策提言

このレポートは、行政の注意を喚起して政策の展開を促すに値する6つの個別の政策提

言も明らかにしている。

・ 消費者プライバシー権利章典の促進。商務省は、ビッグデータの発展について、そ

して、それがどのように消費者プライバシー権利章典に影響するのかについて利害

関係者と一般から意見を求め、次に利害関係者が検討して大統領が議会に提出する

法案の草案作りを準備するために、適切な協議ステップを講じる必要がある。

・ 全国データ違反法(National Data Breach Legislation)の承認。議会は、2011年

5月のサイバーセキュリティ法に関する立案と並んで、単一の全国データ違反基準

を定めた法律を承認する必要がある。

・ プライバシー保護を非米国市民に拡大。行政管理予算局(Office of Management

and Budget)は、可能な場合に1974年のプライバシー法を非米国市民に適用する

か、国籍とは関係なく個人情報の適切で有効な保護を適用する別のプライバシー政

策を確立するために、省庁と作業する必要がある。

・ 学校で生徒に関して収集されたデータが教育目的で使用されることを保証。連邦政

府は、特に生徒のデータが教育の文脈で収集されるとき、プライバシー規制がデー

タの不適切な共有または利用から生徒を保護することを保証する必要がある。

・ 差別をなくすために技術的な専門知識を拡大。連邦政府の主要な市民権および消費

者保護担当機関は、保護を受けている階級に差別的影響をもたらすビッグデータの

分析によって容易になる慣行と結果を識別し、法律違反を調査して解決する計画を

確立できるように、技術的な専門知識を拡大する必要がある。

・ 電気通信におけるプライバシー保護法(Electronic Communications Privacy

Act、ECPA)の改正。議会は、オンラインのデジタルコンテンツの保護基準が物

理的世界で提供されている保護基準と矛盾しないことを保証するために、未読の電

子メールや一定の年齢に関する時代遅れの区別を取り除くことを含め、ECPAを改

正する必要がある。

68

1. プライバシーの価値の保護

ビッグデータの技術は、巨大なイノベーションを主導しているが、その一方で、現在焦

点が当てられているオンライン広告を遙かに超えて、プライバシーに対して新たな影響

を生み出している。こうした影響を考えると、2012年に公表された消費者プライバシ

ー権利章典を含めたプライバシー保護の将来について、幅広い全国的な調査が急務であ

る。そして、データを収集する前にユーザーの許可を得ることに重点を置いた従来の通

知と同意の枠組みを再検討することが特に重要である。通知と同意は多くの状況で基本

的であるが、データの利用と再利用にさらに大きな重点を置くことがビッグデータ環境

でプライバシーの権利を管理するさらに生産的な基盤になるかどうかを調査すること

が現在必要である。個人が自分のデータが収集された後にそのデータの利用と配布に関

わるメカニズムを確立することは、現時点では、そうした情報から派生する利益に人が

アクセスすることを認めるさらに優れた権限強化の方法であるかも知れない。プライバ

シーの保護は、ビッグデータの利用から生み出すことができる社会財を調整する方向に

進む必要もある。

消費者プライバシー権利章典の促進

オバマ大統領が2012年2月に明らかにしたように、消費者プライバシー権利章典と付随

の消費者プライバシーブループリント(Blueprint for Consumer Privacy)は、「強力な

プライバシー保護を提供し、新しい情報技術で進行中のイノベーションを可能にする方

法」を示している。消費者プライバシー権利章典は、公正な情報取扱い原則(Fair

Information Practice Principle)に基づいている。一部のプライバシー専門家は、こうし

た原則の微妙な表現は、ビッグデータを含めた新たに広まりつつあるデータ利用に対す

る対処とサポートに十分柔軟であると考えているが、他の専門家は、特に技術者はさほ

ど確信を抱いていない。現在のプライバシーフレームワークを補強しているいくつかの

重要な想定が、特に収集と利用の回りでビッグデータの挑戦を受けていることは明らか

なためである。このため、プライバシーの保護をどのように保証し、通知と同意の慣行

に対して実際にどのような制限があるのかという文脈で、こうしたビッグデータの発展

を考察する必要がある。

提言: 商務省は、消費者プライバシー権利章典がビッグデータのイノベーションを

そのリスクに同時に対処しながらどのようにサポートできるのか、そして、第5章に

述べてあるように、責任ある利用の枠組みは消費者プライバシー権利章典が確立した

枠組みの中にどのように含めることができるのかについて、早急に一般から意見を求

めなければならない。その後、商務省は、利害関係者が検討して大統領が議会に提出

69

する法案の草案作りについて作業しなければならない。

消費者と企業の利益のための全国データ違反法の制定

組織はますます多くの個人情報を蓄えているため、米国市民には、個人情報が盗まれた

かどうか、そうでなければ不正に公開されたかどうかを知る権利がある。個人を特定で

きる情報の紛失を報告しなければならない時と方法は、現在47種類のまちまちの州法が

管理している。

提言: 議会は、2011年5月のサイバーセキュリティ法に関する立案と並んで、単一

の全国データ違反基準を定めた法律を承認しなければならない。こうした法律は、通

知に適切な期限を設け、法律執行による調査への介入を 小限に抑制し、場合によっ

ては、大きな被害をもたらす事故を重要度の低い事故よりも優先して通知しなければ

ならない。

一般的に”データブローカー”として知られるデータサービス産業は、業界全体の透明性

をもっと高めなければならない。

消費者は、自分が直接取引する主体者を超えて「サードパーティー」であるデータ収集

者などに自分のデータがどのように共有されるのかについて、当然のようにもっと高い

透明性を必要としている。高い透明性は、顧客の経験を扱ったりそのデータを収集した

りする企業の数が増加しているため、情報の収集と再利用の範囲を消費者が正し認識す

ることを確実にする。データサービス産業は、オンライン広告産業とクレジット産業を

見倣い、会社名の一覧を表示する共通Webサイトやポータルサイトを設け、データの扱

いを説明し、個人情報がどのように収集されて利用されるのかを簡単に管理できたり、

マーケティング目的の特定の利用を拒否したりできる手段を消費者に提供しなければ

ならない。

データの利用にさらに重点が置かれるときでさえ、消費者は自分のデータが収集される

時と方法を管理する助けとなる”Do Not Track”ツールに大きな関心を抱いている。

こうしたツールの強化は、一連のサービスと装置を通して個人の行動、習慣、位置デー

タを記録できる多くの技術が成長しているため、特に重要である。一般市民を対象にし

た調査は、こうしたツールの圧倒的な需要をはっきりと示しており、政府と民間セクタ

ーは消費者サービスの向上に合わせてプライバシー強化技術を進化させる作業を継続

しなければならない。

政府は、医療保険の相互運用性とアカウンタビリティに関する法律(Health Insurance

70

Portability and Accountability Act、HIPAA)と他の関連する連邦法および規制が、

ビッグデータで可能になる医療サービスのコスト削減と医学の進歩とどうしたら一番

良く調整できるのかを評価する協議プロセスを主導しなければならない。

疾病の予測、発見、治療を飛躍的に高めることは、当然ながら公共政策が も重視する

ことであるが、研究者がさまざまな種類の生活スタイルと健康情報を組み合わせて分析

できる医療データ・プライバシー制度にかなりの改善がなければ、その可能性が十分に

実現されるとは思われない。提案されるどのような改革も、HIPAAの管理を受けない主

体者である組織によって配布される膨大な量の個人医療情報を規則と法的保護の下に

置くことも検討しなければならない。

米国は、相互運用可能なグローバルなプライバシーフレームワークへの米国の積極的な

取り組みを再確認するビッグデータに関する国際協議を主導しなければならない。

ビッグデータの恩恵は、情報のグローバルな自由流通にかかっている。ビッグデータの

恩恵と課題は別の国の法的な枠組みと伝統に影響するため、米国は海外のパートナー国

を協議に参加させなければならない。

特に、国務省と商務省は、二国間パートナー、EU、APEC、OECDを含めた政府間パー

トナー、その他の利害関係者に積極的に働きかけ、既存および提案された政策枠組みが

どのようにビッグデータに対処するのかを評価しなければならない。

米国政府は、EUとのセーフハーバーフレームワーク(Safe Harbor Framework)を強化

し、さらに多くの国と企業がAPEC越境プライバシー・ルール(APEC Cross Border

Privacy Rules)に参加するよう促し、欧州の拘束的企業ルール(Binding Corporate

Rules)制度とAPEC越境プライバシー・ルール制度を調整する作業を通して、米国、

欧州、アジアの間のデータ流通に関する協力を促進させなければならない。

プライバシーは米国が尊重する世界的価値で、すべての人に関するデータの扱い方に反

映されなければならない。

この理由により、米国は非米国市民にプライバシーの保護を拡大しなければならない。

提言: 行政管理予算局は、可能な場合に1974年のプライバシー法を非米国市民に適

用するか、国籍とは関係なく個人情報の適切で有効な保護を適用する別のプライバシ

ー政策を確立するために、省庁と作業しなければならない。

2. デジタル時代の責任ある教育イノベーション

71

ビッグデータは、子供と青少年に学習経験を高める大きなチャンスを提供する。ビッグ

データは、2つの重要な方法で教育と重なり合う。学生は教育機関と情報共有を始める

とき、知識とスキルを伸ばすためにそうするのであり、後の学年で不利になるように利

用される恐れのある得手不得手についての広範なプロファイルの作成にデータが使用

されることを予期していない。教育機関はまた、ビッグデータの世界に取り組むことを

子供、青少年、大人に準備させる独特な立場にある。

学習でイノベーションを促進させながらデータ保護を保証

個人に合わせた学習をネットワーク上で可能にする装置がもっと一般的になるとき、教

育を改善するためにビッグデータを使用する大きな飛躍が準備される。大統領の

ConnectEDイニシアティブの下で、今後5年間で米国の教室には技術が劇的に流入し、

特に不利な立場に置かれているコミュニティに対して、教えることと学ぶことを強化す

る大きな機会が与えられる。インターネットを利用する教育ツールとソフトウェアは、

教育に関する技術とビジネスに急速な反復とイノベーションを可能にする。こうした技

術は、学生に対する強力なプライバシーおよび安全保護措置と共に、教室の内外で展開

されている。家庭教育の権利とプライバシーに関する法(Family Educational Rights and

Privacy Act、FERPA)と児童オンラインプライバシー保護法(Children’s Online Privacy

Protection Act、COPPA)は、学生のプライバシーを保護するための連邦規制枠を定め

ている。しかし、前者はインターネットが登場する前に作られ、後者はスマートフォン、

タブレット、アプリ、クラウド、そしてビッグデータが登場する前に作成された。学生

とその家族は、現在の被害と新たな被害に対して強力な保護を必要としているが、すべ

ての学生に能力を全開させる力を与えることを約束する技術によって可能になる知識

の進化に触れることも当然ではあるが必要としている。

提言: 連邦政府は、学校で収集されるデータが教育目的で使用されることを保証し、

学校で成績のレベルを引き上げる投資とイノベーションを引き続き支援しなければな

らない。このイノベーションを促進するには、FERPAとCOPPAの下でプライバシー規

制枠を現代化する方法を調査する必要がある。その目的は次の2つの補足的目標の達

成である。1) 特に学生のデータが教育の文脈で収集されるとき、データの不適切な共

有または利用から学生を保護する。2) 新しいアプローチおよびビジネスを含めた教育

関連技術のイノベーションが成果を上げる十分な機会があることを保証する。

デジタル・リテラシーを21世紀の重要なスキルとして認識

あらゆる年齢の学生、市民、消費者がデータの利用と濫用から適切に自らを守る能力を

備えることを確実にするために、データが収集されて共有される方法、アルゴリズムの

使われ方とその目的、自己防衛に使用できるツールおよび技術が速やかに理解されるこ

とが重要である。こうしたスキルが規制による保護に取って代わることは決してないが、

72

高いデジタル・リテラシーはデータにあふれる世界に住むことを個人に準備させる。個

人データがどのように収集、共有、利用されるのかについて理解するデジタル・リテラ

シーは、幼稚園から高校までの教育の基本的スキルとして認識され、標準カリキュラム

に組み入れられる必要がある。

3. ビッグデータと差別

自動的に 終決定を下ろす技術は不透明で、平均的な個人が理解することは非常に難し

い。しかし、こうした技術は重要さを増し、医療、教育、雇用、信用、モノとサービス

の個人利用に関する文脈で利用されている。状況と技術のこの組み合わせは、自動決定

プロセスの結果として生まれる差別が、それが意図的であろうとなかろうと、発見、判

断、是正できることを確実にする方法に関して難しい問題を提起している。ビッグデー

タ、差別、市民的自由について全国的な協議を開始する必要がある。

連邦政府は、米国の法律と価値に矛盾する差別を助長するビッグデータの潜在力に注意

を払わなければならない。

提言: 公民権と消費者保護に関連する、司法省、連邦取引委員会、消費者金融保護

局(Consumer Financial Protection Bureau)、平等雇用機会委員会(Equal

Employment Opportunity Commission)を含めた連邦機関は、保護を受けている階

層に差別的影響を与えるビッグデータの分析によって促進される慣行と結果を識別

し、法律違反を調査して解決するプランを確立できるように、技術的な専門知識を拡

大しなければならない。対処すべき潜在的な懸念を評価するとき、政府機関は、デー

タの種類、収集の文脈、特別な注意が必要な住人区分、たとえば、ゲノム情報や障害

者情報を考慮することができる。

消費者は、モノとサービスに提供された価格が別の人に提供された価格と故意に異なっ

ているかどうかを知りたいと思うのが当然である。

消費者にとって、オンラインとオフラインの経験に形を与えるデータとアルゴリズムの

完全なパラメータで自分が表されるとはにわかに信じがたい。しかし、消費者の経験が

その個人情報に基づいて変更されているとき、特に、消費者が予測していないような状

況で企業が差別的な価格を提供する場合、たとえば、航空券の価格をWebベースの検索

エンジンで比較するときや、大手小売店のオンライン店舗を訪れるときなど、ある程度

の透明性があることが適切である。大統領経済諮問委員会(President’s Council of

Economic Advisers)は、オンラインとオフラインの両方で広がる差別的な価格設定慣

行と市場の効率的な運営に与える影響を調査し、新しい慣行が消費者に対する公正さを

保証するのに必要かどうかを検討しなければならない。

73

市民的自由の強化に利用できるデータ分析

差別を可能にするこの同じビッグデータの技術は、グループが自らの権利を主張するこ

とを助けることもできる。相関的能力とデータマイニング能力を適用すると、差別の例

を識別して経験的に確認し、被った被害の特徴を明らかにすることができる。連邦政府

の公民権関連機関は公民権団体と協力し、 も被害を受けやすいコミュニティが公正に

扱われることを保証する目的で、ビッグデータのこの新しくて強力なツールを使用しな

ければならない。

連邦政府の消費者保護および技術の関連機関は、国民の意識を高めるために、一般向け

のワークショップを開き、こうした新しい技術の観点から、差別的慣行、つまり差別的

な価格設定慣行の可能性に関するレポートと、信用、雇用、教育、住宅、医療で規制さ

れているスコアリング慣行を取り入れるための代用スコアリングの使用に関するレポ

ートを、今後1年以内に発表しなければならない。

4. 法律執行とセキュリティ

ビッグデータは合法的に適用されれば、コミュニティをより安全にし、インフラをより

柔軟にし、国家安全保障を強化することができる。国家安全保障、国土安全、法律執行、

情報に関する機関が、完全なアカウンタビリティ、監視、関連するプライバシー要件を

遵守しながら、ビッグデータの技術の積極的な実験と合法的な応用を続行することが重

要である。

電気通信におけるプライバシー保護法(ECPA)の改正

提言: 議会は、オンラインのデジタルコンテンツの保護基準が物理的世界で提供さ

れている保護基準と矛盾しないことを保証するために、未読の電子メールや一定の年

齢に関する時代遅れの区別を取り除くことを含め、ECPAを改正しなければならない。

法律執行機関による予測的分析の使用は、引き続き慎重な政策見直しの対象にならなけ

ればならない。

断定された犯罪調査の文脈の外で法律執行機関が行うデータ分析は、個人のプライバシ

ーと市民の自由のための適切な保護と共に利用されることが も重要である。無罪の推

定は、米国の刑事司法制度の基礎を成す。憲法で定められている言論の自由と結社の自

由の権利が脅かされる影響を回避するために、国民はこうしたプログラムの存在、実施、

効果を十分認識していなければならない。

プライバシーとデータ慣行の専門知識を備えた連邦機関は、ビッグデータの技術の活用

を求めている州、地方、その他の連邦法執行機関に技術支援を提供しなければならない。

74

法律執行機関は、ビッグデータの監視技術に関する連邦補助金がそうした技術の責任あ

る使用をどのように促進できるのかについて引き続き調査しなければならない。そして、

優良事例を追跡、識別、促進するために、州および地方レベルの法執行において、ビ

ッグデータの試験的実施の全国的な記録確立の潜在的な有用性についても、同じように

引き続き調査しなければならない。技術的リーダーと専門家を備えた連邦機関は、プラ

イバシーに関する連邦機関を促進するための技術的スキルの開発を助けるために、プラ

イバシー保護技術の開発の進捗状況を来年報告しなければならない。

合法的に取得した商業的データの政府による使用が、市民の価値と両立することを確実

にするための評価

犯罪容疑者に対して基本的な商業的記録を調査するという長年にわたる慣行を認める

連邦政府は、ビッグデータの技術を用いるサービスの使用に重点を置き、プライバシー

と市民的自由に対して適切な管理と保護を取り入れることを保証しながら、米国市民に

関して商業的に利用できるデータの利用について調査を引き受けなければならない。

連邦機関は、データの管理された利用と安全な保管を確実にする助けとなる制度上の取

り決めとメカニズムに対して、 優良事例を導入しなければならない。

国土安全保障省、情報機関、国防省は、プライバシー保護技術と個人データを扱うため

の政策で他の機関をリードしている。公共セクターの他の機関は、プライバシー、市民

権、市民的自由のために組み入れられた保護措置を提供するために、特に使用制限を強

化するデータのタグ付け、アクセス管理方針、不変の監査といったいずれの慣行も、自

らのデータベースおよびデータ慣行と統合できるかどうかについて評価しなければな

らない。

サイバーセキュリティを強化するために、ビッグデータ分析と情報共有を使用

米国経済を主導し、公衆安全を保ち、国の安全を守るネットワークの保護は、国土防衛

の重要なミッションとなった。サイバーセキュリティと重要なインフラ保護のための計

画、指針、研究にビッグデータを使用するために、連邦政府が民間セクターのパートナ

ーと協力することは、特にサイバー攻撃の脅威となるデータがさらに多く共有されると

き、米国の順応性とサイバー防衛の強化に役立てることができる。脅威となる特定の情

報を共有し、それを基本とするネットワークを適切に保護する企業に対して、行政は目

標とする責任ある保護を提供する一方で、プライバシーを保護する法律をサポートし続

ける。それと同時に、公共および民間両セクターがサイバー攻撃の脅威を回避して対応

する助けとなるこの種の情報共有および分析に対し、その動機を高めて障害を抑制する

ための行政命令を引き続き使用していく。

75

5. 公的資源としてのデータ

政府データは国家資源であり、政治を効率的に進め、政府の説明義務を確実にし、経済

成長と社会財を生み出すために、個人のプライバシー、企業機密、国家安全保障を持続

して守りながら、可能な限り国民が広く利用できるようにしなければならない。つまり、

政府が膨大なデータセットを公開する新たな機会を見つけ、すべての政府機関がデー

タ・ツールと資源の連邦リポジトリーであるData.govの 大限の活用を確実にする。ビ

ッグデータは、公共サービスの提供を改善し、情報政策立案に新たな洞察力を提供し、

行政のあらゆるレベルで税金の効率的な使い方を高める助けになることができる。

政府データは正確で安全に保管され、可能な 大限の範囲においてオープンに利用でき

なければならない。

政府データ、特に統計と国勢調査のデータは、高水準の正確性、信頼性、機密性を規定

することにより区別される。同様に、現在国民が便利な形式で自分のデジタルデータに

簡単かつ安全にアクセスできるマイデータのイニシアティブも、個人データに関して政

府全体で可能な限り広く取り入れる必要があるアクセス容易性モデルを構成している。

すべての政府機関は、各部署でプライバシーおよび市民的自由を担当する上級職員と緊

密に協力し、任務遂行を助けるためにビッグデータをどのように活用するのかを調査し

なければならない。

先進的なデータ分析を幅広く利用してこなかった機関は、自分たちとサービスの提供を

受ける市民にとってビッグデータが意味することを十分に重視しなければならない。そ

して、試験的プロジェクトを試み、内部の適性能力を開発し、可能であれば研究開発を

拡張しなければならない。そうした機関はプライバシーおよび市民的自由を担当する上

級職員と緊密に協力し、 も早い段階からこうしたプロジェクトを確立しなければなら

ない。

とりわけビッグデータ分析は、行政サービスの提供において米国市民が価値と業績を高

めるための重要な機会を提示する。ビッグデータは、無駄、詐欺、濫用を検出して対処

することで税金の節約と国民の信頼の改善につながる大きな力も持っている。ビッグデ

ータは、政府機関全体を通した高い業績の識別をさらに助けることができる。識別され

た業績の良い機関の慣行は同様の機関とプログラムに取り入れることができ、効果的な

公共セクター管理に新たな見通しを提供できる場合がある。

我々はプライバシー強化技術の研究開発に対する投資を劇的に増やし、コンピュータサ

イエンスと数学ばかりでなく、社会科学、コミュニケーション、法的分野を含めた横断

的な研究を促進しなければならない。

76

行政は、米国市民の生活を向上させるためにビッグデータの分析が 大限の影響を与え

ることができる分野を識別する努力を主導し、データ科学者が社会的、倫理的、政策的

知識を広めることを奨励しなければならない。そのため、科学技術政策局(Office of

Science and Technology Policy)は、さまざまな機関の専門家と協力し、たとえば都市

情報科学で市民に大きな利益を約束する領域の識別作業を実施し、適切な配慮と資源を

与える方法を評価しなければならない。

基本的な研究が有望な領域には、データ来歴(data provenance)、再識別、コード化

があるが、消費者に即座に展開できるlab-to-market(訳注:アイデアをビジネスにつな

げる)ツールに重点を置くことも我々は奨励している。拡大しつつあるデータの骨組み

と、政策の重要な価値を技術的インフラにコード化できる社会科学者が必要になるため、

科学的知識と技術を社会および倫理の文脈で教えることを強調した科学技術研究

(Science and Technology Studies)といった分野での投資と、データ科学者とエンジ

ニアが自分の作業の幅広い社会的影響に習熟するためのモジュール・コースの授業を

我々は支援する。

77

付 録

索 引

A. 方法論

B. 利害関係者との会合

C. 学術シンポジウム

D. PCAST レポート

E. 情報の公開要求

F. ホワイトハウスのビッグデータ・アンケート

A. 方法論

この 90 日間の調査は、オバマ大統領が 2014 年 1 月 17 日に信号情報収集の調査に関して

言及した際に公表された。大統領は John Podesta 大統領補佐官に対し、「ビッグデータに

固有の課題に公民両セクターはどのように取り組んでいるのか、そして、ビッグデータを

管理する方法について我々は国際的規範を確立することができるのか、プライバシーとセ

キュリティの両方と両立する方法でどのように情報の自由流通を引き続き促進できるの

か」を調査するよう命じた。同補佐官は Penny Pritzker 商務長官、Ernie Moniz エネルギー

長官、John Holdren 科学技術政策局長、Jeffrey Zients 国家経済会議議長を含む政府高官の

作業グループを指揮した。そして、Nicole Wong、R.David Edelman、Christopher Kirchhoff、

Kristina Costa が中心になってこの報告書を作成した。作業グループはその審議状況を知ら

せるために、ビッグデータの技術的進化の影響についての幅広い公開討論を開始した。

この調査の過程で作業グループはホワイトハウスでブリーフィングを開き、産業、学会、

市民団体、連邦政府から数百名に上る利害関係者と会談した。こうしたブリーフィングを

通して意見交換できた主要な利害関係者は、プライバシーおよび市民的自由の権利擁護団

体、科学および統計機関、データ保護に関する国際機関、情報機関、法執行機関、プライ

バシーとインターネットの社会的・技術的局面を研究する主要な学術機関、医療従事者お

よび医療団体幹部、金融業界、情報サービス産業である。ブリーフィングと参加者の完全

なリストは、付録のセクション B に含まれている。

一般からさらに意見を聞くために、ホワイトハウスの科学技術政策局は、マサチューセッ

ツ工科大学、ニューヨーク大学、カリフォルニア大学バークレー校での会議を支援した。

こうした会議には、同補佐官と Pritzker 商務長官を含む政府高官が、政策専門家、学者、ビ

ジネス界代表者、非営利団体代表者とともに参加した。これらの会議の詳細と参会者のリ

ストは、セクション C に含まれている。

78

作業グループはまた、文面による意見を収集するために連邦官報(Federal Register)に告

示を行い、オンラインで一般意見を聞くために whitehouse.gov のプラットフォームを使用

した。この作業の詳細は、セクションEとFに含まれている。

B. 利害関係者との会合

Acxiom アクシオム

Adobe アドビ

Allstate オールステート

Ally Financial アリー・フィナンシャル

Amazon アマゾン

American Association of Advertising Agencies アメリカ広告業協会

American Association of Universities アメリカ大学協会

American Civil Liberties Union アメリカ自由人権協会

Apple アップル

AppNexus

Archimedes Incorporated アルキメデス

Asian Americans Advancing Justice (アジア系米国市民人権団体)

Association of National Advertisers 全米広告主協会

Athenahealth アテナヘルス

Bank of America バンクオブアメリカ

BlueKai

Bureau of Consumer Protection 消費者保護局

Canadian Interim Privacy Commissioner カナダ暫定プライバシー委員

Capital One キャピタルワン

Carnegie Mellon University カーネギーメロン大学

Cato Institute ケイトー研究所

Census Bureau 国政調査局

Center for Democracy & Technology 民主主義と技術のためのセンター

Center for Digital Democracy デジタル民主主義センター

Center for National Security Studies 国家安全保障センター

Central Intelligence Agency 中央情報局(CIA)

ColorOfChange カラー・オブ・チェンジ

Computer Science and Artificial Intelligence Laboratory, MIT マサチューセッツ工科大学コ

ンピュータ科学・人工知能研究所

comScore コムスコア

79

Corelogic コアロジック

Cornell University コーネル大学

Council of Better Business Bureaus ビジネス改善協会(CBBB)

Datalogix データロジック

Department of Commerce, General Counsel 商務長長官

Department of Homeland Security 国土安全保障省

Digital Advertising Alliance デジタル広告連合

Direct Marketing Association 米国ダイレクト・マーケティング協会

Discover ディスカバー

Drug Enforcement Administration 麻薬取締局

Duke University School of Law デューク大学ロースクール

Dutch Data Protection Authority オランダデータ保護局

Economics and Statistics Administration アメリカ合衆国商務省経済統計局

Electronic Frontier Foundation 電子フロンティア財団

Electronic Privacy Information Center 電子プライバシー情報センター

Epsilon エプシオン

European Union Data Protection Supervisor 欧州連合データ保護監視官局

European Commission: Directorate-General for Justice (Data Protection Division) 欧州委

員会司法総局(データ保護)

Evidera

Experian エクスペリアン

Explorys

Facebook フェイスブック

Federal Bureau of Investigation 連邦捜査局(FBI)

Federal Telecommunications Commission, Bureau of Consumer Protection 連邦通信委員

会 消費者保護局

Financial Services Roundtable 金融サービスラウンドテーブル

Free Press フリープレス

French National Commission on Informatics and Liberty

Future of Privacy プライバシーの未来

George Washington University ジョージ・ワシントン大学

Georgetown University Law Center ジョージタウン大学ローセンター

GNS Health care GNS ヘルスケア

Google グーグル

GroupM グループ M

Harvard University ハーバード大学

80

Humedica ヒューメディカ

IBM Health care IBM ヘルスケア

IMS Health IMS ヘルス

Infogroup インフォグループ

Interactive Advertising Bureau インタラクティブ広告協会

International Association of Privacy Professionals 国際プライバシープロフェッショナル

協会

Jenner & Block LLP ジェナー&ブロック LLP

Lawrence Berkeley National Laboratory ローレンス・バークレー国立研究所

Lawrence Livermore National Laboratory ローレンス・リバモア国立研究所

LexisNexis レクシスネクシス

LinkedIn リンクトイン

Massachusetts Institute of Technology マサチューセッツ工科大学

Massachusetts Institute of Technology Media Lab マサチューセッツ工科大学メディアラ

MasterCard マスターカード

Mexican Data Privacy Commissioner メキシコデータプライバシーコミッショナー

Microsoft マイクロソフト

National Association for the Advancement of Colored People 全米黒人地位向上委員会

National Economic Council 国家経済会議

National Hispanic Media Coalition 全米ヒスパニックメディア連合

National Oceanic and Atmospheric Administration アメリカ海洋大気庁

National Organization for Women 全米女性連盟

National Security Agency 国家安全保障局

National Telecommunications and Information Administration 電気通信情報局

National Urban League Policy Institute 全米都市連盟 政策研究所

NaviMed Capital

Network Advertising Initiative ネットワーク広告イニシアティブ

Neustar

Office of Chairwoman Edith Ramirez エディス・ラミレス委員長室

Office of Science and Technology Policy 科学技術政策局

Office of the Director of National Intelligence 国家情報長官室

Office of the National Coordinator for Health Information Technology 国家医療 IT 調整官室

Ogilvy オグルヴィ

Open Society Foundations オープンソサエティ財団

Open Technology Institute オープン技術研究所

81

Optum Labs

PatientsLikeMe

Princeton University プリンストン大学

Privacy Analytics プライバシー・アナリティクス

Public Knowledge パブリック・ナレッジ

Quantcast

Robinson & Yu LLC ロビンソン&ユーLLC

SalesForce セールスフォース

The Brookings Institution ブルッキングス研究所

The Constitution Project 憲法プロジェクト

The Leadership Conference on Civil and Human Rights 公民権・人権指導者会議

UK Information Commissioner 英国情報長官

University of Maryland メリーランド大学

University of Virginia バージニア大学

Visa ビザ

Yahoo! ヤフー

Zillow

82

C. 学術シンポジウム

ビッグデータとプライバシーに関するワークショップ:技術と慣行の 高水準の向上

マサチューセッツ工科大学 (MIT)

マサチューセッツ州ケンブリッジ

2014 年 3 月 3 日

挨拶: L. Rafael Reif(マサチューセッツ工科大学学長)

基調講演: John Podesta(大統領補佐官)

基調講演: Penny Pritzker(商務長官)

プライバシー保護の 新技術: Cynthia Dwork(マイクロソフト)

パネルセッション 1: ビッグデータの機会と課題

座長: Daniela Rus(マサチューセッツ工科大学)

Mike Stonebraker(マサチューセッツ工科大学)

John Guttag(マサチューセッツ工科大学)

Manolis Kellis(マサチューセッツ工科大学)

Sam Madden(マサチューセッツ工科大学)

Anant Agarwal(edX)

パネルセッション 2: プライバシー強化技術

座長: Shafi Goldwasser

Nickolai Zeldovich(マサチューセッツ工科大学)

Vinod Vaikuntanathan(マサチューセッツ工科大学 助教授)

Salil Vadhan(ハーバード大学)

Daniel Weitzner(マサチューセッツ工科大学)

パネルセッション 3: 大規模分析ケーススタディのラウンドテーブルディスカッション

モデレーター: Daniel Weitzner

Chris Calabrese(アメリカ自由人権協会)

John DeLong(アメリカ国家安全保障局)

Mark Gorenberg(Zetta Venture Partners)

David Hoffman(インテル)

Karen Kornbluh(ニールセン)

Andy Palmer(KOA Lab)

James Powell(トムソンロイター)

Latanya Sweeney(ハーバード大学)

Vinod Vaikuntanathan(マサチューセッツ工科大学)

結びの挨拶: Maria Zuber(マサチューセッツ工科大学)

83

「ビッグデータ」の社会的、文化的、倫理的特質

Data & Society Research Institute およびニューヨーク大学 (NYU)

ニューヨーク州ニューヨーク

2014 年 3 月 17 日

イントロダクション: danah boyd(Data & Society)

談話: John Podesta(大統領補佐官)

基調講演: Penny Pritzker(商務長官)

プライバシー保護の 新技術: Cynthia Dwork(マイクロソフト)

ディスカッション内容

Tim Hwang: 認知セキュリティについて

Nick Grossman: レギュレーション(Regulation) 2.0

Nuala O’Connor: 日常生活におけるデジタルな自己と技術

Alex Howard: 第二の機械化時代におけるデータ・ジャーナリズム

Mark Latonero: ビッグデータと人身売買

Corrine Yu: ビッグデータ時代のための市民権の原則

Natasha Schüll: 利益のための追跡、保護のための追跡

Kevin Bankston: ビッグデータの中の 大データ

Alessandro Acquisti: プライバシーの経済学(とビッグデータ)

Latanya Sweeney: 透明性が信頼を生む

Deborah Estrin: 個人+個人データ(You + Your Data)

Clay Shirky: デジタル・スケール公開討論に関するアナログサム(Analog Thumbs on

Digital Scales Open Discussion)

司会: danah boyd および Nicole Wong

ワークショップ

データ・サプライチェーン

推論と前後関係

人間行動の予測

アルゴリズムのアカウンタビリティ

誤った解釈

不公正と不均斉

公開総会

挨拶: danah boyd(Data & Society)

ビデオ講演: John Podesta(大統領補佐官)

基調講演: Nicole Wong(科学技術政策局 高技術責任者代理)

総会の挨拶

84

Kate Crawford(マイクロソフトリサーチ、MIT)

Anil Dash(Think Up and Activate) (司会)

Steven Hodas(ニューヨーク市教育局)

Alondra Nelson(コロンビア大学)

Shamina Singh(マスターカード包括的成長(Inclusive Growth)センター)

85

ビッグデータ:価値とガバナンス

カリフォルニア大学バークレー校

カリフォルニア州バークレー

2014 年 4 月 1 日

挨拶: Dean AnnaLee Saxenian(カリフォルニア大学バークレー校 情報大学院)

挨拶: Nicole Wong(科学技術政策局 高技術責任者代理)

パネルセッション 1: 危機に瀕した価値、緊張の中の価値:プライバシーとその先

司会: Deirdre Mulligan(カリフォルニア大学バークレー校情報大学院)

Amalia Deloney(Center for Media Justice)

Nicole Ozer(Northern California ACLU)

Fred Cate(インディアナ大学)

Kenneth A. Bamberger(カリフォルニア大学バークレー校法科大学院)

パネルセッション 2: 医療と教育における新たな機会と課題

司会: Paul Ohm(コロラド大学ロースクール)

Barbara Koenig(カリフォルニア大学サンフランシスコ校)

Deven McGraw(民主主義と技術のためのセンター)

Scott Young(カイザー・パーマネンテ)

Zachary Pardos(カリフォルニア大学バークレー校情報大学院)

パネルセッション 3: アルゴリズム:透明性、アカウンタビリティ、価値、判断の自由

司会: Omer Tene(国際プライバシープロフェッショナル協会)

Ari Gesher(Palantir)

Lee Tien(電子フロンティア財団)

Seeta Gangadharan(ニュー・アメリカ財団)

Thejo Kote(Automatic)

James Rule(カリフォルニア大学バークレー校)

ガバナンスに関する討論会

司会: David Vladeck(ジョージタウン大学ロースクール)

Julie Brill(連邦取引委員会)

Erika Rottenberg(リンクトイン)

Cameron Kerry(マサチューセッツ工科大学メディアラボ)

Cynthia Dwork(マイクロソフトリサーチ)

Mitchell Stevens(スタンフォード大学)

Rainer Stentzel(ドイツ内務省)

結びの挨拶: John Podesta(大統領補佐官)

86

D. PCAST レポート

オバマ大統領は、変化しつつある技術的背景に対処するために、大統領科学技術諮問委員

会(PCAST)に対し、ビッグデータとプライバシーが交差する技術的特質を評価する調査

を並行して進めるよう要請した。作業に関する PCAST の部分的な声明は以下のとおりであ

る。

「PCAST は、ビッグデータと個人のプライバシーが交差する部分について、関連

する技術的能力とプライバシー問題の、現在の状態と将来考えられる状態の両方

に関して技術側面を調査する。

関連するビッグデータは、個人からまたは個人に関して、政府、民間企業、その

他の個人を含めた主体者によって収集されるかその可能性のあるデータおよびメ

タデータである。そこには、所有権のあるデータと自由に利用できるデータの他

にも、その他の活動(たとえば、環境モニタリングや「モノのインターネット」

など)の間に偶然または付随的に収集された個人関連データも含まれる。」

PCAST の調査は、ビッグデータに関する 90 日間の調査と同時に実施された。PCAST は調

査を知らせるために、その予備的な結論を作業グループと共有した。 終的な PCAST レポ

ートは、政府の Web サイト(whitehouse.gov/bigdata)と PCAST の Web サイト

(whitehouse.gov/administration/eop/ostp/pcast)から入手できる。

E. 情報の公開要求

この報告書を可能な限り包括的にする努力の一環として、政府科学技術政策局(OSTP)は、

ビッグデータがプライバシー、経済、公共政策に影響する可能性がある方法について、一

般から意見を求める情報要求(Request for Information、RFI)を発表した。RFI は 2014 年

3 月 4 日に公開され、2014 年 4 月 4 日までに非営利団体、企業、大学、一般市民から 76

件の意見が提出された。回答者の完全なリストを以下に掲載する。回答者の全文は

whitehouse.gov/bigdata から入手できる。

回答者への RFI の5つの質問

(1) ビッグデータの収集、保管、分析、利用が公共政策に与える影響には何があり

ますか?たとえば、消費者のプライバシー保護とデータの政府利用のための現在

の米国の政策枠組みとプライバシー提案は、ビッグデータ分析から生じる問題に

適切に対処していますか?

(2) 政府のさらなる行動、資金援助または研究で成果や生産性がある程度改善でき

るようなビッグデータの利用とはどのようなタイプですか?公共政策で も強い

懸念を生むビッグデータの利用とはどのようなタイプですか?政府そして/または

87

一般がもっと注意すべき特定の分野または利用タイプはありますか?

(3) ビッグデータの収集、保管、分析、利用に影響する技術的傾向または主要技術

は何ですか?ビッグデータを効率的に利用しながらプライバシーを保護する特に

有望な技術または新しい慣行はありますか?

(4) ビッグデータを処理する政策枠組みまたは規制は、政府と民間セクターでどの

ように異なるべきですか?主体者のタイプと利用のタイプに関して具体的に記し

てください(たとえば、法の執行、政府サービス、商業、学術、研究など)

(5) 現在の国際法、規制または規範の妥当性など、ビッグデータの利用で司法権に

どのような問題が生じますか?

RFI の参照先:

http://www.gpo.gov/fdsys/pkg/FR-2014-03-04/pdf/2014-04660.pdf.

回答者:

Access アクセス

American Civil Liberties Union アメリカ自由人権協会

Ad Self-Regulatory Council, Council of Better Business Bureaus 広告自主規制協

議会 ビジネス改善協会(CBBB)

Annie Shebanow

The Architecture for a Digital World and Advanced Micro Devices

Association for Computing Machinery 計算機械学会(ACM)

Association of National Advertisers 全米広告主協会

Brennan Center for Justice ブレナン公正センター

BSA | The Software Alliance ビジネスソフトウェアアライアンス(BSA)

Center for Democracy and Technology 民主主義と技術のためのセンター

Center for Data Innovation データイノベーションセンター

Center for Digital Democracy デジタル民主主義センター

Center for National Security Studies 国家安全保障センター

Cloud Security Alliance クラウドセキュリティアライアンス

Coalition for Privacy and Free Trade プライバシーと自由貿易連盟

Common Sense Media コモンセンスメディア(メディアレビュー団体)

Computer and Communications Industry Association コンピュータ通信産業協会

Computing Community Consortium

Constellation Research

88

Consumer Action 消費者活動

Consumer Federation of America アメリカ消費者連合

Consumer Watchdog コンシューマーウォッチドッグ(消費者団体)

Dell デル

Direct Marketing Association 米国ダイレクト・マーケティング協会

Dr. Tyrone W A Grandison

Dr. A. R. Wagner

Durrell Kapan

Electronic Frontier Foundation 電子フロンティア財団

Electronic Transactions Association 電子取引協会(ETA)

Entity エンティティ

Federation of American Societies for Experimental Biology 米国実験生物学会連

合会(FASEB)

Financial Services Roundtable 金融サービスラウンドテーブル

Food Marketing Groups フードマーケティンググループ

Frank Pasquale, UMD Law

Fred Cate(マイクロソフト、オクスフォード大インターネット研究所)

Future of Privacy Forum プライバシーの未来フォーラム

Georgetown University ジョージタウン大学

Health care Leadership Council ヘルスケアリーダーシップ研究会

IMS Health IMS ヘルス

Information Technology Industry Council 米国情報技術工業協議会

Interactive Advertising Bureau インタラクティブ広告協会

Intrical

IT Law Group

Jackamo

James Cooper, George Mason Law(ジョージ・メイソン大学ロースクール)

Jason Kint

Jonathan Sander, STEALTHbits

Kaliya Identity Woman

Leadership Conferences on Civil and Human Rights & Education 公民権・人権教

育指導者会議

Making Change at Walmart 「ウォルマートに変化を」

Marketing Research Association 市場調査協会

Mary Culnan, Bentley University & Future of Privacy Forum(ベントリー大学、プ

ライバシーの未来フォーラム)

89

McKenna Long & Aldridge LLP マッケンナロング&アルドリッジ LLP

mediajustice.org

Microsoft マイクロソフト

Massachusetts Institute of Technology マサチューセッツ工科大学

MITRE Corporation

Mozilla モジラ

New York University Center for Urban Science & Progress ニューヨーク市立大学

Online Trust Alliance オンライントラスト・アライアンス

Pacific Northwest National Laboratory パシフィック・ノースウェスト国立研究所

Peter Muhlberger

Privacy Coalition

Reed Elsevier リード・エルセビア

Sidley Austin LLP シドリーオースティン LLP

Software & Information Industry Association ソフトウェアおよび情報産業協会

(SIIA)

TechAmerica テックアメリカ

TechFreedom テックフリーダム

Technology Policy Institute 技術政策研究所

The Internet Association インターネット協会

U.S. Chamber of Commerce 米国商工会議所

U.S. Leadership for the Revision of the 1967 Space Treaty 米国主導の 1967 宇宙

条約改訂

U.S. PIRG 米国公共利益調査グループ

VIPR Systems

World Privacy Forum 国際プライバシーフォーラム

90

F. ホワイトハウスのビッグデータ・アンケート

政府は電子メールとソーシャルメディアを使ってビッグデータとプライバシー問題に関す

る補足的公開アンケートを通知し、WhiteHouse.gov に掲載されたショート Web フォーム

に回答するよう要請した。一般からの回答を受け付けた4週間で 2 万 4,092 件の意見が提

出された。しかし、このプロセスは一般から意見を集める手段であり、データのプライバ

シーに関する意見の統計的な代表的調査と見なすべきではないことを指摘することは重要

である。ホワイトハウスは、アンケートフォームに回答者の名前や連絡先を提出する項目

を含めなかった。

回答者は、ビッグデータ利用慣行について大きな懸念を表明した。特に活発な意見が寄せ

られたのは、データ利用慣行の適切な透明性と監視を確実にすることであった。こうした

分野のそれぞれで回答者の 80%以上が非常に強い懸念を示したが、 も懸念の弱かった分

野(位置データの収集)でさえ、61%がこの慣行についての懸念を「非常に強い」と答え

ている。これとは対照的に、特定の主体者に対する回答者の意見はかなり微妙な差が見ら

れた。回答者の大半は、情報機関と法執行機関を「まったく信用していない」と答えたが、

連邦と地方の両レベルの政府機関に対する意見は、これよりはるかに肯定的であった。さ

らに、回答者の大多数は、法律事務所、医療機関、学術機関がどのようにビッグデータを

利用して処理するのかについておおむね信頼している。

このアンケート結果を総合すると、回答者は情報機関と法執行機関がどのように個人関連

データを収集して利用するかについて、特にこうした慣行を明確に把握できないときに

も強く懸念している。これが示唆しているのは、政府は情報機関の慣行について可能であ

れば透明性を引き上げ、収集されたデータができる限り安全に保管されることを市民に納

得させ、適切な法律制度と監視を強化するために作業しなければならないということであ

る。

このアンケートに関する詳細は、http://www.whitehouse.gov/bigdata で閲覧できる。

BIG DATA: SEIZING OPPORTUNITIES,

PRESERVING VALUES

ビッグデータ: 機会を逃さず、価値を守る

平成26年9月発行 Ver 0.2

原著者 Executive Office of the President

翻訳 次世代パーソナルサービス推進コンソーシアム

一般社団法人情報処理学会

発行 次世代パーソナルサービス推進コンソーシアム

(事務局:一般財団法人日本情報経済社会推進協会)

東京都港区六本木 1-9-9 六本木ファーストビル内

TEL 03(5860)7558