李世 。 大數據 - future.cwgv.com.tw · 嗶嗶嗶!資料搜尋中⋯⋯...

3
0100100101001001010010010100100101001001010010010100100101001001010010010100100 1010010010100100010011110000100111100001001111000010011110000100111100001001111 0000100111100011110000101010001000100111100001001111000010011110000100111100001 001111000010011110000100111100011110000101010100010001001111000010011110000100 111100001001111000010011110000100111100001001111000100010011110000100111100001 001111000010011110000100111100001001111000010011110001000100111100001001111000 0100111100001001111000010011110000100111100001001110100100101001001010010010100 1001010010010100100101001001010010010100100101001001010010010100100010011110000 1001111000010011110000100111100001001111000010011110000100111100011110000101010 0010001001111000010011110000100111100001001111000010011110000100111100001001111 0001111000010101010001000100111100001001111000010011110000100111100001001111000 0100111100001001111000100010011110000100111100001001111000010011110000100111100 0010011110000100111100010001001111000010011110000100111100001001111000010011110 0001001111000010011101001001010010010100100101001001010010010100100101001001010 0100101001001010010010100100101001000100111100001001111000010011110000100111100 0010011110000100111100001001111000111100001010100010001001111000010011110000100 1111000010011110000100111100001001111000010011110001111000010101010001000100111 1000010011110000100111100001001111000010011110000100111100001001111000100010011 1100001001111000010011110000100111100001001111000010011110000100111100010001001 1110000100111100001001111000010011110000100111100001001111000010011101001001010 0100101001001010010010100100101001001010010010100100101001001010010010100100101 0010001001111000010011110000100111100001001111000010011110000100111100001001111 0001111000010101000100010011110000100111100001001111000010011110000100111100001 0011110000100111100011110000101010100010001001111000010011110000100111100001001 1110000100111100001001111000010011110001000100111100001001111000010011110000100 1111000010011110000100111100001001111000100010011110000100111100001001111000010 0111100001001111000010011110000100111010010010100100101001001010010010100100101 0010010100100101001001010010010100100101001001010010001001111000010011110000100 1111000010011110000100111100001001111000010011110001111000010101000100010011110 0001001111000010011110000100111100001001111000010011110000100111100011110000101 0101000100010011110000100111100001001111000010011110000100111100001001111000010 0111100010001001111000010011110000100111100001001111000010011110000100111100001 0011110001000100111100001001111000010011110000100111100001001111000010011110000 1001110100100101001001010010010100100101001001010010010100100101001001010010010 有國家可以預測流感 擴散路徑,搶先一步 防堵。直到Google 程師利用搜尋紀錄, 史無前例,成功預言流 感如何蔓延。 首先,工程師們分 析全美國過去幾年的熱 門關鍵字,找到四十五個 與流感「高度相關」。所 謂高度相關,意思是:只 要某地民眾大量搜尋這些 字(例如:止咳、發燒), 當地很快就會爆發流感。 接著,他們查看當下美國哪些城鎮, 正在大量搜尋這些「流感關鍵字」,藉此 推測流感即將擴散到那些地區,準確率高 得驚人!原本看似無用的搜尋資料庫,搖 身一變,成為「可以說預言」的寶庫。 「用關鍵字就能說預言?大數據好神 啊!可是,以前怎麼沒聽過?」因為大數 據要能說預言,必須各個條件都到位。 大數據,怎麼誕生? 「這張貓咪照 片好好笑,按個 讚!」你我每天都 在網路上製造大量「數位痕跡」。例如, Google 每天接收超過30 億筆搜尋,臉書 每分鐘產生68 萬則文章、 3000 張照片, Youtube每一秒多出數百小時的影片⋯⋯ 這麼龐大的數位資料,主要歸功於現 代的超級電腦,無論「腦容量」或「心算 速度」都愈來愈強大,能快速儲存、處理 巨量資料。另一方面,電腦愈做愈小,小 「下一波流感要來了?」 「我將來會不會出國留學?」 「這個人會犯罪嗎?」 嗶嗶嗶!資料搜尋中⋯⋯ 想要洞察人心、預言未來?問 問「大數據」。大數據,是指非常非常龐 大的數位資料,必須動用數十、數百、甚 至數千台超級電腦,才能儲存和處理。 「大數據?我上網Google一下⋯⋯」 嘿嘿,你我常用的Google搜尋引擎,就是 大數據的著名運用。只要打入關鍵字, Google就會從全世界的網頁資料庫, 快速「撈出」最可能的答案給你。 「可是資料不都是過去的紀 錄,怎麼能預言未來呢?」問得好! 讓我們從一場流行性感冒說起⋯⋯ 預言流感蔓延 2009年冬天,H1N1流行性感冒在墨 西哥爆發,短短數週,蔓延到全球。最 後,這場流感甚至感染了上百萬人。 流感為什麼無法擋?原因之一,是沒 達志影像 醫生發現流感 , 一筆一筆通知 主管機關 。 花很多時間輸入 、 分析資料 。 等到確定疫區 , 至少已慢了兩週 。 工程師用搜尋資料庫預 測流感蔓延路徑 。 及時通知 相關單位 。 可以預防 流感蔓延 。 Global Kids 2016.05 73 72 未來少年 2016.05 會說預言的 撰文‧企編/黃曉君 繪圖‧版面/夏綠蒂 AlphaGo又贏了!」今年三 月,圍棋程式AlphaGo,打敗世 界頂級圍棋高手李世 ,堪稱人 工智慧的重大突破。AlphaGo功的關鍵之一就是大數據。 科學家剛開始發展人工智 慧,是 從 歸 納 人 類 的 思 考 原 則 著手:例如下棋的訣竅。但人 類的思考太複雜,並常常出現 例外,導致電腦做得不如人 腦。後來電腦愈來愈強大, 有人靈機一動:為 什麼不讓它們自己 分析巨量資料,找 出最有可能的答 案?AlphaGo就是分 析了三千萬筆棋譜, 透過「自我學習」,找 出每一步棋怎麼下最有勝 算,戰勝了人類棋王。 大數據 右圖是可以解讀人類情 感的PEPPER機器人。人類 的情感比思想更複雜, 日本科學家利用大數 據,幫助機器人分析不 同使用者的情感和反應 的關係,讓機器人 也能善體人意。 傳統方式追蹤流感 Google預言流感 達志影像 1000010011110000100111100 0010011110000100111100001001 111000010011110001111000010101 00010001001111000010011110000100 1111000010011110000100111100001 001111000010011110001111000010 10101000100010011110000100111 1000010011110000100111100001 001111000010011110000100111 10001000100111100001001111 人工智慧,愈來愈聰明! 今年三月,圍棋程 AlphaGo戰勝世界圍 棋高手李世 ,圖中為 正在苦思下一步棋的 李世

Upload: others

Post on 11-May-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

0100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010

有國家可以預測流感

擴散路徑,搶先一步

防堵。直到Google工

程師利用搜尋紀錄,

史無前例,成功預言流

感如何蔓延。

首先,工程師們分

析全美國過去幾年的熱

門關鍵字,找到四十五個

與流感「高度相關」。所

謂高度相關,意思是:只

要某地民眾大量搜尋這些

字(例如:止咳、發燒),

當地很快就會爆發流感。

接著,他們查看當下美國哪些城鎮,

正在大量搜尋這些「流感關鍵字」,藉此

推測流感即將擴散到那些地區,準確率高

得驚人!原本看似無用的搜尋資料庫,搖

身一變,成為「可以說預言」的寶庫。

「用關鍵字就能說預言?大數據好神

啊!可是,以前怎麼沒聽過?」因為大數

據要能說預言,必須各個條件都到位。

大數據,怎麼誕生?

「這張貓咪照

片好好笑,按個

讚!」你我每天都

在網路上製造大量「數位痕跡」。例如,

Google每天接收超過30億筆搜尋,臉書

每分鐘產生68 萬則文章、 3000 張照片,

Youtube每一秒多出數百小時的影片⋯⋯

這麼龐大的數位資料,主要歸功於現

代的超級電腦,無論「腦容量」或「心算

速度」都愈來愈強大,能快速儲存、處理

巨量資料。另一方面,電腦愈做愈小,小

「下一波流感要來了?」

「我將來會不會出國留學?」

「這個人會犯罪嗎?」

嗶嗶嗶!資料搜尋中⋯⋯

想要洞察人心、預言未來?問

問「大數據」。大數據,是指非常非常龐

大的數位資料,必須動用數十、數百、甚

至數千台超級電腦,才能儲存和處理。

「大數據?我上網Google一下⋯⋯」

嘿嘿,你我常用的Google搜尋引擎,就是

大數據的著名運用。只要打入關鍵字,

Google就會從全世界的網頁資料庫,

快速「撈出」最可能的答案給你。

「可是資料不都是過去的紀

錄,怎麼能預言未來呢?」問得好!

讓我們從一場流行性感冒說起⋯⋯

預言流感蔓延

2009年冬天,H1N1流行性感冒在墨

西哥爆發,短短數週,蔓延到全球。最

後,這場流感甚至感染了上百萬人。

流感為什麼無法擋?原因之一,是沒

達志影像

醫生發現流感 ,

一筆一筆通知

主管機關 。 花很多時間輸入 、

分析資料 。

等到確定疫區 ,

至少已慢了兩週 。

工程師用搜尋資料庫預

測流感蔓延路徑 。

及時通知

相關單位 。

可以預防

流感蔓延 。

Global Kids 2016.05 7372 未來少年 2016.05

會說預言的

撰文‧企編/黃曉君 繪圖‧版面/夏綠蒂

「AlphaGo又贏了!」今年三月,圍棋程式AlphaGo,打敗世界頂級圍棋高手李世 石,堪稱人

工智慧的重大突破。AlphaGo成功的關鍵之一就是大數據。

科學家剛開始發展人工智

慧,是從歸納人類的思考原則

著手:例如下棋的訣竅。但人

類的思考太複雜,並常常出現

例外,導致電腦做得不如人

腦。後來電腦愈來愈強大,

有人靈機一動:為

什麼不讓它們自己

分析巨量資料,找

出最有可能的答

案?AlphaGo就是分析了三千萬筆棋譜,

透過「自我學習」,找

出每一步棋怎麼下最有勝

算,戰勝了人類棋王。

大數據右圖是可以解讀人類情感的PEPPER機器人。人類的情感比思想更複雜,日本科學家利用大數據,幫助機器人分析不同使用者的情感和反應的關係,讓機器人也能善體人意。

傳統方式追蹤流感Google預言流感

達志影像

01001001

0100100101001001010010010100100101001001010010010100100101001001010010010100100101001000100111

10000100111100001001111000010011110000100111100001001

11100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111

人工智慧,愈來愈聰明!

今年三月,圍棋程式AlphaGo戰勝世界圍棋高手李世 ,圖中為正在苦思下一步棋的李世 。

P072-077_特企-大數據.indd 72-73 2016/4/19 上午1:01

到可以化身為智慧型手機,甚至藏

身手錶和眼鏡,讓我們隨時隨地接

收、傳送資料。

更重要的是,網際網路把世界

各地大大小小的電腦連結起來,將

資料一點一滴匯聚,成就史上最龐

大的「資料汪洋」,而且資料持續

爆炸性成長。

當資料累積到一定程度,就不

再是用過一次就無用的「垃圾堆」,而是

能轉作其他研究的「礦場」,可以重複開

挖出許多「訊息金礦」。Google的流感關

鍵字,就是最好的例子。

但為什麼資料量夠大,資

料就能重新「開口說話」?

繼續看下去⋯⋯

更多、更雜、更真實

首先,大數據的「大」,不只

是「大量」,還代表「全部」資料。因為

愈是全面龐雜,愈能看到細節,或是轉作

其他研究,也不怕漏掉關鍵資料。為了

「大」,即使有些資料不精確也無妨。

「不對呀,資料不是愈精確愈好

嗎?」呵呵,資料精確其實是不得已的。

因為從前,人類只有能力收集小量的樣

本。比方說,你想知道今天的溫度變化,

於是每隔一小時看一次溫度計,總共記錄

二十四次。每一次測量當然要盡可能精

確,否則失誤個三、五次,影響可不小。

但溫度計如果能每分鐘自動偵測一

次,一天累積1440筆資料,相較之下,資

料更加全面,接近真實。即使有一、

二十次測量失誤,影響不大。

因果關係?先不急!

更有趣的是,大數據不急著找

因果關係,因此分析更快速,甚

至更準確。

美國有一家大賣場,從過

去幾年的銷售紀錄,分析顧

客在颱風天的購買行為,結

果發現顧客會買一種特定廠

牌的夾心餅乾。

「奇怪,颱風天買餅乾,

還要指定廠牌?」是啊,真的很

奇怪。但老闆並不急著找答案,而

是關心:下次颱風天,把這種廠牌的夾心

餅乾擺在醒目的位置,讓顧客多多購買。

在大數據世界裡,首先關心的是A和

B是否「相關」,至於A和B是不是因果

關係(例如:是否因為颱風,所以買特定

廠牌的夾心餅乾),並不影響大數據的應

用。甚至有時,人們因此跳脫了偏見,反

而看到更多的可能性⋯⋯

過去在美國,小兒科醫生照顧

目前世界上最快的超級電腦是中國的天河二號,整個系統占據了720平方公尺的大房間,運算速度達每秒5.49萬兆次,工作量相當於13億人一起用智慧型手機計算100年,總儲存量大約是750億冊10萬字的圖書資料。

Global Kids 2016.05 7574 未來少年 2016.05

未來,醫生的工作可能從「治療疾

病」,轉成「預防疾病」。

人體的一切都將可以資料化:個人的

基因、對藥物的

反應、飲食喜

好、生活作息。

人們還可穿戴各

式各樣的小型

電腦,分分秒

秒監測自己的

心跳、呼吸、

血壓、食量、

運動和一切行動,找

出個人身體變化與疾

病發生的關連性。

醫生能夠根

據龐大的個人專屬數據,預測未來可能發生

的疾病,找出最適合的預防和治療方式。例

如,提供個人化的飲食和運動建議,幫助人

們維持健康和最佳身材。

眼鏡和手錶都可能藏有小型電腦,分分秒秒監測主人的心跳、呼吸、血壓、食量、運動和一切行動。

虛擬人體

大數據也能幫助氣象學家,模擬出複雜的全球風向,增加氣象預報的準確性,以及評估全球氣候變遷。

大數據可以幫助科學家,呈現出過去有限數據所無法模擬的真實情況。上圖為科學家將大量天文觀測資料輸入超級電腦,模擬出兩個星系互相碰撞、合併的壯觀歷程。

010010010100100101001001010010010100100101001001010010010100100101001001010010010100100101001000100111100001001111000010011110000100111100001001111000010011110000100111100011110000101010001000100111100001001111000010011110000100111100001001111000010011110000100111100011110000101010100010001001111000010011110000100111100001001111000010011110000100111100001001111000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111010010010100100101001001010010010100100101001001010010010100100101001001010010010100100101001000100111100001001111000010011110000100111100001001111000

醫生正拿著病人完整的基因解碼,預測病人未來是否可能罹患遺傳疾病。過去全球科學家花了十年,才完成第一組人類基因體的解碼;但在大數據時代,任何人的基因只要幾天就能完全解碼。

達志影像

達志影像

達志影像

達志影像

達志影像

P072-077_特企-大數據.indd 74-75 2016/4/19 上午1:01

資料大神統治一切?

安德頓警長衝進馬克

斯的房子,逮捕了正在與

太太爭吵的馬克斯先生。

「根據哥倫比亞特區『預防犯

罪部』授權,你將在半小時後謀殺太

太⋯⋯」警長告知逮捕原因。等一等,馬

克斯「半小時後」才謀殺?意思是,當下

他根本沒殺人,怎麼能預先逮捕呢?

這是科幻電影《關鍵報告》的場景,

未來卻有可能成真。警方可以利用大數

據,找出每個人犯罪的可能性。在某些極

權國家,也許會演變成提前逮捕嫌犯,即

使他什麼都還

沒做。

一般人如果「迷信」大數據,完全按

照它的預言行動:讀哪一所學校、看哪些

書、做什麼工作、跟誰結婚⋯⋯等一等,

你真的要讓數據決定你的一切嗎?

無論大數據有多神,都只是推算「可

能性」,它還是會出錯,因為人類行為太

複雜多變。例如當初Google成功預測流感

後,媒體大肆報導,引發民眾好奇,頻

頻上網搜尋流感相關字。結果,大量

的「干擾」數據產生,影響資料可信

度,導致Google大神預測失準。

更重要的是,人類有自由意志,

直到最後關頭都可能改變。聰明的你,

在大數據時代,千萬別讓數據限制你的自

主能力與無窮的潛力!

早產兒時,只要嬰兒心跳平穩,醫師

便認為狀況穩定了。當先前的戒備放鬆下

來,卻常發生嬰兒病情急轉直下的悲劇。

直到一位電腦工程師,分析大量早

產兒的心跳紀錄,發現嬰兒狀況變差時,

心臟反而會平穩跳動。這才讓醫生恍然大

悟,更改醫囑,挽救了無數小生命。

因果關係並非不重要,只是當人們

急著下因果判斷,可能因資料仍不齊全,

而帶有偏見。大數據不一樣,它不但能夠

快速分析,而且盡可能讓資料「自己說

話」,往往更接近真實情況。

聆聽?還是竊聽?

每一天,我們都在網路上暴露個人資

料,而且大多是自己沒察覺的。

上網搜尋關鍵字、買書、臉書打卡按

讚、跟好友互動、轉貼文章⋯⋯每個網路

上的舉動,都在洩漏你是誰?住在哪裡?

去過什麼地方?有什麼喜好?

Google、臉書和購物網站就利用這些

資料,「聆聽」你的需求,為你量身打造

個人服務。比如介紹你感興趣的文章、新

書或商品廣告。

同樣的,不法分子或獨裁政府想調查

某個人,也可以上網取得資料。因此,在

大數據時代,你必須更小心保護自己。

有人甚至主張:政府應該立法幫人們

找回「被遺忘」的權力,意思是:掌管巨

量資料的公司,必須定期刪除用戶資料。

個人教科書

Global Kids 2016.05 7776 未來少年 2016.05

上課聽不懂,卻不敢發問?未來學生上課,所有學習狀況都會被記

錄下來,讓老師及時掌握,為每個人找出最適合的教學方式。

美國史丹佛大學教授在網路開設課程,讓學生自行在家觀看教學

影片。特別的是,教授會追蹤學生觀看影片的動作:會不會按暫停、倒

帶、快轉,甚至提前關掉。

這些資料可以反應學生的學習狀況。如果學生倒帶,跳回前面的

影片重看,可能代表學生看不懂、有疑問,或者前後內容無法銜接。這

時,老師就能調整影片內容,藉此打造每個人的專屬教科書和補救教

學,達到真正的因材施教。

未來的數位學習,學生的一切學習情況都會被記錄下來,提供老師參考,為每一個人量身打造最適合的教學方式。

達志影像

達志影像

iStock

達志影像

未來的汽車可以看成一

台能上網的電腦,加上輪子、

方向盤和沙發,因為在大數據時

代,汽車將能夠自動導航和駕駛。

人、汽車和馬路的所有情況都

可被偵測、記錄,而且及時處理。

比方說,跟周圍車輛太近,車子立

刻避開;上下班的時候,車子根據馬路傳來的資料,繞

開塞車路段,選擇最合適的路線。在城市尋找車位是很

麻煩的事情,但未來可以讓汽車自己去找停車位,等到

要離開時,主人只要提前通知汽車,

讓它過來接人即可。

自動駕駛汽車上路!

Google Map的街景車正在拍攝西班牙的街頭。只要在Google 地圖服務打上地址,就可以在螢幕上呈現出世界各地街景與建築物的360度照片。但這項服務在歐洲遭到極大反彈,人們認為Google嚴重侵犯隱私。

迷信大數據,獨裁政府就可能會利用個人大數據,推測人們犯罪的可能性,執行預先逮捕。

達志影像

P072-077_特企-大數據.indd 76-77 2016/4/19 上午1:01