李世 。 大數據 - future.cwgv.com.tw · 嗶嗶嗶!資料搜尋中⋯⋯...

Post on 11-May-2020

8 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

0100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010100100101001001010010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111100010001001111000010011110000100111100001001111000010011110000100111100001001110100100101001001010010010100100101001001010010010100100101001001010010010

有國家可以預測流感

擴散路徑,搶先一步

防堵。直到Google工

程師利用搜尋紀錄,

史無前例,成功預言流

感如何蔓延。

首先,工程師們分

析全美國過去幾年的熱

門關鍵字,找到四十五個

與流感「高度相關」。所

謂高度相關,意思是:只

要某地民眾大量搜尋這些

字(例如:止咳、發燒),

當地很快就會爆發流感。

接著,他們查看當下美國哪些城鎮,

正在大量搜尋這些「流感關鍵字」,藉此

推測流感即將擴散到那些地區,準確率高

得驚人!原本看似無用的搜尋資料庫,搖

身一變,成為「可以說預言」的寶庫。

「用關鍵字就能說預言?大數據好神

啊!可是,以前怎麼沒聽過?」因為大數

據要能說預言,必須各個條件都到位。

大數據,怎麼誕生?

「這張貓咪照

片好好笑,按個

讚!」你我每天都

在網路上製造大量「數位痕跡」。例如,

Google每天接收超過30億筆搜尋,臉書

每分鐘產生68 萬則文章、 3000 張照片,

Youtube每一秒多出數百小時的影片⋯⋯

這麼龐大的數位資料,主要歸功於現

代的超級電腦,無論「腦容量」或「心算

速度」都愈來愈強大,能快速儲存、處理

巨量資料。另一方面,電腦愈做愈小,小

「下一波流感要來了?」

「我將來會不會出國留學?」

「這個人會犯罪嗎?」

嗶嗶嗶!資料搜尋中⋯⋯

想要洞察人心、預言未來?問

問「大數據」。大數據,是指非常非常龐

大的數位資料,必須動用數十、數百、甚

至數千台超級電腦,才能儲存和處理。

「大數據?我上網Google一下⋯⋯」

嘿嘿,你我常用的Google搜尋引擎,就是

大數據的著名運用。只要打入關鍵字,

Google就會從全世界的網頁資料庫,

快速「撈出」最可能的答案給你。

「可是資料不都是過去的紀

錄,怎麼能預言未來呢?」問得好!

讓我們從一場流行性感冒說起⋯⋯

預言流感蔓延

2009年冬天,H1N1流行性感冒在墨

西哥爆發,短短數週,蔓延到全球。最

後,這場流感甚至感染了上百萬人。

流感為什麼無法擋?原因之一,是沒

達志影像

醫生發現流感 ,

一筆一筆通知

主管機關 。 花很多時間輸入 、

分析資料 。

等到確定疫區 ,

至少已慢了兩週 。

工程師用搜尋資料庫預

測流感蔓延路徑 。

及時通知

相關單位 。

可以預防

流感蔓延 。

Global Kids 2016.05 7372 未來少年 2016.05

會說預言的

撰文‧企編/黃曉君 繪圖‧版面/夏綠蒂

「AlphaGo又贏了!」今年三月,圍棋程式AlphaGo,打敗世界頂級圍棋高手李世 石,堪稱人

工智慧的重大突破。AlphaGo成功的關鍵之一就是大數據。

科學家剛開始發展人工智

慧,是從歸納人類的思考原則

著手:例如下棋的訣竅。但人

類的思考太複雜,並常常出現

例外,導致電腦做得不如人

腦。後來電腦愈來愈強大,

有人靈機一動:為

什麼不讓它們自己

分析巨量資料,找

出最有可能的答

案?AlphaGo就是分析了三千萬筆棋譜,

透過「自我學習」,找

出每一步棋怎麼下最有勝

算,戰勝了人類棋王。

大數據右圖是可以解讀人類情感的PEPPER機器人。人類的情感比思想更複雜,日本科學家利用大數據,幫助機器人分析不同使用者的情感和反應的關係,讓機器人也能善體人意。

傳統方式追蹤流感Google預言流感

達志影像

01001001

0100100101001001010010010100100101001001010010010100100101001001010010010100100101001000100111

10000100111100001001111000010011110000100111100001001

11100001001111000111100001010100010001001111000010011110000100111100001001111000010011110000100111100001001111000111100001010101000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111

人工智慧,愈來愈聰明!

今年三月,圍棋程式AlphaGo戰勝世界圍棋高手李世 ,圖中為正在苦思下一步棋的李世 。

P072-077_特企-大數據.indd 72-73 2016/4/19 上午1:01

到可以化身為智慧型手機,甚至藏

身手錶和眼鏡,讓我們隨時隨地接

收、傳送資料。

更重要的是,網際網路把世界

各地大大小小的電腦連結起來,將

資料一點一滴匯聚,成就史上最龐

大的「資料汪洋」,而且資料持續

爆炸性成長。

當資料累積到一定程度,就不

再是用過一次就無用的「垃圾堆」,而是

能轉作其他研究的「礦場」,可以重複開

挖出許多「訊息金礦」。Google的流感關

鍵字,就是最好的例子。

但為什麼資料量夠大,資

料就能重新「開口說話」?

繼續看下去⋯⋯

更多、更雜、更真實

首先,大數據的「大」,不只

是「大量」,還代表「全部」資料。因為

愈是全面龐雜,愈能看到細節,或是轉作

其他研究,也不怕漏掉關鍵資料。為了

「大」,即使有些資料不精確也無妨。

「不對呀,資料不是愈精確愈好

嗎?」呵呵,資料精確其實是不得已的。

因為從前,人類只有能力收集小量的樣

本。比方說,你想知道今天的溫度變化,

於是每隔一小時看一次溫度計,總共記錄

二十四次。每一次測量當然要盡可能精

確,否則失誤個三、五次,影響可不小。

但溫度計如果能每分鐘自動偵測一

次,一天累積1440筆資料,相較之下,資

料更加全面,接近真實。即使有一、

二十次測量失誤,影響不大。

因果關係?先不急!

更有趣的是,大數據不急著找

因果關係,因此分析更快速,甚

至更準確。

美國有一家大賣場,從過

去幾年的銷售紀錄,分析顧

客在颱風天的購買行為,結

果發現顧客會買一種特定廠

牌的夾心餅乾。

「奇怪,颱風天買餅乾,

還要指定廠牌?」是啊,真的很

奇怪。但老闆並不急著找答案,而

是關心:下次颱風天,把這種廠牌的夾心

餅乾擺在醒目的位置,讓顧客多多購買。

在大數據世界裡,首先關心的是A和

B是否「相關」,至於A和B是不是因果

關係(例如:是否因為颱風,所以買特定

廠牌的夾心餅乾),並不影響大數據的應

用。甚至有時,人們因此跳脫了偏見,反

而看到更多的可能性⋯⋯

過去在美國,小兒科醫生照顧

目前世界上最快的超級電腦是中國的天河二號,整個系統占據了720平方公尺的大房間,運算速度達每秒5.49萬兆次,工作量相當於13億人一起用智慧型手機計算100年,總儲存量大約是750億冊10萬字的圖書資料。

Global Kids 2016.05 7574 未來少年 2016.05

未來,醫生的工作可能從「治療疾

病」,轉成「預防疾病」。

人體的一切都將可以資料化:個人的

基因、對藥物的

反應、飲食喜

好、生活作息。

人們還可穿戴各

式各樣的小型

電腦,分分秒

秒監測自己的

心跳、呼吸、

血壓、食量、

運動和一切行動,找

出個人身體變化與疾

病發生的關連性。

醫生能夠根

據龐大的個人專屬數據,預測未來可能發生

的疾病,找出最適合的預防和治療方式。例

如,提供個人化的飲食和運動建議,幫助人

們維持健康和最佳身材。

眼鏡和手錶都可能藏有小型電腦,分分秒秒監測主人的心跳、呼吸、血壓、食量、運動和一切行動。

虛擬人體

大數據也能幫助氣象學家,模擬出複雜的全球風向,增加氣象預報的準確性,以及評估全球氣候變遷。

大數據可以幫助科學家,呈現出過去有限數據所無法模擬的真實情況。上圖為科學家將大量天文觀測資料輸入超級電腦,模擬出兩個星系互相碰撞、合併的壯觀歷程。

010010010100100101001001010010010100100101001001010010010100100101001001010010010100100101001000100111100001001111000010011110000100111100001001111000010011110000100111100011110000101010001000100111100001001111000010011110000100111100001001111000010011110000100111100011110000101010100010001001111000010011110000100111100001001111000010011110000100111100001001111000100010011110000100111100001001111000010011110000100111100001001111000010011110001000100111100001001111000010011110000100111100001001111000010011110000100111010010010100100101001001010010010100100101001001010010010100100101001001010010010100100101001000100111100001001111000010011110000100111100001001111000

醫生正拿著病人完整的基因解碼,預測病人未來是否可能罹患遺傳疾病。過去全球科學家花了十年,才完成第一組人類基因體的解碼;但在大數據時代,任何人的基因只要幾天就能完全解碼。

達志影像

達志影像

達志影像

達志影像

達志影像

P072-077_特企-大數據.indd 74-75 2016/4/19 上午1:01

資料大神統治一切?

安德頓警長衝進馬克

斯的房子,逮捕了正在與

太太爭吵的馬克斯先生。

「根據哥倫比亞特區『預防犯

罪部』授權,你將在半小時後謀殺太

太⋯⋯」警長告知逮捕原因。等一等,馬

克斯「半小時後」才謀殺?意思是,當下

他根本沒殺人,怎麼能預先逮捕呢?

這是科幻電影《關鍵報告》的場景,

未來卻有可能成真。警方可以利用大數

據,找出每個人犯罪的可能性。在某些極

權國家,也許會演變成提前逮捕嫌犯,即

使他什麼都還

沒做。

一般人如果「迷信」大數據,完全按

照它的預言行動:讀哪一所學校、看哪些

書、做什麼工作、跟誰結婚⋯⋯等一等,

你真的要讓數據決定你的一切嗎?

無論大數據有多神,都只是推算「可

能性」,它還是會出錯,因為人類行為太

複雜多變。例如當初Google成功預測流感

後,媒體大肆報導,引發民眾好奇,頻

頻上網搜尋流感相關字。結果,大量

的「干擾」數據產生,影響資料可信

度,導致Google大神預測失準。

更重要的是,人類有自由意志,

直到最後關頭都可能改變。聰明的你,

在大數據時代,千萬別讓數據限制你的自

主能力與無窮的潛力!

早產兒時,只要嬰兒心跳平穩,醫師

便認為狀況穩定了。當先前的戒備放鬆下

來,卻常發生嬰兒病情急轉直下的悲劇。

直到一位電腦工程師,分析大量早

產兒的心跳紀錄,發現嬰兒狀況變差時,

心臟反而會平穩跳動。這才讓醫生恍然大

悟,更改醫囑,挽救了無數小生命。

因果關係並非不重要,只是當人們

急著下因果判斷,可能因資料仍不齊全,

而帶有偏見。大數據不一樣,它不但能夠

快速分析,而且盡可能讓資料「自己說

話」,往往更接近真實情況。

聆聽?還是竊聽?

每一天,我們都在網路上暴露個人資

料,而且大多是自己沒察覺的。

上網搜尋關鍵字、買書、臉書打卡按

讚、跟好友互動、轉貼文章⋯⋯每個網路

上的舉動,都在洩漏你是誰?住在哪裡?

去過什麼地方?有什麼喜好?

Google、臉書和購物網站就利用這些

資料,「聆聽」你的需求,為你量身打造

個人服務。比如介紹你感興趣的文章、新

書或商品廣告。

同樣的,不法分子或獨裁政府想調查

某個人,也可以上網取得資料。因此,在

大數據時代,你必須更小心保護自己。

有人甚至主張:政府應該立法幫人們

找回「被遺忘」的權力,意思是:掌管巨

量資料的公司,必須定期刪除用戶資料。

個人教科書

Global Kids 2016.05 7776 未來少年 2016.05

上課聽不懂,卻不敢發問?未來學生上課,所有學習狀況都會被記

錄下來,讓老師及時掌握,為每個人找出最適合的教學方式。

美國史丹佛大學教授在網路開設課程,讓學生自行在家觀看教學

影片。特別的是,教授會追蹤學生觀看影片的動作:會不會按暫停、倒

帶、快轉,甚至提前關掉。

這些資料可以反應學生的學習狀況。如果學生倒帶,跳回前面的

影片重看,可能代表學生看不懂、有疑問,或者前後內容無法銜接。這

時,老師就能調整影片內容,藉此打造每個人的專屬教科書和補救教

學,達到真正的因材施教。

未來的數位學習,學生的一切學習情況都會被記錄下來,提供老師參考,為每一個人量身打造最適合的教學方式。

達志影像

達志影像

iStock

達志影像

未來的汽車可以看成一

台能上網的電腦,加上輪子、

方向盤和沙發,因為在大數據時

代,汽車將能夠自動導航和駕駛。

人、汽車和馬路的所有情況都

可被偵測、記錄,而且及時處理。

比方說,跟周圍車輛太近,車子立

刻避開;上下班的時候,車子根據馬路傳來的資料,繞

開塞車路段,選擇最合適的路線。在城市尋找車位是很

麻煩的事情,但未來可以讓汽車自己去找停車位,等到

要離開時,主人只要提前通知汽車,

讓它過來接人即可。

自動駕駛汽車上路!

Google Map的街景車正在拍攝西班牙的街頭。只要在Google 地圖服務打上地址,就可以在螢幕上呈現出世界各地街景與建築物的360度照片。但這項服務在歐洲遭到極大反彈,人們認為Google嚴重侵犯隱私。

迷信大數據,獨裁政府就可能會利用個人大數據,推測人們犯罪的可能性,執行預先逮捕。

達志影像

P072-077_特企-大數據.indd 76-77 2016/4/19 上午1:01

top related