dsp 資料科學計畫簡介
DESCRIPTION
http://datasci.coTRANSCRIPT
1�
15 out of 20 attendants filled out the questionnaire. � �
Data Science Program (DSP) �資料科學計畫簡介�
�Code for Healthcare�
�
�
Etu 負責人 蔣居裕 (Fred Chiang)�April 18th, 2014�
2�
Who am I?� 蔣居裕 Fred Chiang
Open xxx 的愛好者
資料價值的探索者
Etu 負責人
精誠集團 產品創新中心 助理副總經理
! Blog —《Fred 豢養的雲中象》http://fredbigdata.blogspot.tw all about Hadoop and Big Data 台灣少見以探討 Big Data 趨勢、技術、商業價值為主軸的專業部落格
3�
前 情 提 要
4�
[想像] 要萃取 Big Data 的價值,必須有資料科學家 [真實] 資料科學家萬中選一,不如培養資料科學團隊�
Big Data 的真實與想像
5�
Harvard Business Review October 2012 http://cromi.org/main/wp-content/uploads/2012/10/Davenport-2012-data-scientist.pdf
資料科學,�我們是要仰仗這位性感的傢伙嗎?�
6�
Superman, or Scientist�
7�
No one person can be the perfect data scientist, so we need teams�
Source: Next-Gen Data Scientist, Dr. Rachel Schutt�
Data Science Profiles�
8�
Monetize Data (®ÌÚ4) End-to-End ^¾�
處理者�
分析者�策略者�
策略者�
Source: Next-Gen Data Scientist, Dr. Rachel Schutt�
70%~85% 的工作時間�
9�
Data Science Program
10�
緣起華山 – 2013.5.16 ������������������������� ��
11�
Data Weekend #5 – 2013.8.17
http://www.slideshare.net/fchiangtw/data-weekend-5
12�
Data Weekend #6 – 2013.9.28
13�
最後籌備期:2013.09.29 ~ 2013.12.13
執行委員會�
執行長 (CEO) / 執行秘書�
行政部�
營運長 (COO)�
教學部�
課程長 (CCO)�
行銷部�
行銷長 (CMO)�
顧問團�
顧問長�
14�
執行委員會組成�Phase 0� �
1. CEO: CK Liu (CfT 代表)�2. Principal Secretory: Fred Chiang (SYSTEX/Etu 代表) �3. COO: Fred Chiang (SYSTEX/Etu 代表)�4. CCO: CK Liu (CfT 代表)�5. CMO: T.h. Schee (CfT 代表)�
�
15�
《資料科學團隊養成計畫》 Data Science Program (DSP)
人才為本
應用為價值�
在3年內,為台灣培養300位
資料科學團隊成員�
16�
Data Science Program
【資料科學計畫 ─ 團訓班】 實踐報告
第 1 期:2013.12.14 ~ 2014.01.11 第 2 期:2014.03.08 ~ 2014.03.29 �
17�
http://www.etusolution.com/DSP 報名開始…�
18�
學員篩選 – 79 選 33 (1期)�中研院、國研院、大學、太空中心、電信、網路服務、醫療、NPO、金融、資服、商業顧問、市調、高科技製造、法人
19�
專業分工組隊�• Campaigner • Analyst • Hygienist • Designer
20�
講師介紹��ėþ (Johnson)Ĵh�É�J*ÅĴ�H �qÉ��jxnĆij+$DÉ�=gPiÃ�T Ã� �bĩĴpo�)É���¶�ČiçÇ�nĆ�©`lij
Ĉïā (Rafe) �®ÌćÞ#ĴFM\®Ì�ôyĜ¿°đćĀTUĴ)ĞL��Č=g,é'~ij2�� *Å��ê�ĴÈ� 20 Ä�Ñ�1åöĴ�È��v9.¤� Business Flight Ticketij
ĐġĦ (Jerry) �b�®Ì�s)Lĝ�ij �H�!·ĎúÚâ 4®ý�UJ*Å�ĴĨ�E¨Ú4PE:ĴãD�©ęnĆ`lĴê½(?Àj�IT%ζs)nĆ。
21�
講師介紹�
ĈĒě (CK) µ?�-!\/£x�ČP»xì`īĉiG�(Ĵ�Hø�ğ´÷c?UĴ�K��W��g%[DĬ���àĭt²�ijjxÒß�Ĕ×ç±čIJ®Ì�ČPs)IJopen dataIJdata journalismIJ ¶S�Øëij
ĤÊĥ (Fred Chiang) � Open SourceIJOpen DataIJOpen Development ��PĚÏ�Ĵ�QĠI £X?U�}ûĴ�����Pê_�ćĀ&N��³PLĝ80ij�H� Hadoop Big Data XÖ Etu îñ�ij
22�
助教介紹�
õąÔ (Muyueh) ÜG®Ì}<�ĴÁø�TEDxùĪĂÎ�IJ¦ �ÍĮ�Í®ý}<�įÇ�ij+Y;�e[� §Ç #6"3�©KĴ®Ì}<�GX�óĵĮ)E¢òį、Į�èüsįIJĮ�k/¥įIJĮċ�|w��įIJĮð5Z¯{į ¶ĮĖ¯��įA 2,000 ve[ij
ijĢăĕ (Tim) \/APP¶Oau¹&%iGĴ]���IJ�BIJ¬�IJÆCY]nĆ8�mĘ2ĴËÝ]�OaÕ�IJOpen DataIJ��®ÌIJ�P®ý8]æAälĴjxÒß�Ĕz(Já«�¼ÎÓ�mÎÓݾ¡x��ı ¶��IJ¸ēIJ®ÌAA…OaÕ×75Ĵģÿ¾¡IJ®ÌP��Ą�Vd�]æij
講師介紹�
23�
24�24�
25�
[心法傳授範例 1]
26�
[心法傳授範例 2]
27�
[課後檢討會議] 講師、助教、工作人員、學員代表
28�
Dataset 1:內政部不動產實價登錄資料�
• 民國 101.08 ~ 102.09 • 全台灣 • 租賃、買賣、預售 • 約 47 萬筆資料
29�
Dataset 2:PIXNET Hackathon 開放資料�
1. 熱門照片的相關資料 (metadata)�2. 相片的 EXIF 資料�3. 人氣部落格的詮釋資料 (metadata)�4. 人氣部落格的訪客記錄 (visitor logs)�
* 部落格與相片的內容資料,可以透過 PIXNET API 取得。�
30�
Data Fiesta:DSP 結訓成果交流�
31�
Team Project 團訓班第 1 期 團訓班第 2 期
#1 我要成為天聾人股份有限公司 《Bargaining Power》
無殼蝸牛聯盟 《房價正義》
#2 遊戲茄子 《驚爆房地產》
航海王 《部落客銀行》
#3 逆轉人生全球顧問股份有限公司 《小資男女翻身計畫》
愛。住易 《找尋銀髮幸福宅》
#4 光點選址服務 《小火鍋創業選址模型》
小資“救世“組 《千金買房‧萬金買鄰》
#5 財團法人避稅剋星 《土地買賣稅費異常資料查詢平台》
Captain 《Hot Zone》
32�
�ijf� -ĬyôíÙ|wďĭInfographic download: http://goo.gl/fKdXXi
33�
參加 DSP 的 n 個理由
1. Team Player 尋找資料科學團隊遺缺的夥伴�
2. 迷惑者尋找資料分析的心法明燈 (重新認識資料分析)�
3. 資深工作者重燃對資料分析的熱情�
�
n. …… <您的理由>�
34�
「DSP 結訓學員」使用說明
1. 安全返回到工作崗位,回饋所學給親愛的公司�2. 結夥創業賺大錢�3. 結夥做資料科學公益�4. 加入 DSP 工作團隊:行政、行銷、教學�5. 繼續宣揚 DSP 精神,推薦更多下線�
台灣 ‧ 海外�DSP 顧問任務團�
DSP 校友團 – 【邀請制】�
35�
DSP Roadmap�
下一梯:7 月
資料爬理析 Python 實戰班:5/10-11�
CfT.io
Pixnet
Fellowship Program
36�
Lessons Learned
37�
變與不變 ─ 從第 1 期到第 2 期�
變�1. 收費:NT$ 6,000 -> NT$ 12,000�
2. 工具:從無到用 R Language�
3. 內容:時數增加 6 小時 (Hands-on Labs)�
4. 報名者的背景:Hygienist & Designer 減少,Campaigner 增加�
5. 志工:行銷與助教人數�
不變�1. 講師對 Team Project Pitch 提出挑戰�
2. 認真的學員與投入的講師�
3. 持續改進課程的精神�
38�
多與少 ─ DSP 教我的事�
1. 多一點生活,少一點正義�2. 多一點策略,少一點包裝�3. 多一點資料,少一點想像�
4. 多一點分析,少一點美術�5. 多一點關聯,少一點加總�
6. 多一點跨界,少一點純粹�
39�
結論�
1. 一位朋友說得好:當 Small Data 都不想玩、玩不起來的時候,要 Big Data 何用?�
2. 對資料有感,讓應用有感,是資料科學訓練的成功關鍵要素。�
3. 資料科學是一個連續的、End-to-End 的資料科學過程,跨界專業分工團隊,是萃取資料價值的必要實踐。�
4. 台灣不是沒人才,人才不是沒有競爭力,缺的可能是 Team Up 的組織力。�
40�
Contact, Community, and Reference
Contact Web: datasci.co Mail: [email protected]
Community Forum: CfT.io/categories/dsp FB: www.facebook.com/CodeForTomorrow
Reference • Slideshare《®ÌÚ4к�>ăÛ�@ ─ DSP �Ċ》
https://www.slideshare.net/fchiangtw/dsp-30076214
• 團訓班 2 期成果報導《�ħ���,Ĵr������,》 http://datasci.co/2014/03/30/dsp-datafiesta-2/#more-277
• 講師 Johnson 文章《®ÌÚ48�R》 http://readata.org/datasci/about-data-science/
• 傑出成果:愛住易 ─《找尋銀髮幸福宅》Infographic http://goo.gl/fKdXXi
41�
Taipei, Taiwan Add : 318, Rueiguang Rd., Taipei 114, Taiwan Tel : +886-2-77201888 Fax : +886-2-87986069 www.etusolution.com�