데이터 사이언티스트 키노트 pt 20141008

10
2014-10-08 Data Scientist 1 데이터 사이언티스트로 입신하기 To be a real data scientist 허 명 회 (고려대 교수, 통계학) IT 데일리 세미나 키노트

Upload: myung-hoe-huh

Post on 01-Jul-2015

1.750 views

Category:

Education


7 download

DESCRIPTION

데이터사이어티스트로 입신하기

TRANSCRIPT

Page 1: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 1

데이터 사이언티스트로 입신하기To be a real data scientist

허 명 회 (고려대 교수, 통계학)

IT 데일리 세미나 키노트

Page 2: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 2

▪ 데이터 과학/공학 Data Science and Engineering

: 관측⋅수집 데이터로부터 정보를 추출하고 추출 정보로부터 지식을 창출함

- 《데이터 → 정보⋅지식》

- 《정보⋅지식 → 데이터》

Data Science & Data Scientist

데이터 지식

정보

Page 3: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 3

▪ “빅” 데이터

: 이제까지 다루지 못한 데이터의 분석, 즉

“Big” data is the data not touched yet. 노터치 [?]

: 데이터 사이언티스트/엔지니어

- 프런티어 정신과 자질

Data Science & Data Scientist

Page 4: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 4

▪ 데이터 사이언티스트로서의 자질

- 능동적 태도 proactive attitude- 문제해결력 problem solving skill- 창의력 creative mind- 소통력 communication skill

선행학습, 낮은 난이도, 반복반복..., 폐쇄형 평가, 한줄 경쟁

Data Science & Data Scientist

현실

Page 5: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 5

▪ 데이터 사이언티스트를 지향한다

방향 전환: 수동에서 능동으로, 학습지 문제 풀이에서 실제의 문제 풀이로, 모범 답에서 창의적 답으로,

읽기⋅듣기⋅말하기의 기본 소통력과 협업적 소통력으로

대학: 강의중심 →폐쇄적 평가, 시험 →낮은 난이도의 과제 →개인화 →

개인: 단일모델 →

Data Science & Data Scientist

Page 6: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 6

▪ 데이터 사이언티스트이기 위해서는

- 통계학: 회귀모형, 다변량 EDA, Machine Learning 등- 컴퓨터: 데이터베이스, Web 기술 등. - 수학: 미적분학, 선형대수 등. - 적용분야 지식(subject area knowledge): 역사학, 경제학, 사회과학, 공학- 실용주의 철학

R은 필수. Python과 Java도 (Hadley Wickham에 의하면)

학과주의, Lab 중심, ...

Data Science & Data Scientist

현실

Page 7: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 7

▪ 데이터 사이언티스트로서의 적성

- 데이터 마인드- 사회적 트렌드와 과학⋅기술에 대한 흥미- 자기 학습 self-learning- 스토리텔링, 인문적 소양- 사회적 친화력- 수리적 사고, 계산적 사고

Data Science & Data Scientist

Page 8: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 8

▪ 데이터 사이언티스트를 키우는 환경

- 단기적 성과주의 →- 용역(用役)꾼 →- 소통 공간- 직장의 이동성- “빅” 데이터와 “스몰” 데이터의 역할구분- 법⋅제도 (on privacy & confidentiality)

Data Science & Data Scientist

Page 9: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 9

▪ 빅데이터 또는 데이터 과학에 대한 견해

- “빅” 데이터 = 데이터 - 통계학 = 데이터 과학 - “빅” 데이터로부터의 정보와 지식 = cue, prior

¡ 자기선택 self-selection¡ Confounding (交絡)

- 반성

Data Science & Data Scientist

Page 10: 데이터 사이언티스트 키노트 Pt 20141008

2014-10-08Data Scientist 10

▪ 정리 및 토론

Data Science & Data Scientist

데이터 지식

정보

데이터