데이터 사이언티스트 키노트 pt 20141008
DESCRIPTION
데이터사이어티스트로 입신하기TRANSCRIPT
2014-10-08Data Scientist 1
데이터 사이언티스트로 입신하기To be a real data scientist
허 명 회 (고려대 교수, 통계학)
IT 데일리 세미나 키노트
2014-10-08Data Scientist 2
▪ 데이터 과학/공학 Data Science and Engineering
: 관측⋅수집 데이터로부터 정보를 추출하고 추출 정보로부터 지식을 창출함
- 《데이터 → 정보⋅지식》
- 《정보⋅지식 → 데이터》
Data Science & Data Scientist
데이터 지식
정보
2014-10-08Data Scientist 3
▪ “빅” 데이터
: 이제까지 다루지 못한 데이터의 분석, 즉
“Big” data is the data not touched yet. 노터치 [?]
: 데이터 사이언티스트/엔지니어
- 프런티어 정신과 자질
Data Science & Data Scientist
2014-10-08Data Scientist 4
▪ 데이터 사이언티스트로서의 자질
- 능동적 태도 proactive attitude- 문제해결력 problem solving skill- 창의력 creative mind- 소통력 communication skill
선행학습, 낮은 난이도, 반복반복..., 폐쇄형 평가, 한줄 경쟁
Data Science & Data Scientist
현실
2014-10-08Data Scientist 5
▪ 데이터 사이언티스트를 지향한다
방향 전환: 수동에서 능동으로, 학습지 문제 풀이에서 실제의 문제 풀이로, 모범 답에서 창의적 답으로,
읽기⋅듣기⋅말하기의 기본 소통력과 협업적 소통력으로
대학: 강의중심 →폐쇄적 평가, 시험 →낮은 난이도의 과제 →개인화 →
개인: 단일모델 →
Data Science & Data Scientist
2014-10-08Data Scientist 6
▪ 데이터 사이언티스트이기 위해서는
- 통계학: 회귀모형, 다변량 EDA, Machine Learning 등- 컴퓨터: 데이터베이스, Web 기술 등. - 수학: 미적분학, 선형대수 등. - 적용분야 지식(subject area knowledge): 역사학, 경제학, 사회과학, 공학- 실용주의 철학
R은 필수. Python과 Java도 (Hadley Wickham에 의하면)
학과주의, Lab 중심, ...
Data Science & Data Scientist
현실
2014-10-08Data Scientist 7
▪ 데이터 사이언티스트로서의 적성
- 데이터 마인드- 사회적 트렌드와 과학⋅기술에 대한 흥미- 자기 학습 self-learning- 스토리텔링, 인문적 소양- 사회적 친화력- 수리적 사고, 계산적 사고
Data Science & Data Scientist
2014-10-08Data Scientist 8
▪ 데이터 사이언티스트를 키우는 환경
- 단기적 성과주의 →- 용역(用役)꾼 →- 소통 공간- 직장의 이동성- “빅” 데이터와 “스몰” 데이터의 역할구분- 법⋅제도 (on privacy & confidentiality)
Data Science & Data Scientist
2014-10-08Data Scientist 9
▪ 빅데이터 또는 데이터 과학에 대한 견해
- “빅” 데이터 = 데이터 - 통계학 = 데이터 과학 - “빅” 데이터로부터의 정보와 지식 = cue, prior
¡ 자기선택 self-selection¡ Confounding (交絡)
- 반성
Data Science & Data Scientist
2014-10-08Data Scientist 10
▪ 정리 및 토론
Data Science & Data Scientist
데이터 지식
정보
데이터