introduction to software (big data, intelligence and cloud)

33
your name Software Is Eating The World 2015.11.7 김우찬 [email protected]

Upload: -

Post on 11-Jan-2017

367 views

Category:

Software


1 download

TRANSCRIPT

Page 1: Introduction to Software (Big data, Intelligence and Cloud)

your name

Software Is Eating The World

2015.11.7

김우찬

[email protected]

Page 2: Introduction to Software (Big data, Intelligence and Cloud)

your name

My Interests

• Bioinformatics

• Big Data Platform

• Data Mining

Page 3: Introduction to Software (Big data, Intelligence and Cloud)

your name

Page 4: Introduction to Software (Big data, Intelligence and Cloud)

your name

Page 5: Introduction to Software (Big data, Intelligence and Cloud)

your name

왜 소프트웨어인가?

• 모든 제품과 산업에서 사용됨

Page 6: Introduction to Software (Big data, Intelligence and Cloud)

your name

돈 되는 SW : Uber

Uber 현대기아차

사업모델 차량 합승

서비스

자동차

제조/판매

자동차

판매량 0대 800만대

기업가치 50조원 60조원

Page 7: Introduction to Software (Big data, Intelligence and Cloud)

your name

돈 되는 SW : Airbnb

Airbnb IHG

사업모델 숙박 대여

서비스

호텔업

(업계1위)

숙박 건물

개수 0개

4,600+

(호텔수)

기업가치 25조원 10조원

Page 8: Introduction to Software (Big data, Intelligence and Cloud)

your name

돈 되는 SW : Facebook

Facebook 삼성전자

사업모델 인터넷 서비스 전자제품

제조/판매

대표제품/

서비스

Facebook

Instagram

Messenger

스마트폰

메모리

가전제품

기업가치 300조원 200조원

Page 9: Introduction to Software (Big data, Intelligence and Cloud)

your name

3가지 주제

Big Data

Intelligence

Cloud

Page 10: Introduction to Software (Big data, Intelligence and Cloud)

your name

Big Data

Page 11: Introduction to Software (Big data, Intelligence and Cloud)

your name

빅데이터의 시작

Page 12: Introduction to Software (Big data, Intelligence and Cloud)

your name

Hadoop 출현 배경

• 2003년 Google 논문

– Google File System

• 2004년 Google 논문

– MapReduce

• 2005년 Hadoop 개발 (더그커팅)

– Apache 오픈소스

Page 13: Introduction to Software (Big data, Intelligence and Cloud)

your name

Hadoop은 왜 나타났나?

• Data가 너무 많아지고 있음

• 많은 Data로 무언가 해야 할 듯

Page 14: Introduction to Software (Big data, Intelligence and Cloud)

your name

Hadoop은 무엇인가?

• HDFS + MapReduce

Page 15: Introduction to Software (Big data, Intelligence and Cloud)

your name

Hadoop의 장점

• Scale-Up 보다는 Scale-Out

• 장애에 강함

• 쉬운 인터페이스

Page 16: Introduction to Software (Big data, Intelligence and Cloud)

your name

Hadoop Ecosystem

SQL

그래프

ML

클러스터 관리

Page 17: Introduction to Software (Big data, Intelligence and Cloud)

your name

Hot Trend

Page 18: Introduction to Software (Big data, Intelligence and Cloud)

your name

Spark 장점 1

• 모든 게 다 있음

Page 19: Introduction to Software (Big data, Intelligence and Cloud)

your name

Spark 장점 2

• 매우 빠름 (메모리 기반 연산)

Page 20: Introduction to Software (Big data, Intelligence and Cloud)

your name

Spark 장점 3

• 코드 라인이 짧음

Page 21: Introduction to Software (Big data, Intelligence and Cloud)

your name

Intelligence

Page 22: Introduction to Software (Big data, Intelligence and Cloud)

your name

Machine Learning

Page 23: Introduction to Software (Big data, Intelligence and Cloud)

your name

ML로 무엇을 할 수 있나?

• 사용자 행동 분석

• 추천 (컨텐츠, 광고, …)

• 인식 (음성, 이미지, 영상)

Page 24: Introduction to Software (Big data, Intelligence and Cloud)

your name

예측(추천)의 힘

• Netflix

–시청하는 영화의 2/3가 추천으로 발생

• Google

– 38% 이상의 뉴스 조회가 추천으로 발생

• Amazon

–판매액의 35%가 추천으로 발생

Page 25: Introduction to Software (Big data, Intelligence and Cloud)

your name

Deep Learning

Page 26: Introduction to Software (Big data, Intelligence and Cloud)

your name

숫자 인식 (MNIST)

Page 27: Introduction to Software (Big data, Intelligence and Cloud)

your name

이미지 인식 (ImageNet)

• Large Scale Visual Recognition

Challenge (ILSVRC)

Page 28: Introduction to Software (Big data, Intelligence and Cloud)

your name

Cloud

Page 29: Introduction to Software (Big data, Intelligence and Cloud)

your name

Public vs. Private

Page 30: Introduction to Software (Big data, Intelligence and Cloud)

your name

Cloud에 필요한 것들

• Server 자원 관리

Page 31: Introduction to Software (Big data, Intelligence and Cloud)

your name

Cloud에 필요한 것들

• Cluster 자원 관리

Page 32: Introduction to Software (Big data, Intelligence and Cloud)

your name

Public Cloud 강자

• AWS (Amazon Web Service)

Page 33: Introduction to Software (Big data, Intelligence and Cloud)

your name

결론

• Big Data

– Hadoop에서 시작해서 지금은 Spark가

대세임

• Intelligence

–향후에 (특히 연구자 입장에서) 가장

할만한 분야임 (특히 DL)

• Cloud

–그냥 AWS 쓰는 게 좋음 (분석가 입장)