[패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

11
Fastcampus Datascience Project 영화 관객 수 예측 시스템 2016. 8. 5. Github.com/cyh132

Upload: fast-campus

Post on 11-Apr-2017

4.202 views

Category:

Technology


1 download

TRANSCRIPT

Page 1: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

Fastcampus Datascience Project

영화 관객 수 예측 시스템

2016. 8. 5.조 용 환

Github.com/cyh132

Page 2: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

1. 주제 선정 이유

나의 관심사

영화

조 용 환

Page 3: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

1. 주제 선정 이유

일일관객수 122만명일주일관객수 662만명최종관객수 1761만명

일일관객수 128만명일주일관객수 665만명

최종관객수 => ???

조 용 환

Page 4: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

2. 데이터 구성

Sample : 2000년대 이후 개봉 영화 중 최종 관객수 10000명 이상 2600여개

Feature : 영화 정보(개봉월, 상영등급, 상영시간, 제작국가, 장르, 감독, 배우, 배급사)관객 정보(일주일간 관객수, 스크린 점유율, 상영 점유율, 좌석 점유율)

네이버 정보(개봉전 네이버 평점, 평가 참여 인원)

조 용 환

Page 5: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

3. 결 과

3,851,000

2,793,5662,565,078

2,345,247

4,909,492

4,699,208

2,609,9142,479,585

2,896,487

2,532,000

4,945,907

4,168,350

2,367,704

2,079,1992,346,446

2,142,522

트로이 내 머리 속의지우개

엣지 오브투모로우

우리 형 해리포터와아즈카반의 죄수

어메이징스파이더맨

스파이더맨2 바람의 파이터

OLS Model

조 용 환

82% 정확도

Page 6: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

3. 결 과

예측정확도(86.9%)

예측정확도(87.0%)

최근 상영 종료 영화

6,862,265 명

7,894,705 명

8,676,103 명

9,968,788 명

오차(1,032,440명)

오차(1,292,685명)

실제

실제

예측

예측

조 용 환

Page 7: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

3. 결 과

10,767,444 명

6,656,467 명

예측 최종 관객수

일주일 관객수

조 용 환

Page 8: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

3. 결 과

10,767,444 명

6,656,467 명

예측 최종 관객수

일주일 관객수

조 용 환

Page 9: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

4. 결 론

Insight

네이버 영화 평점(= 네티즌 기대치) 중요 !

감독(10) 배우(6)영향력

시사회

개봉일 당일

중요 !

1등 !

조 용 환

Page 10: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

5. 한계점 및 개선점

상영정보

네티즌 반응

홍 보

조 용 환

Page 11: [패스트캠퍼스] 데이터 사이언스 스쿨 조용환_영화 관객수 예측 시스템

기획 : 조 용 환

수집 : 조 용 환

모델링: 조 용 환

분석 : 조 용 환

PPT : 조 용 환

발표 : 조 용 환