세계관광의 중심지 대한민국의 미래를 말하다.여정보입수 한국기관, 공항,...

30

Upload: others

Post on 31-Jan-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

목차

01.분석주제

한국 관광 산업의 발전을

유도할 수 있는 분석 결과 및

창의력 관광 마케팅전략을

제공하여보자.

02. 분석개요 Ⅰ

-주제에 적합한 목표변수설정

- 목표변수에 대한 예측모형

개발하기 위해 분석단계 정의

- 분석 데이터 구성

- 데이터 정제 및 가공 수행

03.분석개요 Ⅱ

-목적에 맞는 모형개발

- Data partition을 통한 모형의

성능 및 안정성 평가

- Score결과 도출

- 모형을 통한 반응변수의

최적치를 통계적으로 만족하는

설명변수들의 조합 찾아내기

04. 결론

데이터 분석 결과를 통한

대한민국의 관광산업의 미래를

위한 마케팅 전략 및 세계인들

의 관광의 증폭적인 유치를

위한 대책 제안.

F M

RFM을 통한 분할된 개념을 하나의 목표로 통합시킨다.

1. F : Frequency(방문빈도) 방문정보를 바탕으로 새로운 범주인

방문한 관광객과 재방문을 한 관광객으로 나누어준다

2. M : Monetary(지출금액) 돈을 많이 쓴 관광객

( 지출금액을 단순히 적용하는 것이 아니라. 한국에 머문 날짜로

control하기 위해 나누고 그 값에 log변환을 시켜 정규화한 다음

분석을 한다.)

3.M2 : Monetary(지출금액)을 log변환 시킨 값

목표변수

비교모델 종류 및 설명

비교모델

Linear regression model

( using variable selection like BE FS STEP)

Decision tree model

Neural network

Variable Selection

회귀분석에서 변수 선택에 대한 Criteria

: CV(cross validation)

DATA 정제 및 파생변수 생성

• 변수변환에 대한 설명 : 파생변수와 더미변수로 변환 한 변수

만약 A variable 다중선택 가능 범주 4개인경우 다음과 같이

변수를 정제하였다.

a a_1 a_2 a_3

1 2 3 .

1 4 . .

1 2 3 4

3 4 . .

a1 a2 a3 a4

1 1 1 0

1 0 0 1

1 1 1 1

0 0 1 1

범주 4개의 dummy

Variables 생성 결측치 처리 방법 - Tree surrogate

분석 과정 Diagram

모델적용 각 모델을 옵션 설정에 따라 총 6가지

모델을 fitting 해본다.

모델 비교를 통해 6가지 모델 중 가장 적절한

모델을 test set에서 evaluation을 기준으로 최적

모델 산출 및 scroe 계산

데이터 분할 train : validation : test =4:3:3

Train과 validation로 모델을 fitting과 점검을 해서

모델을 만들어내고 test로 모델을 점검

데이터를 읽고 변수의 type 및 role을 할당

결측값을 tree surrogate 방법을 이용해 처리

EM diagram 및 설명

목표변수 상세 설명

• 1st 목표변수 : MQ1A을 지난 3년간 한번 온 사람은 1, 한번에서 네 번 온

사람은 2, 어떤 항목에도 해당되지 않는 사람은 결측값으로 처리.

type : nominal =>회귀분석 : Logistic regression

• 2nd 목표변수 : log(mtz16/mq6)=log(총 지출금액/체류기간)

type : interval

• 3rd 목표변수 : log(mtz16)=log(총 지출금액)

type : interval

• 설명변수 : 목표변수를 제외 한 주어진 모든 설명변수

Log변환

목표변수 최종 모형 선택 기준

재방문여부 Regression

with backward

elimination

오분류 비율

=0.314

log(총 지출금액/체류기간) Regression

with forward selection

MSE

수정된결정계수:0.2821

log(총 지출금액) Regression

with forward selection

MSE

수정된결정계수:0.1904

최종 모형 결정

Data 2009년 변수 설명

-재방문여부 Variable Interpretation

여행 형태 개별여행<air-tel<단체여행 순으로 재방문 가능성 높음

Log_지출금액 총 지출액이 클수록 재방문가능성 낮다

쇼핑 주요품목 자기, 도자기,담배 산 경우에 재방문 가능성이 줄어든다. 피혁제품,신발류,전통민예품, 칠기, 목각제품 전자전기 제품을 산 경우에 재방문 가능성 높음.

쇼핑 중 불편사항 쇼핑 불만사항이 없을 때 호객행위가 있을 때 재방문가능성 높음

한국여행 만족도 관광지로서 한국을 추천을 크게 할수록 재방문 가능성이 크다. 한국을 재방문 할 생각이 클수록 오히려 재방문

할 가능성 낮다

인상 깊은 점 사람이 친절하다 활기에 차있다고 느낄 때 재방문 가능성 크다

여행 정보입수 정보를 얻지 않았을 때 보다 인터넷을 통하거나 보도를 통해서 여행정보를 입수 했을 때 재방문 가능성이 커진다. 하지만 한국기관을 통해서 (관광공사,대사관 ,무역관)정보를 얻었을 때에는 기타에 비해 재방문 가능성이 떨어진다.

Variable Interpretation

방한 목적별 여행형태가 기타에 비해서 여가 위락 개별휴가의 경우에는 재방문 가능성이 증가하지만 사업 또는 전문활동의 경우에는 재방문 가능성이 감소한다. 그 외에 종교의 경우 재방문확률이 증가함

나이 61세 이상은 0-20대는 재방문 가능성이 크지만 41~50세는 재방문 가능성이 매우 낮음

방한비자 취득 방한비자 취득이 어려울 때 재방문률이 감소한다.

거주 국 별 기타 나라에 비해서 일본의 경우 재방문 할 가능성이 작다 홍콩의 경우에도 비슷하다. 태국이나 미국 유럽의 나라들은 재방문 할 가능성이 기타에 비해 크다 특히 프랑의 경우에는 재방문 할 가능성이 크다

방문지(16개시도) 광주나 대전을 간 경우에는 재방문 할 가능성이 크다 강원도를 갔을 때에는 재방문 할 가능성이 낮다

조사기간별 4월 5월 10월이 유의하며 4월과 5월은 재방문 할 가능성이 12월에 비해 낮지만 10월은 재방문 가능성이

크다

Data 2009년 변수 설명

-log(지출금액/체류기간) : M Variable Interpretation

여행 형태 개별여행<air-tel<단체여행 순으로 M값 높음

한국주요활동 여가 위락 개별휴가일 때 M값이 크고 친구친지 방문 종교 및 순례의 경우 M값이 작다

쇼핑 주요품목 전자전기제품 사용한 구매한 사람이 M값이 크다

주요쇼핑장소 시내면세점이나 남대문 시장에서 쇼핑한 사람의 M값이 작다

재방문여부 재방문을 한 경우에는 M이 작다.

주요숙박시설 호텔과 유스호스텔 여관 이용객 M값 높음 친척집이나 사찰을 이용한 관광객은 M값 낮음

거주 국 별 일본, 중국,태국 M값 크고 프랑스 사람들이 M값 낮음

한국방문목적 친구 친지 방문한 경우 M값 낮음

나이 61세 이상에 비해 0-30세는 M이 작다 또한 40-60세 사람들이 M이 크다

동반자 현황 배우자나 연인과 방문한 사람이 M값 높음

Variable Interpretation

조사기간별 12월 기준 2월과 8월은 M이 작고 11월달은 M이 크다

쇼핑 중 불만사항 상점 문닫는 시간이 이르다고 느낀 사람은 M이 크다

한국여행에서 인상깊은 점 음식이 맛있다고 느낀 사람은 M이 크다

여행정보 입수경로 1순위 여행정보를 얻지 않은 경우보다 여행사를 통한 경우 M이 크다 항공사 호텔을 이용한 경우에도 M이 매우 크다

강원도에 방문한 사람 강원도에 방문한 경우 M이 작다

Data 2009년 변수 설명

-log(지출금액) : M2

Variable Interpretation

조사기간별 12월을 기준으로 1,2,8월 M2 작다11월은 M2 크다.

여행형태별 .개별여행<air-tel<단체여행 순으로 M2값 높음

방한목적별 방한 목적을 기타를 기준으로 여락 위락 개별휴가일 M2크고 친구친지 방문 사업 또는 전문활동 경우 M2 작다

나이 61세 이상사람에 비해 0-30세에 M2 작다 30-60세 사람들이 M2 크다 51-60세가 가장 M2가 크다

재방문여부 재방문을 한경우 M2 감소

주요 쇼핑 품목 기타 제품을 산 것보다 전자 전기제품을 산 경우에 M2 증가

기타 제품을 구매한 것 보다 인삼한약재를 산 경우에는 M2 감소.

한국에 인상깊은점 밤에 놀거리가 많다고 느꼈을 때 M2 증가

Variable Interpretation

쇼핑불편사항 점원이 불친절하다고 느꼈을 때 M2 작다

한국에서 불편한 점 물가가 비싸다고 느꼈을 때 M2 작다

동반자 현황 - 배우자 배우자와 왔을 때 M2 증가

나라 러시아와 중동 일본 M2 크다

대만과 호주가 M2 작다

향후 3년 이내 관광목적 한국 재방문 의사

재방문 의사가 강할수록 M2 크다

여행정보 입수경로 정보를 얻지 않은 경우보다 여행사나 친구 친지 동료를 통해 여행정보를 입수 하였을 때 M2 크다

목표변수 최종 모형 선택 기준

재방문여부 Regression

with stepwise

오분류 비율

=0.293

log(총 지출금액/체류기간) Regression

with forward selection

MSE

수정된 결정계수:0.3375

log(총 지출금액) Regression

with forward selection

MSE

수정된 결정계수:0.1977

최종 모형 결정

Data 2010년 변수 설명

-재방문여부 Variable Interpretation

여행 형태 개별여행<air-tel<단체여행 순으로 재방문 가능성 높음

한국 체류기간 기간이 길수록 재방문 가능성 낮음

Log_지출금액 지출금액이 큰 사람들이 재방문 가능성 낮음

쇼핑 주요품목 음반 dvd 재방문 가능성 낮다 실크 섬유 전통민예품 식료품 재방문 가능성 크다.

한국 방문

주요목적

미용관광 치료인 경우 재방문 가능성 크다.

카지노 레포츠의 경우 재방문 가능성이 낮다.

주요쇼핑장소 공항면세점에서 쇼핑한 사람이 재방문 가능성 낮음

한국여행 만족도 한국음식에 매료된 사람일 경우 재방문 가능성 낮음

인상 깊은 점 밤 문화에 인상 깊었던 사람들이 재방문 가능성 크다.

여행 정보입수 관광안내서적을 기사 통해 정보를 입수한 경우 재방문가능성 높음 한국관광기관이나 항공사를 통해 정보를 얻은 경우

재방문 가능성이 낮다.

직업별 공무원, 군인, 학생들이 재방문 가능성 높음

방문지(16개시도) 부산과 전북을 방문한 사람들이 재방문 가능성 높음

여행 목적 여가 휴가 계획 재방문 가능성 크다. 종교및 순례의 경우 재방문 가능성이 낮다.

Data 2010년 변수 설명

-log(지출금액/체류기간) : M

Variable Interpretation

여행 형태 개별여행<air-tel<단체여행 순으로 M값 높음

한국주요활동 쇼핑, 카지노, 휴양을 즐긴 사람들이 M값 높음

쇼핑 주요품목 대체로 쇼핑을 한 사람이 M값 높음

주요쇼핑장소 공항면세점에서 쇼핑한 사람이 M값 높음

한국여행만족도 숙박시설에 만족하는 사람들이 M값 높음

주요숙박시설 호텔과 유스호스텔 여관 이용객 M값 높음 친척집이나 사찰을 이용한 관광객은 M값 낮음

거주 국 별 일본, 중국 M값 크고 프랑스 사람들이 M값 낮음

한국방문목적 친구 친지 방문한 경우 M값 낮음

학력별 대학원 이상의 경우 M값 높음

직업별 공무원, 군인이 M값 높고 기업인이 M값 낮음

동반자 현황 배우자나 연인과 방문한 사람이 M값 높음

방문지(16개시도) 부산과 전북을 방문한 사람들이 재방문 가능성 높음

Data 2010년 변수 설명

-log(지출금액) : M2

Variable Interpretation

여행 형태 개별여행<air-tel<단체여행 순으로 M2값 높음

한국 체류기간 체류기간이 길수록 M2값 높음

한국주요활동 카지노, 휴양을 즐긴 사람들이 M2값 높음

쇼핑 주요품목 시계를 구매한 사람들이 M2값 높음

주요쇼핑장소 어느 곳에서도 쇼핑하지 않은 사람들이 M2값 낮음

인상 깊은 점 자연경관에 인상 깊은 사람이 M2값 낮음

여행정보입수 친지, 친구, 동료를 통해 입수한 사람이 M2값 높음

거주 국 별 싱가포르, 미국 러시아 M2값 높음, 대만, 프랑스 낮음

직업별 주부, 자영업자 M2값 높음 학생 낮음

방문지(16개시도) 서울, 울산, 경기 방문자 M2값 높음 충청도 방문자 낮음

Data 2010년 분석

마케팅 전략의 예

1. 한국방문 주요활동 더미변수들 중에 가장 회귀계수가 큰 항목이 휴양 및

휴식(리조트) 항목이다. 이곳에서 주요활동을 한 사람이 하루에 평균

소비 비용이 더 크다. 그렇기 때문에 휴양 및 휴식(리조트) 산업에 투자를

해서 편의시설을 더 확보하고 이벤트 등 여러 행사 및 다른 쇼핑 시설을

마련하여 많은 외래 사람들의 관심을 끌고 소비를 촉진하기 위해 힘써야

할 것이다.

2. 국적에 따른 변수를 보면 대만 국적의 관광객이 하루 평균소비비용이

크다 대만 사람의 지갑을 열리게 하기 위해 대만에서 K-pop 콘서트를

개최하면 한국의 문화 홍보를 위해 우리 유산이나 발전 가능성에 관련된

영상이나 기념품을 만들어 많은 대만 사람들에게 알리는 등 적극적인

투자를 통해 대만 사람들이 한국에서 돈을 많이 쓸 수 있도록 해야 한다.

목표변수 최종 모형 선택 기준

재방문여부 Regression

with backward

elimination

오분류 비율

=0.29

log(총 지출금액/체류기간) Regression

with forward selection

MSE

수정된

결정계수:0.2248

log(총 지출금액) Regression

with forward selection

MSE

수정된

결정계수:0.2262

최종 모형 결정

Variable Interpretation

여행정보입수 한국기관, 공항, 항공사에서 정보 입수한 경우 재방문 가능성 낮음

조사기간 별 1월에 조사한 경우 재방문 가능성 낮음 7월은 높음

거주 국 별 일본, 홍콩, 러시아 사람들 재방문 가능성 낮음

호주, 미국 사람들은 재방문 가능성 높음

여행형태 개별여행<air-tel<단체여행 순으로 재방문 가능성 높음

숙박시설 학교/회사 기숙사에서 묵은 경우 재방문 가능성 낮음

한국체류기간 길면 길수록 재방문 가능성 낮음

Data 2011년 변수 설명

-재방문여부 Variable Interpretation

연령별 10대 20대가 40대, 50대에 비해 재방문 가능성 높음

한국여행 방문 지 경상도 방문한 관광객들이 재방문 가능성 낮음

직업별 학생들이 재방문 가능성 높고 주부나 은퇴자는 낮음

지출금액 지출금액이 높을수록 재방문 가능성 낮음

방문 시 활동내역 자연경관과 박물관 식도락 쇼핑을 하는 방문객의 재방문 의 재방문일 가능성 높음 오히려 카지노나 미용 의료의 경우의 재방문 가능성 낮음

쇼핑장소 백화점에서 쇼핑한 사람들이 재방문 가능성 낮다

소규모 상점에서 쇼핑한 경우가 재방문 가능성 높다.

여행 시 좋은 점 안전함에 장점을 느낌 사람들의 재방문 가능성 높음

불편했던 점 언어소통에 불편함을 느낌 사람들의 재방문 가능성 높다.

교통혼잡을 느낀 사람들의 재방문 가능성 나다.

3년 내 재방문의사 호의적으로 답할 수록 재방문 가능성 낮음

한국 이미지 변화 이미지가 호전될 수록 재방문 가능성 높음

Data 2011년 변수 설명

-log(지출금액/체류기간) : M Variable Interpretation

여행 방문 지 서울, 인천, 경기 방문자들은 M값 높음

직업별 기업인, 자영업자 M값 높음 학생들 M값 낮음

활동 내역 레저활동이나 카지노 이용객은 M값 높음

쇼핑품목 대체로 쇼핑한 사람들 M값 높음

재방문의사 재방문 의지가 높을수록 M값 높음

조사기간 3월보다 7월 8월에 조사한 경우 M값 높음

거주 국 일본, 중동,중국,러시아 사람들 M값 높음

여행형태 개별여행일 수록 M값 낮음

숙박시설 호텔에 묵은 경우 M값 높음

최근 방문횟수 최근 방문 횟수가 클수록 M값 낮음

다른국가 검토 여부 다른 국가 비교한 사람에 비해 비교 안 한 사람 M값 높음

동반자_직장동료 직장동료와 온경우 M값 낮음

Data 2011년 변수 설명

-log(지출금액) : M2

Variable Interpretation

연령별 10대에 비해 50대 M2값 높음

여행 방문 지 서울, 인천, 경기 방문자들 M2값 높음

직업별 기업인, 자영업인 M2값 높음 학생, 은퇴자 M2값 낮음

좋았던 활동 내역 유흥,오락,카지노,테마 파크 M2값 높음 박물관 방문 M2값 낮음

쇼핑품목 대부분 품목에 소비한 경우 M2값 높음

좋았던 점 쇼핑에 좋은 인상을 남긴 사람이 M2값 높음

3년 내 방문 의사 방문 의지가 높을 수록 M2값 높음

조사 년도 7월 8월에 조사한 경우 M2값 높음

거주 국 별 중국, 일본, 러시아, 중동 M2값 높음 영국,독일, 인도 M2값 낮음

여행형태 개별여행<air-tel<단체여행 순으로 M2값 높음

숙박시설 호텔 이용객 M2값 높음 친척집 이용객 M2값 낮음

한국체류 기간 체류기간이 길수록 M2값 높음

여행동기 음식/미식 탐방하기 위해 온 사람들 M2값 높음

동반자 현황 직장동료와 방문한 경우 M2값 낮음

Data 2011년 분석

유의한 변수로 부터 도출해 낼 수 있는 마케팅 전략의 예

1. 의료시설 카지노 테마파크에 간 사람들이 평균적으로 돈을 많이 지출하였다. 백화점에서의 평균지출이 크고 항목에는 피혁제품이나 의류 전기제품이 있다. 그러므로 외국인들이 자주 가는 명동에 백화점부터 의료관광까지 한번에 할 수 있는

코스를 개발 해야 한다. 특히 위의 소비가 잘되는 품목들의 경우 외국인들을 도와줄 수 있는 안내서 를 준비하는 것도 좋을 것이다.

2. 외국인들은 한국의 저녁 이후의 분위기를 신기해 한다. 밤에도 여전히 외국인들이

즐길 수 있는 이벤트를 계획해 보아도 좋을 것이다 .

3. 최근에는 중국과 중동의 평균 지출액이 가장 크다. 그러므로 일본을 위주로 한 관광안내서나 관광 패키지들이 중국인이나 중동을 대상으로 변화해야 한다.

4. 여가 건강 쇼핑 기타인 경우에 평균 지출이 크다. 그 중 건강의 경우 평균지출액이

가장 크다. 의료산업과 관련되어 있을 가능성이 높다. 한국인의 이미지와 건강을 접목시킨 미용산업을 병원과 연결하여서 동시 소비가 일어날 수 있도록 장려한다.

Data 분석 (재방문여부)

2011년

일본 러시아 홍콩 사람은

처음 방문할 가능성이 크다

호주 미국 프랑스 등이

재방문 할 가능성이 높다

자연경관 감상 및

식도락 쇼핑

공연민속행사를 즐기는

관광객이 재방문의 할

가능성이 크다.(특히 사찰)

카지노나 미용 의료의 경우

처음 올 가능성이 크다.

언어소통이나 표지판

문제를 가진 사람은 재방문

할 가능성이 크다.

2010년

일본이나 중국 홍콩

사람들이 처음 방문할

가능성이 크다 .

음반 DVD 산 사람들이

처음 방문할 가능성이 크다.

미용관광의 경우 재방문

가능성이 크다

카지노나 레포츠의 경우

처음 방문할 가능성이 크다.

한국음식에 매료된 경우는

처음 방문할 가능성이 크다.

한국의 밤문화에 큰 매력을

느낀 사람들이 재방문

가능성이 크다.

2009년

일본인이나 홍콩인은

한국에 처음 올 가능성이

크다 하지만 프랑스인은

재방문할 가능성이 크다.

주로 도자기를 산 사람은

처음 방문할 가능성이 크다.

정통 민예품을 산 사람이

재방문 할 가능성이 크다

활동내역 변수는

변수선택되지 않음

-한국관광공사를 통해서 정보를 얻은 경우 처음 방문할 가능성이 크고 인터넷이나 보도를

통해서 여행정보를 입수 했을 경우에 재방문일 가능성이 커진다.

-단체여행일수록 재방문 가능성 크고 혼자오는 경우는 처음 올 가능성이 크다.

Data 분석 (Money)

2011년

일본과 중국은 여전히 하루

평균지출액과

총지출액이 크다.

하루 평균 지출액은

카지노>의료관광

총지출액은

의료관광>카지노

직장동료와 방문한 경우

가장 지출액이 적다.

2010년

일본이나 중국은 하루

지출액이 크다.

총지출액은 일본은 작다

하지만 중국은

총지출액이 크게나왔다

총지출액은 싱가포르나

러시아가 많이 쓴다.

균지출액 의료관광이

카지노에 비해 적게 나옴

식도락이 가장 큼

카지노 휴양을 즐긴 사람의

총 지출액이 크다.

관광지 식도락

유흥 테마파크를 간 경우

총 지출액이 매우 크다.

2009년

일본이나 중국 태국 국적을

경우 하루에 돈을 많이

쓰며 프랑스의 경우 하루에

돈을 적게 쓴다. 나이가

많을 수록 많이 소비

전자전기제품을 살수록

많이 소비

러시아나 중동 일본

총지출액이 크다.

점원이 불친절하다고

느낄때 총 지출액 적다.

배우자나 연인과 방문한

경우 총지출액 증가

결론 및 추천

• 한국에 오는 관광객 중에 중국인의 비율이 점점 증가하고 있다.

또한 중국인들이 일본인들에 비해서 더 돈을 많이 쓴다 하지만

중국인들이나 일본인들의 경우 처음으로 한국을 방문하는

경우가 많다. 반면에 프랑스의 경우에는 한국에 재방문할 경우가

많지만 돈을 적게 쓰는 경향이 있다. 일괄된 관광 정책이 아니라

처음 오는 관광객들이 다시 올 수 있도록 컨텐츠 보강을 해야한다.

또한 자주오는 관광객들에게는 돈을 많이 쓸 수 있는 컨텐츠 역시

개발해야한다.

• 미용 치료 관광이나 의료관광 중점으로 하여서 관광객 유치

여행 만

족도

인구학

적 정보

구매정

쉽게 얻을 수 있는 정보

추가분석

조사날짜 여행형태 국가 교육정도 직업 나이 sex 동반자 정보

설문지 문항

여행사나

항공회사

가입정보

여권정보

추가분석

2009년

2010년

Train data set

2011년

Test data set

모형적합 MSE 계산

총 지출액 하루 평균 지출액 회귀분석 TREE Random

forest방법으로 모형 적합

분석변수

추가분석 test set 평균소비 금액

Reg Tree random

Mse(Test) 0.974012 0.9730261 1.037231

Mse(train) 1.07138 1.09954 0.4889624

추가분석

Reg Tree random

Mse(Test) 0.9438662 0.968493 0.9628717

Mse(train) 0.869932 0.9147347 0.2925557

test set 총소비 금액

한국의 외래 관광 전망

데이터 분석을 통한 합리적 투자에 따른 미래

관광산업의 긍정적 에너지 순환 및 순기능

다양하고 정확한

DATA BASE 구축

세분화된 관광객 예측 오분율

• 논리적인 변수 변환 및 정제

•통계학적 다양한 모델 적용

• 관광통계에 관련된 모형 개발

•정확한 예측을 동반한 마케팅

관광객 소비패턴 예측으로 외화벌이