contents - tourbigdata.kr · • 데이터정제과정 • 데이터정제결과 ......

27

Upload: others

Post on 18-Sep-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

CONTENTS

01. 시스템개요 03. 쇼핑명소선정모형개발

• 기획 배경• 시스템의 예상 작동 과정

• 문제 정의• 문제 범위 설정• 모형 디자인• 데이터 정제 과정• 데이터 정제 결과• 모형 학습 및 평가

04. 스케줄러모형개발

• 문제 정의• 데이터 수집 및 정제• 최적 스케줄 계산

05. 결론및 기대효과

• 프로젝트 요약• 기대효과

02. 기초통계분석

• 개요• 외래관광객 실태조사 데이터• 신한카드 데이터

01. 시스템 개요- 기획 배경

쇼핑관광객과 쇼핑관광객이 지출한 총액이 매년 증가하고 있으며, 이들은관광정보를 얻으려 인터넷을 가장 많이 사용

• 쇼핑관광객의 비중과 쇼핑관광객이 지출한 총액은 매년 증가하는 추세로, 국내 관광산업에서 쇼핑관광의 중요성이 더욱 강조됨 (전해영, 2016)

• 2014년부터 2016년까지 외래관광객이 관광정보를 획득하는 출처는 다음과 같음(외래관광객 실태조사 데이터)

전체 외래관광객 대비 쇼핑관광객의 비중

2011년 2015년

36.6%46.9%

쇼핑관광객이 관광 중 지출한 총액

2011년 2015년

40.7억 US$

98.0억 US$

➢ 총 36,441명의 외래관광객 중 16,334명이관광정보를 얻는데 인터넷을 사용

➢ 정보를 얻지 않고 관광한 외래관광객도2,020명이나 됨

03

01. 시스템 개요- 기획 배경

쇼핑관광객의 대표적인 불만 사항은 정보의 부재와 관련되어 있으므로, 본프로젝트에서는 적절한 쇼핑 정보를 제공하는 쇼핑 경로 추천 시스템을 개발

• 국내 관광 산업에서 중요한 역할을 하는 쇼핑관광을 더욱 활성화하려면 쇼핑관광객의 불만을 해결해야 함

• 쇼핑관광객의 대표적인 불만 사항은 언어소통 불편, 안내표지판 부족, 불편한 교통 등이 있는데, 이들은 정보의부재와 관련된 불만 사항이라 할 수 있음(이은철, 2014)

• 따라서 본 프로젝트에서는 적절한 쇼핑 정보를 웹 혹은 모바일로 제공하는 쇼핑 경로 추천 시스템을 개발

언어소통불편

표지판부족

불편한교통

정보의부재

04

01. 시스템 개요- 시스템의 예상 작동 과정

쇼핑 경로 추천 시스템은 국적 , 성별 및 연령 , 체류 기간 및 쇼핑 예산 ,구매하려는 상품군을 바탕으로 적절한 쇼핑 경로를 추천

쇼핑 경로 추천 시스템국적

성별 및 연령

체류 기간 및 쇼핑 예산

구매하려는 상품군 (선택)

쇼핑명소선정 모형

스케줄러모형

쇼핑명소선정 모형

A B C D

선정된 쇼핑명소

쇼핑명소선정 모형

A B C D

쇼핑명소 선정 쇼핑명소 경로 선정

쇼핑 경로 추천

1. 쇼핑관광객이 쇼핑 경로 추천 시스템에 국적, 성별, 연령, 예상 체류 기간, 쇼핑 예산, 구매하려는 상품군을 입력. 여기서 구매하려는 상품 군은 입력하지 않아도 작동

2. 쇼핑명소 선정 모형은 외래관광객의 정보를 바탕으로 적절한 쇼핑명소를 선정하고 이를 스케줄러 모형에 전달

3. 스케줄러 모형은 대중교통을 이용하여 선정한 명소들을 최단 시간에 갈 수 있는 스케줄과 관련 대중교통정보를 외래관광객에게 전달

05

02. 기초 통계 분석- 개요

외래관광객 실태조사 데이터와 신한카드 데이터를 분석하기 전에 알아야 하는정보를 획득하기 위해 기초 통계 분석을 수행

• 경진대회에서 제공된 데이터 중 본 프로젝트에서 활용한 데이터는 외래관광객 실태조사 데이터와 신한카드 데이터임 (추가로 수집한 데이터는 기초 통계 분석을 수행하지 않음)

• 외래관광객 실태조사 데이터를 분석하기 전에 알아야 하는 정보는 다음과 같음

➢ 쇼핑관광객의 인구통계학적 특성

➢ 쇼핑관광객의 주요 방문지

➢ 쇼핑관광객의 주요 구매 물품

➢ 쇼핑관광객의 체류 기간

➢ 쇼핑관광객의 쇼핑 만족도

• 신한카드 데이터를 분석하기 전에 알아야 하는 정보는 다음과 같음

➢ 쇼핑관광객이 주로 사용하는 쇼핑 업종

➢ 쇼핑관광객의 업종별 평균 지출 비용

➢ 쇼핑관광객의 쇼핑 시간대06

02. 기초 통계 분석- 외래관광객 실태조사 데이터

쇼핑관광객의 국적은 중국, 성별은 여성, 연령대는 20대가 가장 많았으며, 주요방문지로는 명동, 동대문시장, 고궁, 남산/서울타워, 남대문시장이 있음

• 쇼핑관광객의 인구통계학적 특성 (2014년 ~ 2016년)

• 쇼핑관광객의 주요 방문지 (2014년 ~ 2016년, 중복포함)

쇼핑관광객의 국적 분포

일본 중국 대만 태국

3060명 6760명 2127명 1699명

쇼핑관광객의 성별 분포

남성 여성

4490명 9156명

※ 쇼핑관광객: 방한 목적 혹은 여행 동기가 쇼핑인 관광객

쇼핑관광객의 연령 분포

1위. 명동(12953회 방문)

2위. 동대문시장(10252회 방문)

3위. 고궁(6431회 방문)

4위. 남산/서울타워(6385회 방문)

5위. 남대문시장(4964회 방문)

07

02. 기초 통계 분석- 외래관광객 실태조사 데이터

쇼핑관광객은 주로 향수/화장품, 의류를 비롯한 패션상품을 많이 사는 것을확인하였으며, 쇼핑관광객의 쇼핑 만족도는 평균 4.34점으로 높음을 확인

• 쇼핑관광객의 주요 구매 물품 (2014년 ~ 2016년, 중복포함)

• 쇼핑관광객의 체류 기간: 평균 7.39일, 표준편차 18.44일로 관광객에 따라 차이가 매우 큼

• 쇼핑관광객의 쇼핑 만족도 분포 (2014년 ~ 2016년)

1위. 향수/화장품(12042회 구매)

2위. 의류(8975회 구매)

3위. 식료품(7279회 구매)

4위. 신발류(3421회 구매)

5위. 인삼/한약재(2334회 구매)

매우 만족만족보통불만족매우 불만족

13명 60명 900명 6943명 5725명

08

02. 기초 통계 분석- 신한카드 데이터

쇼핑관광객은 남녀 기성복, 화장품, 백화점, 할인점/슈퍼마켓, 면세점 등을 주로오후/저녁 시간대에 방문함을 확인

• 쇼핑관광객의 주로 사용하는 쇼핑 업종과 평균 지출 비용 (2014년 ~ 2016년)

• 쇼핑관광객의 쇼핑 시간대

1위. 남녀 기성복- 122532회 구매- 평균 48353원 지출

2위. 화장품- 94745회 구매- 평균 42648원 지출

3위. 백화점- 15773회 구매- 평균 1047216원 지출

4위. 할인점/슈퍼마켓- 15115회 구매- 평균 35091원 지출

5위. 면세점- 7721회 구매- 평균 3262083원 지출

09

03. 쇼핑명소 선정 모형 개발- 문제 정의

쇼핑명소 선정 모형은 관광객의 특성과 구매하려는 상품을 바탕으로쇼핑명소와 쇼핑업종을 추천

• 쇼핑명소 선정 모형은 관광객의 국적, 성별, 연령, 체류 기간, 쇼핑 예산, 구매하려는 상품(선택)을 바탕으로 쇼핑명소와 쇼핑업종을 추천

• 추천 방법은 이전에 방한했던 쇼핑관광객 중 쇼핑 만족도가 높은 관광객의 특성(국적, 성별, 연령, 체류 기간, 쇼핑 예산)과 구매했던 상품에 따라 방문했던 쇼핑명소와 쇼핑업종을 추천

2014 ~ 2016년에방한한 쇼핑관광객

만족한쇼핑관광객

특성 분류

• 20대 일본 여성• 구매하려는 상품: 입력되지 않음

• 30대 대만 남성• 구매하려는 상품: 의류, 신발류

화장품 추천

쇼핑 경로

쇼핑명소 쇼핑업종

10

03. 쇼핑명소 선정 모형 개발- 문제 범위 설정

쇼핑명소 선정 모형을 개발할 때, 열 곳의 쇼핑명소, 다섯 곳의 쇼핑업종, 열개의 상품을 고려

• 고려하는 쇼핑명소는 쇼핑관광객이 가장 많이 방문하는 15곳의 관광지 가운데, 쇼핑과 무관하거나 신한 카드 데이터와 매칭할 수 없는 곳을 제외한 10곳의 관광지

➢ 명동, 동대문시장, 남산/서울타워, 남대문시장, 신촌/홍대, 인사동, 잠실, 강남역, 북촌/삼청동, 이태원

• 고려하는 쇼핑업종은 쇼핑관광객이 가장 많이 방문하는 5곳의 업종

➢ 남녀 기성복 매장, 화장품 매장, 백화점, 할인점/슈퍼마켓, 면세점

• 고려하는 상품은 쇼핑관광객이 가장 많이 구매하는 상품 가운데, 담배를 제외한 10개의 품목

➢ 향수/화장품, 의류, 식료품, 신발류, 인삼/한약재, 피혁제품, 주류, 김치, 보석/액세서리, 전통민예품

정의한 문제와 문제 범위에 따라, 데이터를 정제하고 모형을 디자인함

11

03. 쇼핑명소 선정 모형 개발- 모형 디자인

쇼핑명소 선정 모형은 베이지안 네트워크 모형을 바탕으로 개발하며, 이 모형은총 30개의 확률 변수를 포함

상품 종류

𝑦1

𝑦2

𝑦9

𝑦10

관광객 특성

𝑥1

𝑥2

𝑥3

𝑥4

𝑥5

쇼핑명소

𝑧1

𝑧2

𝑧9

𝑧10

쇼핑업종

𝑤1

𝑤2

𝑤4

𝑤5

𝑤3

12

• 이 모형은 관광객 특성이입력되었을 때, 구매할 가확률이 높은 상품 종류, 방문할 확률이 높은 쇼핑명소와 쇼핑업종을 찾도록디자인함

• 디자인한 모형을 바탕으로데이터를 정제함

03. 쇼핑명소 선정 모형 개발- 데이터 정제 과정

쇼핑명소 선정 모형을 개발하기 위해, 외래관광객 실태조사 데이터를 각각 세단계를 거쳐 정제함

• 외래관광객 실태조사 데이터는 다음과 같은 과정을 거쳐 정제함

원본 데이터선택된 레코드로구성된 데이터

✓ 방한 목적 혹은 여행 동기가 쇼핑✓ 쇼핑 만족도가 4점 이상✓ 거주국이 일본, 중국, 대만, 태국 중 하나✓ 고려하는 쇼핑명소 중 한 군데 이상 방문

레코드 선택 선택된 변수와레코드로 구성된

데이터

변수 선택

✓ 성별 및 연령✓ 거주국✓ 방문지✓ 체류 기간✓ 쇼핑품목

최종 정제 데이터

✓ 방문지 변수를 본 프로젝트에서 고려한 각각의 쇼핑명소를 방문했는지를 나타내는 10개의 변수로 분할(예: 명동 방문 여부)

✓ 쇼핑품목 변수를 본 프로젝트에서 고려한 각각의 쇼핑 품목을 구입했는지를 나타내는 10개의 변수로 분할 (예: 의류 구매 여부)

✓ 체류 기간과 쇼핑비용 변수를 명목화

명목 변수 생성

13

03. 쇼핑명소 선정 모형 개발- 데이터 정제 과정

쇼핑명소 선정 모형을 개발하기 위해, 신한 카드 데이터를 세 단계를 거쳐정제함

• 신한카드 데이터는 다음과 같은 과정을 거쳐 정제함

원본 데이터선택된 레코드로구성된 데이터

레코드 선택 선택된 변수와레코드로 구성된

데이터

변수 선택최종 정제 데이터

지역 매칭

✓ 거래 지역이 본 프로젝트에서 고려한 쇼핑명소 중하나

✓ 거래자의 국적이 일본, 중국, 대만, 태국 중 하나✓ 업종이 본 프로젝트에서 고려한 쇼핑업종 중 하나

✓ 국적✓ 업종✓ 지역

✓ 외래관광객 실태조사에서 쇼핑명소의 지역명과 신한 카드 데이터의 지역을 매칭함

14

03. 쇼핑명소 선정 모형 개발- 데이터 정제 결과

정제한 외래관광객 실태조사 데이터는 다음과 같이 구성됨

구분 변수 설명 값

관광객 특성

𝑥1 관광객의 국적 1: 일본, 2: 중국, 3: 대만, 4: 태국

𝑥2 관광객의 성별 1: 남성, 2: 여성

𝑥3 관광객의 연령 0: 15~ 20세, 1: 21~ 30세, 2: 31~ 40세, 3: 41~ 50세, 4: 51~ 60세, 5: 61세 이상

𝑥4 체류 기간 1: 1 ~ 3일, 2: 4 ~ 6일, 3: 7일 이상

𝑥5 쇼핑 예산 1: 300 달러 미만, 2: 300달러 ~ 600달러, 3: 600달러 ~ 1200달러, 4: 1200달러 이상

상품종류

𝑦1 향수/화장품

0: 구매하지 않음, 1: 구매함

𝑦2 의류

𝑦3 식료품

𝑦4 신발류

𝑦5 인삼/한약재

𝑦6 피혁제품

𝑦7 주류

𝑦8 김치

𝑦9 보석/액세서리

𝑦10 전통민예품 15

03. 쇼핑명소 선정 모형 개발- 데이터 정제 결과

정제한 외래관광객 실태조사 데이터는 다음과 같이 구성됨 (계속)

구분 변수 설명 값

쇼핑명소

𝑦1 명동

0: 방문하지 않음, 1: 방문함

𝑦2 동대문시장

𝑦3 남산서울타워

𝑦4 남대문시장

𝑦5 신촌홍대

𝑦6 인사동

𝑦7 잠실

𝑦8 강남역

𝑦9 북촌/삼청동

𝑦10 이태원

16

03. 쇼핑명소 선정 모형 개발- 데이터 정제 결과

정제한 신한카드 데이터는 다음과 같이 구성됨

구분 변수 설명 값

쇼핑업종

𝑤1 남녀 기성복 매장

0: 방문하지 않음, 1: 방문함

𝑤2 화장품 매장

𝑤3 백화점

𝑤4 할인점/슈퍼마켓

𝑤5 면세점

쇼핑명소

𝑦1 명동

0: 방문하지 않음, 1: 방문함

𝑦2 동대문시장

𝑦3 남산서울타워

𝑦4 남대문시장

𝑦5 신촌홍대

𝑦6 인사동

𝑦7 잠실

𝑦8 강남역

𝑦9 북촌/삼청동

𝑦10 이태원 17

03. 쇼핑명소 선정 모형 개발- 모형 학습 및 평가

베이지안 네트워크의 모형 학습은 각 변수 간 조건부 확률을 추론하는 것으로,추론해야 하는 확률은 총 세 종류임

• 고객의 특성이 주어졌을 때 특정 상품 𝑦𝑗를 구매할 확률인 𝑃𝑟 𝑦𝑗 = y𝑗|𝒙 = 𝐱 은𝑁 𝒙=𝐱, 𝑦𝑗 = y𝑗 + 0.5

𝑁 𝒙 = 𝐱 + 1으로 추정

➢ 𝑁 𝒙 = 𝐱 는 외래관광객 실태조사 데이터에서 특성이 𝐱인 관광객의 수를, 𝑁 𝒙 = 𝐱, 𝑦𝑗 = y𝑗 는 같은 데이터에서 특성이 𝐱

인 관광객 가운데 상품 𝑦𝑗를 구매한 횟수를 나타냄

• 고객이 사려는 물품을 알 때 특정 쇼핑명소 𝑧𝑘를 방문할 확률인 𝑃𝑟 𝑧𝑘 = z𝑘|𝒚 = 𝐲 은𝑁 𝒚=𝐲, 𝑧𝑘 = z𝑘 + 0.5

𝑁 𝒚 = 𝒚 + 1으로 추정

➢ 𝑁 𝒚 = 𝐲, 𝑧𝑘 = z𝑘 는 외래관광객 실태조사 데이터에서 상품 𝐲를 구매한 관광객 가운데 (예: 𝐲 = (1, 1, 0, 0, … , 0): 첫 번째와 두 번째 상품만 구매함을 나타냄), 쇼핑명소 𝑧𝑘를 방문한 관광객의 수를 나타냄

• 고객이 방문할 쇼핑명소와 고객의 쇼핑예산을 알 때 특정 쇼핑업종 𝑤𝑙을 방문할 확률인 𝑃𝑟(

)

𝑤𝑙 = w𝑙|𝒛 = 𝐳, 𝑥5 =

x5 은 0 혹은𝑁 𝒛 = 𝐳, 𝑤𝑙 =w𝑙 + 0.5

𝑁 𝒛 = 𝒛 + 1으로 추정

➢ 0으로 추정하는 경우: 기초 통계 분석에서 살펴보았듯이, 외래관광객이 백화점과 면세점을 1회 방문하면 평균적으로 100만원을 넘게 사용하므로, 쇼핑예산이 1200달러 미만인 외래관광객에게는 백화점과 면세점을 추천하지 않음

➢ 𝑁 𝒛 = 𝐳 와 𝑁 𝒛 = 𝐳, 𝑤𝑙 = w𝑙 은 신한카드 데이터에서 쇼핑명소 𝐳 내에서 발생한 총 거래 건수와 그 거래 중 쇼핑업종이 w𝑙에서 발생한 총 거래건수를 나타냄

• 모든 확률은 학습 데이터 (전체 데이터에서 임의로 70%를 선택)를 바탕으로 추정함18

03. 쇼핑명소 선정 모형 개발- 모형 학습 및 평가

앞서 추론한 확률을 바탕으로 추천을 수행하며, 추천 과정은 크 게 네 단계로구성됨

• 앞서 추론한 확률을 바탕으로 추천을 수행하며, 추천 과정을 예시(특성이 𝒙 = 2, 2, 2, 3, 1 이고 구매할 상품을 입력하지 않은 쇼핑관광객)를 통해 설명

1. 모든 𝑗에 대해 𝑃𝑟 𝑦𝑗 = 0|𝒙 = 𝐱 과 𝑃𝑟 𝑦𝑗 = 1|𝒙 = 𝐱 비교

➢ 비교 결과, 𝑦1, 𝑦6, 𝑦8만 𝑃𝑟 𝑦𝑗 = 1|𝒙 = 𝐱 > 𝑃𝑟 𝑦𝑗 = 0|𝒙 = 𝐱 을 만족

➢ 따라서 𝐲 = (1, 0, 0, 0, 0, 1, 0, 1, 0, 0)이라 가정

2. 모든 𝑘에 대해, 𝑃𝑟 𝑧𝑘 = 0|𝒚 = 𝐲 과 𝑃𝑟 𝑧𝑘 = 1|𝒚 = 𝐲 을 비교

➢ 비교 결과, 𝑧4, 𝑧7, 𝑧10만 𝑃𝑟 𝑧𝑘 = 1|𝒚 = 𝐲 > 𝑃𝑟 𝑧𝑘 = 0|𝒚 = 𝐲 을 만족➢ 따라서 𝐳 = (0, 0, 0, 1, 0, 0, 1, 0, 0, 1)이라 가정하고 𝑧4, 𝑧7, 𝑧10 를 쇼핑명소로 추천

3. x5 = 1이므로 𝑃𝑟 𝑤3 = 1|𝒛 = 𝐳, 𝑥5 = x5 = 𝑃𝑟 𝑤5 = 1|𝒛 = 𝐳, 𝑥5 = x5 = 0

4. 3과 5를 제외한 𝑙에 대해, 𝑃𝑟 𝑤𝑙 = 1|𝒛 = 𝐳, 𝑥5 = x5 와 𝑃𝑟 𝑤𝑙 = 0|𝒛 = 𝐳, 𝑥5 = x5 을 비교

➢ 𝑤1와 𝑤2만 𝑃𝑟 𝑤𝑙 = 1|𝒛 = 𝐳, 𝑥5 = x5 > 𝑃𝑟 𝑤𝑙 = 0|𝒛 = 𝐳, 𝑥5 = x5 을 만족➢ 따라서 𝑤1와 𝑤2를 쇼핑업종으로 추천

19

03. 쇼핑명소 선정 모형 개발- 모형 학습 및 평가

쇼핑명소 선정 모형이 추천한 쇼핑명소와 쇼핑만족도가 높은 관광객이방문했던 쇼핑명소가 얼마나 일치하는 지를 바탕으로 이 모형을 평가하였음

• 쇼핑명소 선정 모형이 추천한 쇼핑명소와 쇼핑만족도가 높은 관광객이 방문했던 쇼핑명소가 얼마나 일치하는지를 바탕으로 이 모형을 평가함

• 위 과정을 평가 데이터에 있는 모든 레코드 (총 3,871개)에 대해 반복하여, 일치도의 평균으로 모형을 평가

➢ 만약 쇼핑명소 선정 모형에 입력된 특성과 똑같은 쇼핑관광객이 평가 데이터에 없으면 그 관광객에 대해 일치도를 계산하지 않음. 만약 두 명 이상의 쇼핑관광객이 있으면 평균으로 사용 (예: 어떤 사람은 방문했고 어떤 사람은 방문하지 않았으면 0.5회 방문했다고 가정)

➢ 어느 상품을 살 것인지 정보가 입력되지 않은 경우: 0.7421➢ 어느 상품을 살 것인지 정보가 입력된 경우: 0.8357

쇼핑명소선정 모형

학습데이터

1. 학습

평가데이터

2. 외래관광객특성 입력

4. 일치도 계산ො𝒛 = Ƹ𝑧1, Ƹ𝑧2, … , Ƹ𝑧10

3. 모든 관광객에 대해업종 추천

𝒛 = 𝑧1, 𝑧2, … , 𝑧10

3. 이 외래관광객과 특성이 똑같은 실제 쇼핑관광객이 방문했던 쇼핑명소 가져오기

𝐶 ො𝒛, 𝒛 = 1 −σ𝑖=110 𝑧1 − Ƹ𝑧1

2

10

20

04. 스케줄러 모형 개발- 문제 정의

스케줄러 모형은 쇼핑명소들을 최단 시간으로 갈 수 있는 경로를 도출하는것이며, 이 문제는 외판원 문제의 일종이라 볼 수 있음

• 스케줄러 모형은 쇼핑명소 선정 모형이 선정한 쇼핑명소를 최단 시간으로 갈 수 있는 경로를 도출함

• 이 문제는 외판원 문제(Traveling Salesperson Problem, TSP)의 일종이라 볼 수 있음

➢ TSP는 외판원이 한 도시에서 출발해서 다른 도시들을 각각 한 번씩 방문하고 다시 처음의 도시로 돌아올 때, 가장 짧은경로를 구하는 문제

➢ 이 문제는 NP-hard 문제라는 것이 증명되어 있어, 휴리스틱(heuristic) 한 풀이가 필요함

➢ 본 프로젝트에서는 대표적인 메타 휴리스틱 알고리즘인 유전 알고리즘을 이용하여 최적 쇼핑 경로를 계산

쇼핑명소선정 모형

선정된 쇼핑명소 집합 추천된 쇼핑 경로

S스케줄러모형

위 그림에서 은 선정된 쇼핑명소를 은 출발지(인천공항)를 나타냄S

21

04. 스케줄러 모형 개발- 데이터 수집 및 정제

대중교통을 이용하여 한 쇼핑명소에서 다른 쇼핑명소까지 가는 시간을 네이버지도 API를 활용하여 획득함

• 아래 표는 네이버 지도 API를 활용하여 획득한 한 쇼핑명소(세로축)에서 다른 쇼핑명소(가로축)까지 대중교통을이용하여 가는 데 가장 적게 걸리는 시간(분)을 나타냄

𝑧0 𝑧1 𝑧2 𝑧3 𝑧4 𝑧5 𝑧6 𝑧7 𝑧8 𝑧9 𝑧10

𝑧0 0 79 68 116 63 72 66 116 97 94 81

𝑧1 81 0 16 28 12 36 22 53 40 29 26

𝑧2 68 21 0 38 22 36 16 57 40 23 31

𝑧3 109 21 31 0 24 52 34 69 47 41 33

𝑧4 63 10 18 37 0 30 21 54 40 28 21

𝑧5 72 27 35 55 25 0 31 69 51 39 32

𝑧6 66 22 16 44 19 29 0 59 39 15 35

𝑧7 112 53 57 70 54 69 59 0 26 64 57

𝑧8 94 42 38 42 40 52 36 27 0 45 31

𝑧9 93 29 24 40 29 43 16 65 47 0 42

𝑧10 84 25 33 32 23 32 36 57 30 45 0

➢ 버스나 지하철 경로에 따라 𝑧𝑖에서𝑧𝑗로 가는 시간과 𝑧𝑗에서 𝑧𝑖로 가는

시간이 다를 수 있으므로, 대칭이 아님

𝑧0 인천 국제공항

𝑧1 명동

𝑧2 동대문시장

𝑧3 남산서울타워

𝑧4 남대문시장

𝑧5 신촌홍대

𝑧6 인사동

𝑧7 잠실

𝑧8 강남역

𝑧9 북촌/삼청동

𝑧10 이태원

22

04. 스케줄러 모형 개발- 최적 스케줄 계산

추천될 수 있는 모든 명소 집합에 대해 최적 스케줄을 계산하고 , 이를쇼핑관광객에게 제공하는 방법을 도출

• 추천될 수 있는 모든 명소 집합 (총 1,023개 = 210 − 1개)에 대해 유전 알고리즘을 이용하여 최적 스케줄을 계산

➢ (예시) 추천된 명소 집합 = {명동, 동대문시장, 남산서울타워, 홍대/신촌, 잠실, 강남역, 북촌/삼청동, 이태원}

최적 경로: 인천국제공항 → 동대문시장 → 북촌/삼청동 → 남산서울타워 → 명동 → 잠실 → 강남역→ 이태원 → 홍대/신촌 → 인천국제공항 (366분 소요)

• 유전 알고리즘을 이용하여 계산한 스케줄과 모든 경로를 비교하여 계산한 최적 스케줄과 100% 일치하였는데, 이는 고려하는 쇼핑명소가 많지 않기 때문이라 판단

• 최적 경로에 대해 다음과 같은 교통 정보를 제공

➢ (예시) 최적 경로: 인천국제공항 → 남대문시장 → 명동 → 동대문시장 → 인천국제공항

인천국제공항

남대문시장

명동동대문시장1) 인천국제공항역

공항철도 전철 승차

2) 1호선 서울역 하차

1) 간선 604번 버스 승차

2) 명동입구 정류장 하차

1) 간선 104번 버스 승차

2) 종로 5가 정류장 하차

1) 1호선 종로5가역 승차, 2) 서울역에서 공항철도로 환승, 3) 인천국제공항역 하차

23

05. 결론- 프로젝트 요약

추천될 수 있는 모든 명소 집합에 대해 최적 스케줄을 계산하고 , 이를쇼핑관광객에게 제공하는 방법을 도출

• 쇼핑을 목적으로 방한하는 외래관광객인 쇼핑관광객이 증가하고 관련 매출도 확대되면서 국내 관광산업 내 쇼핑관광의 중요성이 높아짐

• 쇼핑관광객의 대표적인 불만 사항은 관련 정보의 부재와 직접 관련됨

• 본 프로젝트에서는 쇼핑관광을 활성화하려는 방안으로 쇼핑 경로 추천 시스템을 제안하였음

• 이 시스템은 크게 쇼핑명소 선정 모형과 스케줄러 모형으로 구성

➢ 쇼핑명소 선정 모형: 외래관광객의 정보를 바탕으로 적절한 쇼핑명소를 선정하고 이를 스케줄러 모형에 전달

➢ 스케줄러 모형: 선정한 명소들을 최단 시간에 갈 수 있는 스케줄을 계산하여 관련 교통정보와 함께 외래관광객에게 전달

24

05. 결론- 기대효과

본 프로젝트에서 개발한 쇼핑 경로 추천 시스템은 쇼핑관광객의 불만 사항을해결함으로써 쇼핑관광을 활성화하는데 기여하리라 기대

• 본 프로젝트에서 개발한 쇼핑 경로 추천 시스템은 쇼핑관광객의 불만 사항을 해결함으로써 쇼핑관광을 활성화하는데 기여하리라 기대

• 쇼핑 경로 추천 시스템이 입력 값으로 사용하는 데이터는 각각 쇼핑관광객의 정보와 미리 계산해둔최적 경로이므로, 외래관광객이 원하면 언제든 쉽게 사용 가능

• 특히, 쇼핑관광객의 쇼핑만족도는 3년 내 한국 재방문 의사와 상관성이 높기에 (상관관계: 0.8431), 제안한 시스템은 신규 쇼핑관광객 유입 뿐 아니라 기존 쇼핑관광객의 이탈도 막을 수 있음

25

참고문헌

• 이은철 (2014), 대한상의, 한국 방문 중∙일 관광객 쇼핑현황 실태조사, NewsWire, 749085.

• 전해영 (2016), 방한 쇼핑관광객의 특징과 시사점, 현대경제연구원 VIP 리포트, 16(23).

26