(발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보...

19
군집분석 방법을 사용 미디어 레퍼토리 유 형분석 +한국방송학보 22-2,200 8 -강남준 /조인호 x 2011 summer

Upload: snuuxlab

Post on 12-Jul-2015

155 views

Category:

Documents


2 download

TRANSCRIPT

Page 2: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집분석 방법을 사용한 미디어 레퍼토리 유형분석

2008. 한국방송학보 22-2

강남준, 이종영, 이혜미

Page 3: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

무엇에 대한 논문인가?

- TV, 신문, 라디오, 인터넷 등 7개 매체의 이용량을 중심으로 군집분석(K-means cluster analysis)를 실시하고,

- 미디어 레퍼토리집단을 나누어 각각의 레퍼토리 군집을 인구통계학적 특성으로 분석

Page 4: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

새 미디어가 도입되면..

기존 미디어와의 관계는

1. 기존 미디어 이용감소2. 기존 미디어 사용을 권장 or 촉진3. 아무런 영향 없음

미디어 별로 위의 관계가 다르게 나타나며, 같은 미디어라도 연구 시기나 장소에 따라결과가 다르게 나타난다

미디어 고유속성으로 결정되는 것이 아닌 시간경과, 이용자 특성, 사회/문화/미디어 지형등에 의해 달라질 수 있음 ex: DMB의 젊은세대와 높은 연령대의 차이

미디어 대체나 보완관계가 아닌 새로운 틀의 이용연구가 필요하며, 이러한 맥락에서‘미디어 레퍼토리’의 개념이 등장

Page 5: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

미디어 레퍼토리

초기에는 케이블TV의 채널 선택과정에 대한 연구로 시작

- 소수의 채널을 규칙적으로 사용 ‘채널 레퍼토리’

- 프로그램 레퍼토리, 장르 레퍼토리, 미디어 레퍼토리 등으로 확대

1. 매체 중심적 이용행위에 대한 설명력이 높다

2. 미디어 조합에 따른 유형별 분석이 용이하다

미디어 레퍼토리의 유용성

Page 6: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

미디어 레퍼토리 형성 요인

1. 인구통계학적 변인

- 연령, 학력수준 등

2. 경제적 변인

- 가계 소득, 사회적 지위 등

- 새로운 미디어의 사용은 경제적 부담을 가져온다

Page 7: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

연구문제

연구문제 1

- 미디어 이용량에 따라 군집분석방법을 이용해 구분된 미디어 레퍼토리 집단들의미디어 이용 특성은 어떻게 나타나는가?

연구문제 2

- 미디어 레퍼토리 특성을 가진 각 집단들은 인구통계학적 속성에서 어떠한 차이를보이는가?

Page 8: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

연구방법

1. 기준을 먼저 설정하고 그 기준에 따라 집단을 나누는 방법

- 검증된 이론적 기준에 따라 데이터가 분류되어 결과해석이 용이

- 비슷한 기준을 사용한 기존 연구와 비교가 가능

- 합의된 기준이 없거나 기준의 준거타당성이 약한 경우 기준 자체에 대한 논란

2. 일정한 연산 규칙에 따라 각 케이스를 묶어 가면서 데이터 스스로 집단 분류의기준을 형성하는 방법(군집분석)

- 분류 기준이 없거나 합의되지 않을 경우 기준 설정이 용이함

- 결과 해석이 어려움

- 형성된 기준이 기존 이론과 상반될 경우 결과 해석이 더욱 어려움

Page 9: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

연구자료

‘2006년 인쇄매체 수용자 조사’의 데이터 일부를 사용

- ‘2006년 인쇄매체 수용자 조사’는 전국 거주 만 18세~69세 성인 만명을 대상으로 설문지를 이용해 개별면접방식으로 진행

- TV, 신문, 라디오, 잡지/서적, 인터넷, 휴대전화, mp3등 7개 미디어

- 하루 평균 사용량과 거주지역의 규모, 인구통계학적 변수, 경제적 특징 변수

미디어 레퍼토리의 정의

- 7개 미디어의 하루 평균 사용량의 조합

- 다중 미디어 이용은 미디어 각각의 사용량 조합이 더 타당함(이용량이 다른 TV와 신문의 1분은 서로 다름)

- 군집내에서 미디어 이용량의 상대순위가 중요함(군집내 TV이용량 높아도 다른군집보다 작다면)

Page 10: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집분석이란?

장점- 대용량에 대한 탐색적 기법으로 사전적인 정보 없이 의미 있는 자료구조 도출

- 다양한 형태의 데이터에 적용 가능: 거의 모든 형태

- 변수들에 대한 역할 정의가 필요 없어 적용이 쉬움

단점- 비유사성의 거리정의와 가중치 결정이 어렵다

- K평균 군집분석의 경우 군집수 K가 적합하지 않으면 결과가 나쁘다

- 사전에 주어진 목적이 없으므로 결과 해석이 애매하다

Page 11: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

K-평균 군집분석(K-means clustering)이란?

1. 여러 데이터가 있을 때 임의로 K개의 군집 수를 정하고 이것의 군집중앙위치를 임의로 정함

2. 각각의 데이터에 대해서 K개의 군집중앙까지의 거리를 구하고 가장 가까운 군집에 속하게 함

3. 각 군집에 속해진 데이터들을 통해 군집중앙까지 평균을 구해서 중앙을 새롭게 정함

4. 새롭게 정해진 군집중앙이 이전의 중앙과 같다면 종료

5. 동일하지 않다면 2번~4번 과정을 되풀이

K의 개수를 정하는 것이 point

Page 12: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집 수 K정하기

- 계층적 군집 분석을 통해 최소9~ 최대 17개 군집 확인- 다차원 척도 군집 분석을 통해 최소 6~ 최대 12개 군집 확인6에서 17까지의 k값을 대상으로 최적의 k값을 결정

- Rand Index와 Corrected Rand Index는 값이 높을수록, Entropy는 값이 낮을 수록 재현성 좋음- K를 11로 결정

Page 13: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

11개 군집에 대한 사례 수

- 모data의 오차범위가 ±1% 이므로 군집6은 확률오차이거나 희소한 이상점(outlier) - 군집6은 분석대상으로 넣지않음

Page 14: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집별 미디어 이용특성

- 상대적 이용순위를 0~1로 정의하기 위해 (상대순위-1)/(전체 군집수-1)- 0.5를 기준으로 크면 상대적으로 덜 씀, 작으면 상대적으로 많이 씀

Page 15: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집별 인구통계학적/경제적 특성 요약

휴대전화-MP3전체 2%, 7대 광역시 거주자가 많음, 여성보다 남성 약간 많음, 만 18~29세 미혼, 높은 교육수준, 학생이 가장 많음, 개인소득은 없으나 가족 전체소득은 300~500으로 중상위권

신문-TV전체 30%, 지역차이는 없음, 여성이 남성보다 약간 많음, 고른 나이분포, 고른 학력분포(대졸이하가약간 높음), 자영업과 주부가 약간 높을 뿐 직업 특징 크게 없음, 전형적 기존미디어 이용 집단

다매체 이용전체 12%, 남성 67%, 여성 33%, 만 18~35세 미혼이 주를 이룸, 대학재학 이상이 높음, 사무/기술직과 학생이 비중이 높고 가정주부와 자영업은 매우 낮음. 중간이상 소득수준. 차세대 디지털 미디어이용 집단

매체 저이용전체 29%, 교육/연령/직업/거주지역/소득에 있어 전체 표본 분포와 비슷-> 인구통계학적 요인으로잘 설명이 안됨

TV(1), TV(2)전체 15%, 여성이 70%정도로 높음, 만 35세 이상이 전체비율보다 약간 높음, 미혼보다 기혼이 많음, 고졸 이하의 저학력 특성, 가정주부가 높음, 가족소득은 약간 높고, 개인소득은 없음

라디오-신문(1),(2)

전체의 5%, 40세 이상의 중년층 특성, 기혼 비율 높음, 고졸이하가 많음, 자영업 비율이 상대적으로높음, 가족소득/개인소득 모두 낮음

인터넷전체 1%, 지역특성은 없음, 남성이 많음, 18~29세 사이, 미혼자가 많음, 대학이상의 학력, 사무/기술직이거나 학생, 소득은 평균 이상

휴대전화전체 5%, 지역적 특성이 잘 나타남(중소도시에 70% 분포), 경기도 거주자가 압도적,(교외지역 거주자이면서 직장이나 학교를 위해 대도시로 이동하는 패턴으로 예측), 18~39세가 주류, 300이상 고소득 비율이 상대적으로 높음

Page 16: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집별 학력 특성

Page 17: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집별 성별과 나이 특성

Page 18: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집별 직업 특성

Page 19: (발제) 군집분석 방법을 사용한 미디어 레퍼토리 유형분석 +한국방송학보 22-2,2008 -강남준 /조인호 x 2011 summer

군집별 거주지역, 경제적 소득 특성