디지털 미디어 컨텐츠 독서과제

36
1113399 김유진 데이터�시각화�설계와�활용 데이터에�내재된�인사이트�발견과�표현�방법 앤디�커크�지음

Upload: youjin-kim

Post on 07-Jan-2017

248 views

Category:

Data & Analytics


2 download

TRANSCRIPT

Page 1: 디지털 미디어 컨텐츠 독서과제

1113399 김유진

데이터�시각화�설계와�활용데이터에�내재된�인사이트�발견과�표현�방법

앤디�커크�지음

Page 2: 디지털 미디어 컨텐츠 독서과제

목차

1. 데이터�시각화의�맥락

2. 프로젝트의�목표�설정�및�핵심�요소�확인

3. 편집�방향�설정, 데이터�파악

4. 시각화�디자인�옵션�결정

5. 데이터�시각화�방법론�분류체계

6. 시각화�솔루션�구축�및�평가

- 목차

Page 3: 디지털 미디어 컨텐츠 독서과제

1장 . 데이터�시각화의�맥락

- 데이터 시각화의�맥락

1장에서는�데이터�시각화�분야가�성장한 배경과, 데이터�시각화의�역할과�기반 지식, 정의와�방법론의�필요성에�대하여 간략하게�설명할�것이다.

Page 4: 디지털 미디어 컨텐츠 독서과제

- 데이터 시각화의�맥락

데이터�시각화 = 낯선�개념파이차트, 막대�그래프�역시�데이터�시각화다

<출처> SIPRAI 군�지출�자료 <출처> 경찰청

Page 5: 디지털 미디어 컨텐츠 독서과제

- 데이터 시각화의�맥락

새로운�기술력 데이터에�대한

투명한�접근성을 원하는�문화

Page 6: 디지털 미디어 컨텐츠 독서과제

데이터�시각화 분야�성장

- 데이터 시각화의�맥락

Page 7: 디지털 미디어 컨텐츠 독서과제

- 데이터 시각화의�맥락

우리는�현재�우리가�하는�모든�일이 디지털�정보로�남는�시대에�살고�있다. 우리는 축적된이�디지털�정보의�양이 어마어마�하고�이것의이�새로운�자원이 되고�있음을�쉽게�추측해�볼�수�있다.

Page 8: 디지털 미디어 컨텐츠 독서과제

데이터가�새로운�자원이라면 데이터�시각화는 데이터의�가치를�드러내는�엔진의�역할이다

- 데이터 시각화의�맥락

Page 9: 디지털 미디어 컨텐츠 독서과제

데이터�시각화는�무엇을�가능하게�할까 ?

- 데이터 시각화의�맥락

발견을�위한�기회를�제공한다.

단순�정보�나열에서�볼�수�없었던�정보를�발견할�수�있게�한다.시각적�표현�방식을�활요하면, 정보의�패턴과�관계, 특이점과�같은�특성을�발견하기�쉬워진다. 즉, 발견의�과정이다. 단순히�정보를�보는것이�아니라, 이해하게�된다.

Page 10: 디지털 미디어 컨텐츠 독서과제

그렇다면�데이터�시각화는�어떤�지식을기반으로�하는�것일까?

- 데이터 시각화의�맥락

예술 과학통계학

전산학

시각적�표현과�관련된

인지과학에

대한�이해

시지각�연구

데이터�시각화

Page 11: 디지털 미디어 컨텐츠 독서과제

이제는�데이터�시각화의�정의를 내려보자 하지만�그�전에 3가지의�주요�개념을�먼저�알아보자

- 데이터 시각화의�맥락

Page 12: 디지털 미디어 컨텐츠 독서과제

수신자= 독자이며

사용자이다.시각화�산출물을

사용한다

메세지=전달되는�내용으로 커뮤니케이션�채널, 온라인�인터랙티브,

터치�스크린, 인포그래픽�등이�있다.

- 데이터 시각화의�맥락

아이디어�발견복잡성�결과를�코드화�하여�전달

시지각�능력을�활용하여�메시지를 가장�효율적으로�해석하여�영감,

통찰�등을�얻게�된다.

메신저= 디자이너이다.데이터의�결과와 분석�내용의�이야기를 전달한다

Page 13: 디지털 미디어 컨텐츠 독서과제

즉, 데이터�시각화란�인지를�확장시키기 위해�시지각�능력을�활용하여�데이터를 묘사하고�표현하는�것이다.

- 데이터 시각화의�맥락

Page 14: 디지털 미디어 컨텐츠 독서과제

1. 데이터의�형상화 : 물리적으로�데이터를�표현하기�위해�선택한�방식

2. 데이터의�표현 : 데이터의�묘사�이후의�단계

3. 시지각능력의�활용 : 눈과�뇌가�정보를�효과적으로�처리하는�방법을

과학적으로�이해하는�것

4. 인지의�확장 : 정보를�생각이나�통찰, 지식으로�처리하는�방법을

효과적이고�효율적으로�극대화�하는�것

이�정의에�포함된�세부�요소들

- 데이터 시각화의�맥락

Page 15: 디지털 미디어 컨텐츠 독서과제

데이터�다루는�일은�전문가의�영역이�아니라 일반�업무가�되어지고,

대중이�접근하기�용이해짐과�동시에 그들이�데이터를�해석하고�이해할�수�있도록�해야�되는게�되어�버렸다.

스티븐�퓨 “ 효과적으로�정보를�표현하는�기술은�직관이�아니라

학습을�통해�얻어진�원칙에�의해�습득�된다.”

- 데이터 시각화의�맥락

Page 16: 디지털 미디어 컨텐츠 독서과제

- 데이터 시각화의�맥락

대중을�위한 시각화�기법을

확립해야�할 필요성이�대두됨

효과성 측면에서새로운

단계로�넘어갈�수 있게�하는�원칙

필요함

원칙을�위한방법론이필요하다

지금까지는�직관적이고,

본능적으로�해왔으나

새로운�단계로

넘어가야�하기에

데이터�시각화�방법론의�대두�과정�요약

Page 17: 디지털 미디어 컨텐츠 독서과제

정리하자면, 데이터�시각화의�목표는인지의�증폭이다

- 데이터 시각화의�맥락

이를�위해서형식과�기능을�모두�고려하라 : 심미적이면서도�기능적이어야�한다.

모든�일의�필요성을�증명하라 : 개별의�표시와�특징들, 디자인�요소�하나하나가�포함되거나

제외될�때, 혹은�사용될�때�그에�적합한�근거�하에�실행해라.

직관적인�디자인을�통해�접근성�확보해라 : 공간추론과�시각적인지에�의한�패턴인식을

더�활용해서�사용자들이�제품을�이해할�때�쓸데없는�시간을�낭비하지�않도록�해라.

그러나�접근성과�즉시성을�구분해야한다. 데이터�프레임�워크�자체가�복잡할�수도�있다.

사용자를�속이지�마라 : 데이터를�비효율적이거나�부적절한�방식으로�표현�말아라.

Page 18: 디지털 미디어 컨텐츠 독서과제

2. 프로젝트의�목표�설정�및�핵심�요소�확인

- 프로젝트의 목표설정�및 핵심요소�확인

2 장�부터는�앞서�설명하였던 데이터�시각화�방법론을 단계적으로�전개하도록�한다.

Page 19: 디지털 미디어 컨텐츠 독서과제

- 프로젝트의 목표설정�및 핵심요소�확인

1. 먼저, 프로젝트의�목적을�명확하게�해야

자발적 프로젝트

일을 의뢰

받았을 경우

어떤�대상으로�하는건지�탐구하고

이들이�무엇을�필요로�할지

파악�해야한다

Page 20: 디지털 미디어 컨텐츠 독서과제

- 프로젝트의 목표설정�및 핵심요소�확인

2. 의도�설정 : 시각화의�기능적�측면

구체적이고, 집중적인�내용을�서술 디자이너가�작업을�많이�해서�데이터�세트로�부터�흥미로운�이야기와�분석을

명확하게�보여줘야�한다.

1. 설명을�위한�용도

2. 탐색을�위한�용도 사용자가�주도적으로�시각화를�경험하는�과정중에 데이터를�쉽게�이해하고, 정보를�얻을�수�있도록�주력해야�한다.

시각적�분석에�가까움.

3. 표현을�위한�용도 전시를�의도된�기능으로�포함하면, 데이터�시각화에�대한�정의한�일관성과�달라지기에 , 논란이�있다.

그러나�데이터를�활용한�개인적인�표현이나, 작품의�전시라고�보는�데이터�예술이라고�본다. 구조화된�스토리가�약하고�시각적�분석기능을�제공하지�않는다는�특징을�가진다.

Page 21: 디지털 미디어 컨텐츠 독서과제

- 프로젝트의 목표설정�및 핵심요소�확인

1. 설명을�위한�용도

<출처> 마크�피세티, 젠�크리스티안센, 상수도�소비량 Top 10 국가

Page 22: 디지털 미디어 컨텐츠 독서과제

- 프로젝트의 목표설정�및 핵심요소�확인

2. 탐색을�위한�용도

<출처> 마이크�보스톡의�산점도�행렬

Page 23: 디지털 미디어 컨텐츠 독서과제

- 프로젝트의 목표설정�및 핵심요소�확인

3. 표현을�위한�용도

<출처> 캠퍼�스미스의 ‘더�로드’에�사용된�형용사

Page 24: 디지털 미디어 컨텐츠 독서과제

3. 의도�설정 : 시각화의�분위기

- 프로젝트의 목표설정�및 핵심요소�확인

현재하고�있는�작업�내용이�설명, 탐색, 전시�중�어디에�속하는지�판단한�후에

적합한�분위기를�설정한다는�것은

기능을�넘어서서 디자인�경험의�스타일을�정하는�역할을�함.

예술적�관점경험적�면데이터의

창조적�표현법관중들과의

새로운미학적�연결고리강조

과학적�관점시각화로부터나온�결과의

정확성과효율성�보존�강조

두�관점�사이를�저울질�하게�된다.감정적이고�추상적으로 정확하고�추상적으로

Page 25: 디지털 미디어 컨텐츠 독서과제

전시를�의도된�기능으로�포함하면, 데이터�시각화에�대한�정의한�일관성과�달라지기에 , 논란이�있다.

그러나�데이터를�활용한�개인적인�표현이나, 작품의�전시라고�보는�데이터�예술이라고�본다. 구조화된�스토리가�약하고�시각적�분석기능을�제공하지�않는다는�특징을�가진다.

- 프로젝트의 목표설정�및 핵심요소�확인

4. 시각화 프로젝트를

둘러싼핵심요소들

목적 시간적�압박

고객의�압박

기술적�역량

Page 26: 디지털 미디어 컨텐츠 독서과제

- 프로젝트의 목표설정�및 핵심요소�확인 5. 데이터�시각�디자인�분야의 8개�모자�모델

리더 데이터�과학자 기자 컴퓨터과학자

디자이너 인지과학자 전달자 프로젝트�매니저

데이터를�탐색하고 다양한�디자인을 탐구한다. 전체적분위기, 기능�설정, 타깃�고객�파악

창의적인�사람. 컴퓨터�과학자와 조화를�이루어 솔루션을�만들어 내는�사람

데이터의�확보, 획득, 처리, 준비하는�데 책임이�있음.

사상가들. 기술이나 디자인�솔루션의 효과적�뒤에�숨겨진 과학을�이해하는�사람

스토리�텔러, 문제에�대한�내러티브 방식을�결정. 핵심�스토리를�만들고, 분석을�진행하기�위한 관점�잡아나감.

프로젝트�의사소통에 관한�일을�함. 협상가이자 발표자�역할. 사용자, 고객 , 디자이너�간의�소통자

실행하는�사람. 궁극의�기술력으로 솔루션�구축. 데이터�수집, 조작, 사전�제작 시각화�작업.

프로세스와 진척도�관리, 인내심, 책임감, 무결성과 시각화�윤리성�책임

Page 27: 디지털 미디어 컨텐츠 독서과제

3. 편집�방향�설정, 데이터�파악

- 편집�방향�설정, 데이터�파악

3장에서는�앞으로�작업하게�될�데이터와 관련된�이슈, 추출하고�표현하고자�하는 스토리와�관련된�이슈를�살펴본다.

Page 28: 디지털 미디어 컨텐츠 독서과제

- 편집�방향�설정, 데이터�파악

-편집�방향의�중요성

편집�방향은�독자에게�이야기하려고�하는 구체적인�메세지가�무엇인지�결정하는�것이다

고로�편집�방향을�까다롭게�선별해야�한다.

Page 29: 디지털 미디어 컨텐츠 독서과제

- 편집�방향�설정, 데이터�파악 1. 전처리�및�데이터�파악

일단�데이터를�보유해야�한다. 동료, 고객�혹은�서드파티단체를�통해�획득,정부시스템�다운로드, 수작업�기록, 웹�기반 API에서�추출,

웹사이트에서�스크랩 , PDF 파일에서�추출등

1. 획득

2. 검수 데이터를�입수했다면�철저한�조사를�통해�획득한�데이터의�적절성에�대한 신뢰도를�확인한다.

즉, 데이터가�얼마나�적합하고�완벽한지�평가하는�것�포함완전성과�품질�확인.

3. 데이터�타입분류 원천�데이터의�성질을�이해하는�것

범주형�명목�데이터, 범주형�서열�데이터, 정량�데이터/등간�척도, 정량�데이터/비율�척도

Page 30: 디지털 미디어 컨텐츠 독서과제

- 편집�방향�설정, 데이터�파악

데이터를�정리하고�클렌징하는�작업이다.

4. 데이터�품질을�확보하기�위한�변환

5. 분석을�위한�변환 데이터의�전처리와�정제에�집중한다.최대�해상도 : 개별�데이터�표식으로�사용할�수�있는�모든�데이터�표시

필터링�된�해상도 : 특정�기준에�따라�레코드를�제외집계된�해상도 : 월, 년�또는�특정�카테고리

샘플�수준�해상도 : 데이터의�일부를�추출하기�위해�특정한�수학적�선택�규칙을�적용제목�수준�해상도 : 전체의�통계적�합계�값을�표시

6. 통합보유한�데이터에�추가�데이터�계층이�결합될�필요가�있을�수�있다.

Page 31: 디지털 미디어 컨텐츠 독서과제

- 편집�방향�설정, 데이터�파악

“데이터를�표현하기�위해�선택한�방법은�답하고자�하는�질문에�의해�영향을�받아야�한다.”

쉽게�말하자면 사용자가�데이터나�관련된�주제에�대하여�갖게�되는�질문에 가장�적절하고�대답이�되는�설명을�시각화가�할�수�있어야�한다.

이를�위한 2가지�접근법

연역적�추론 : 데이터�질문을�정의하기�위한�연역법은�어떤�스토리가�흥미롭고�데이터와�관계가�있고 활용가능한지에�대해�어느�정도�감을�잡고�시작한다. 특정한�가설을�검증하기�위한�방법이다.

귀납적�추론 : 개방적이고�탐색적이다. 무엇이�흥미로운�이야기가�될�지�모르는�상태에서�시작한다.

2. 편집�방향�재정비

Page 32: 디지털 미디어 컨텐츠 독서과제

- 편집�방향�설정, 데이터�파악

3. 스토리를�찾기�위한�시각적�분석�활용

Page 33: 디지털 미디어 컨텐츠 독서과제

- 편집�방향�설정, 데이터�파악

비교와�비율 막대�그래프�사용 (값과�범주�비교�가능)

범위�및�분포 : 값의�범위�파악, 개별의�변수들�혹은�변수의�조합이�갖는�분포의�형태를�확인순위 : 크기를�기준으로�데이터의�순서를�확인측정 : 값이�갖는�중요성을�파악하기�위해�숫자�자체보다�깊이�있게�조사하는�것맥락 : 평균, 표준편차, 목표나�예측의�맥락에서�벗어나는�값을�판단

Page 34: 디지털 미디어 컨텐츠 독서과제

추이와�패턴라인�차트를�사용(패턴이나�경향을�관찰할�수�있다)

방향 : 값이�증가하거나�감소하는�등�변화가�있는지�혹�유지되는지 변화의�속도 : 값이�선형이나�지수형으로�변화하는지�혹은�변화가�없는지, 변화의�속도는�얼마나�급한지변동 : 반복되는�패턴이�있는지, 심각하게�변동의�폭이�큰지, 어떤�리듬이�반복되는지중요도 : 알아낸�패턴이�중요한�신호인지�무시해도�되는�잡음인지교차 : 변수�사이에�교차나�중첩이�발생하는지, 관계의�변화를�나타내는�교차점이�나타나는지

- 편집�방향�설정, 데이터�파악

Page 35: 디지털 미디어 컨텐츠 독서과제

- 편집�방향�설정, 데이터�파악

관계와�연결산포도를�사용(관계의�유형�파악�가능)

예외 : 이상치와�같이�정상범위를�벗어난�변수를�찾을�수�있는지상관성 : 강하거나�약한�상관이�존재하는지연관성 : 변수와�값의�조합들�간에�의미있는�관계가�파악되는지클러스터�및�틈 : 데이터가�군집화되는�것처럼�보이는지, 빈�틈은�있는지계층�관계 : 데이터�범주와�하위�범주의�구성과�분포, 관련성을�결정하는�것

Page 36: 디지털 미디어 컨텐츠 독서과제

1- 3 단원�정리