데이터분석과 저널리즘 5장(뒷부분)

54
언론정보학과 21210654 안예림 언론정보학과 21310663 최윤선 를 활용하여 T a b l e a u

Upload: yerim-an

Post on 17-Jul-2015

112 views

Category:

Data & Analytics


10 download

TRANSCRIPT

언론정보학과 21210654 안예림

언론정보학과 21310663 최윤선

를 활용하여

데이터 시각화 하기

T a b l e a u

5장. 데이터 시각화의

스위스칼, 태블로(tableau) 활용하기

5.15 지진데이터 분석하기

5.16 역대 지진 TOP 10 추출하기

5.17 10년 단위로 지진 규모 순위 추출해 정렬하기

5.18 지진 규모별 비율

5.19 지진 경위도 값으로 매핑하기

5.20 인터랙티브 대시보드 만들기

5.21 그래프와 지도를 Action 기능으로 연동시키기

5.22 지도나 그래프 상에서 직접 필터링 하기

5.23 태블로 ‘스토리 포인트’기능 활용하기

5장.15. 지진데이터 분석하기

1. 시간의 흐름에 따른 지진 발생 추이

① Dimensions 의 진원시 Columns 로 옮기기

② 진원시 데이터타입 :

Day (may 8, 2011) 형태로 설정하기

바코드 형태: 연도별 지진 발생 빈도 시각화

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.15. 지진 데이터 분석하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

확대된 바코드 형태 그래프

③ 화면 크기

Normal Entire view ④ 폰트 크기 상단의 Format메뉴-Font-colums-14

5.15. 지진 데이터 분석하기

1. 시간의 흐름에 따른 지진 발생 추이

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

⑤ Show me 의 Gantt그래프 로 변경 발생빈도 시각화 ▶ 2000년도 들어 지진 발생이 더 잦아졌고 특히 2010년 전후로는 훨씬 촘촘히 시각화 된 사실을 알 수 있음. ▶ 대략적인 발생빈도의 패턴을 직관적으로 파악할 수 있는 그래프

5.15. 지진 데이터 분석하기

1. 시간의 흐름에 따른 지진 발생 추이

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

* 새로운 시트 열기

① Dimensions 의 진원시 Columns 로 옮기기

② 진원시 데이터타입 :

Month (May 2011) 형태로 설정하기

③ 일련번호 Rows 로 옮기기

④ 일련번호 데이터 타입:

Measure Count , Continuous

5.15. 지진 데이터 분석하기

1. 시간의 흐름에 따른 지진 발생 추이

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

Cf) Rows 에 일련번호 대신 Number of records 넣어도 결과는 같음.

일련번호 : 지진 순서대로 매긴 고유번호

Cnt (row of records) : 지진이 일어난 횟수를 세는 함수

5.15. 지진 데이터 분석하기

1. 시간의 흐름에 따른 지진 발생 추이

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

⑤ 폰트크기와 제목 바꾸기 (폰트: 14 / 제목: 지진발생시기,횟수)

⑥ 추세선 추가하기

5.15. 지진 데이터 분석하기

1. 시간의 흐름에 따른 지진 발생 추이

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

* 1990년대 이후 관측장비의 첨단 장비가 아날로그디지털로 바뀌면서 지진 관측 횟수 증가 .

1999년 4월 강원도 태백 지진

2006년 4월 경북 울진군 지진

2013년 6월

연도별 지진 발생 횟수와 추세선 표시

5.15. 지진 데이터 분석하기

1. 시간의 흐름에 따른 지진 발생 추이

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

① Rows : 규모 넣기 Average (평균치) 로 설정

② Marks : CNT(일련번호)와 AVG(규모)가 자동으로 표시됨

③ Dimensions 의 Measure Names Color 로 옮기기

5.15. 지진 데이터 분석하기

2. 시간의 흐름에 따른 지진 발생 ∙ 규모 추이 * 시트 그대로

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

두개의 선 그래프가 각각 다른 색으로 그려진다.

* 지진 발생빈도는 갈수록 상승, 반면 지진 규모는 낮아지고 있는 추세

지진 횟수∙지진 규모 추세선 표시

5.15. 지진 데이터 분석하기

2. 시간의 흐름에 따른 지진 발생 ∙ 규모 추이

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

태블로의 장점:

시간 데이터의 단위 변경으로 손쉽게 그래프 시각화 가능

데이터 유형: Year Quarter(4분기) Day(일)

5.15. 지진 데이터 분석하기

2. 시간의 흐름에 따른 지진 발생 ∙ 규모 추이

* 시트 이름 변경: 지진 발생 추이

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

3. 개별 지진의 규모 추이 ∙ 시각화

* 새로운 시트 열기

① 규모 데이터 Dimensions 으로 옮기기 Rows 로 이동하기

② Colunmns: Day(진원시) Rows : Attribute(규모) 설정

③ Mark: Circle

5.15. 지진 데이터 분석하기

1994.7.26 규모 4.9 2004.5.29 규모5.2

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

* 1990년대 이후 규모 4.5 내지 규모 5 이상을 넘는 지진들이 일어난 구간. * 1990년대 들어 10년 단위로 상대적 규모가 큰 지진들이 주기적으로 나타나고 있음.

5.15. 지진 데이터 분석하기

3. 개별 지진의 규모 추이 ∙ 시각화

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

④ 그래프에서 규모 4.0 이상의 지진만 사각형 블록 설정

⑤ 팝업창 메뉴에서 Keep only를 체크

선택한 지진 데이터만 남게됨

5.15. 지진 데이터 분석하기

3. 개별 지진의 규모 추이 ∙ 시각화

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1994.7.26 규모 4.9

2004.5.29 규모5.2

5.15. 지진 데이터 분석하기

3. 개별 지진의 규모 추이 ∙ 시각화

* 시트 이름 변경 : 지진 규모 추이

5장.16. 역대 지진 TOP 10 추출하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.16. 역대 지진 TOP 10 추출하기

1. 크기 순으로 정렬해 막대그래프 그리기

* 새로운 시트 열기

① Colunmns: 규모(average) Rows : 일련번호 ② 필터링 하기:

일련번호 - Fiter메뉴 - Top탭 - By field 선택 (top,10 by 규모, average) - OK ③ 그래프 상단의 정렬아이콘 - 내림차순 정렬

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 크기 순으로 정렬해 막대그래프 그리기

④ 위치 Label과 Tooltip으로 이동 진원시Label과 Tooltip으로 이동 ⑤ 일련번호: Show Header 체크 해제 Y축의 일련번호 표시 제거됨 ⑥ 그래프 크기: Enter view 글자,숫자 크기: 14 X축 이름 규모 로 바꾸기.

* Marks – Tooltip메뉴: 그래프 상 팝업창의 형식과 항목 변경 가능

5.16. 역대 지진 TOP 10 추출하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 크기 순으로 정렬해 막대그래프 그리기

위치, 진원시 내용을 그래프에 표시

5.16. 역대 지진 TOP 10 추출하기

* 시트 이름 변경: 역대 지진 TOP10

5장.17. 10년 단위로

지진 규모 순위 추출해 정렬하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.17. 10년 단위로 지진 규모 순위 추출해 정렬하기

▶ 진원시 를 다시 분류한 10년 단위구분 항목 만들기 – 각 연대별 지진 발생 추이를 살펴보기 위해 필요. : 논리 계산식을 활용해 1970, 1980, 1990, 2000, 2010년대 이후의 5개 그룹으로 진원시 나누기

1. 연대별 지진 발생 추이

① Dimension 목록의 진원시 - Create Calculated Field

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 연대별 지진 발생 추이

② 새 시트 열기

③ Colunmns: 규모(average) Rows : 10년 단위 구분 , 일련번호

④ Dimension의

10년 단위 구분, 일련번호 모두 선택

- 우클릭 - Combine Fields ⑤ 새로 생긴 10년 단위 구분&일련번호 Rows 에 있던 두 항목 사이에 넣기

5.17. 10년 단위로 지진 규모 순위 추출해 정렬하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 연대별 지진 발생 추이

⑥ 상단 메뉴의 Analysis - Creat Calculated Filed 에 입력 (INDEX : 순서대로 일련번호를 매기는 함수)

⑦ Measures의 ‘순위’ Marks의 Label에 넣기 막대 그래프에 일련번호가 매겨짐

⑧ 내림차순 정리

* 일련번호가 연대별로 매겨지지 않음

5.17. 10년 단위로 지진 규모 순위 추출해 정렬하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 연대별 지진 발생 추이

▶ 10년 단위로 필터링 필요

⑨ Label 의 순위 - Edit Table Calculation – Computer using – advanced

⑩ 10년 단위 구분, 일련번호 Addressing 으로 옮기기Filed항목 선택 – 규모 – Average - descending

⑪ 10년 마다 일련번호 1부터 시작하도록 설정

5.17. 10년 단위로 지진 규모 순위 추출해 정렬하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 연대별 지진 발생 추이

지진 규모의 순위 -10년 단위로 구분

5.17. 10년 단위로 지진 규모 순위 추출해 정렬하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 연대별 지진 발생 추이

▶ 몇 순위 까지 필터링 할 지 정하기

⑫ Filters 에 순위 넣기 – 10위 로 설정

⑬ Label 에 위치 넣기 (Attribute 로 바꾸기) 지진이 발생한 위치 설명 등장

5.17. 10년 단위로 지진 규모 순위 추출해 정렬하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 연대별 지진 발생 추이

⑭ Tooltip : 위치, 진원시, 규모 나타나도록 설정

⑮ Color 에 10년 단위 구분 넣기

* Filters: 순위

* Marks: color - 10년 단위 구분 Label – ATTR (위치) Tooltip – ATTR (위치) ATTR (진원시)

5.17. 10년 단위로 지진 규모 순위 추출해 정렬하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

1. 연대별 지진 발생 추이

연대별로 지진 규모 TOP10을 추출해 정렬한 그래프

5.17. 10년 단위로 지진 규모 순위 추출해 정렬하기

* 시트 이름 변경: 연대별 지진 규모 TOP10

5장.18. 지진 규모별 비율

측정값을 단계별로 나누기 (Binning)

▶ 측정값을 단계별로 나누기 (Binning)

Binning: 측정값이 같은 수치 자료를 일정한 간격으로 구분한 세부 그룹으로 나눔으로써, 데이터 시각화가 더욱 편리해지는 방법

① 규모에서 우클릭 - Create bins 클릭 ② 뜬 화면에서 지진규모를 0.5로 설정

5.18. 지진 규모별 비율

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

▶ 측정값을 단계별로 나누기 (Binning) ③ Colunmns: 10년 단위 구분

Rows : Numbers of Records

④ 생성된 ‘규모(bin)’을

color와 label에 넣어준다.

⑤ 상단의 Analysis 메뉴 로 들어가

Percentage of의 cell을 선택

5.18. 지진 규모별 비율

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

▶ 측정값을 단계별로 나누기 (Binning)

연도별 지진 규모의 비중 비교 용이

5.18. 지진 규모별 비율

5장.19. 지진 경위도 값으로 매핑하기

① 새로운 시트 열기

② 목록창의 경도와 위도 우클릭

Geographic role

각각 longitude 와 latitude로 바꾸기

③ Colunmns: 경도

Rows : 위도 각각 우클릭 데이터 유형: Dimension 설정

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.19. 지진 경위도 값으로 매핑하기

▶ 지진 경위도 값으로 매핑하기

④ Color : 규모 넣기 우클릭 Dimension 로 설정

⑤ Filters : 10년 단위 구분 넣기 창이 뜨면 창이 뜨면 우리는 모두 사용할 것이므로 모두 선택해주고 OK

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.19. 지진 경위도 값으로 매핑하기

▶ 지진 경위도 값으로 매핑하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.19. 지진 경위도 값으로 매핑하기

⑥ 10년 단위 구분 우클릭 Show quick filter 클릭 Quick filter 생성

⑦ Quick filter 화살표를 클릭 슬라이더형으로 변환 ⑧ 10년 단위로 슬라이더 조정이 가능해짐

▶ 지진 경위도 값으로 매핑하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.19. 지진 경위도 값으로 매핑하기

Colors 를 클릭하면 Edit color 기능 이용가능

색상을 마음대로 변경 규모별 색상의 농담표시도 단계별로 나눌 수 있음

▶ 지진 경위도 값으로 매핑하기

5장.20. 인터랙티브 대시보드 만들기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.20. 인터랙티브 대시보드 만들기

▶ 대시보드(dashboard)

대시보드 (dashboard): 태블로의 핵심 기능으로서, 시청자나 독자가 웹에서 스스로 탐색할 수 있는 인터랙티브 콘텐츠를 만드는 기능.

① 상단 메뉴 중에

Dashboard new dashboard 클릭 대시보드 시트가 만들어진다.

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.20. 인터랙티브 대시보드 만들기

▶ 대시보드(dashboard)

② Drop sheets here 화면 생성 상단부 : 한반도 지진 분포 를 하단부 : 지진 규모 top10 을 drag & drop

기초 dashboard 만들기를 완성

5장.21. 그래프와 지도를

Action 기능으로 연동시키기

5.21. 그래프와 지도를 Action 기능으로 연동시키기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

① 한반도 지진 분포 / 지진규모 top 10 : 우상단의 화살표를 클릭

Use as a filter 적용 지도와 그래프 연동 성공

② 한반도 지진 분포 : 우상단의 화살표를 클릭

Quick filter에서 10년 단위 구분에 체크 확인

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

③ 10년 단위 구분 (한반도 지진 분포 오른쪽) 필터 조정기

화살표 클릭 Apply to worksheets -> selected worksheet 체크

5.21. 그래프와 지도를 Action 기능으로 연동시키기

④ 그때 뜨는 화면에서 지진 규모 TOP 10 에 체크 표시 OK를 클릭

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.21. 그래프와 지도를 Action 기능으로 연동시키기

선택한 단위에 따라 지도와 그래프가 연동되어 변화

5장.22. 지도나 그래프 상에서

직접 필터링 하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.22. 지도나 그래프 상에서 직접 필터링 하기

-

5장.23. 태블로 스토리 포인트 기능 활용하기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.23. 태블로 ‘스토리 포인트’기능 활용하기

▶ 태블로의 ‘스토리(Story Point)’기능

스토리 포인트: 대시보드나 차트, 지도 등 각각의 데이터를 별도의 페이지에 심는 방법. * 장점: 스토리텔링을 하듯이 효과적으로 정보 전달

① 상단 메뉴의

Story New story 선택

② 스토리 포인트 작업창 생성

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.23. 태블로 ‘스토리 포인트’기능 활용하기

▶ 태블로의 ‘스토리(Story Point)’기능

③ 작업창의 Story title (전체 제목) 달기

: “ 한반도, 지진 안전지대 맞나? ”

④ 소제목 작성: 지진 발생 추이

⑤ 지진 발생 추이 정보 드래그 작업창에 놓기

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.23. 태블로 ‘스토리 포인트’기능 활용하기

지진 발생 추이 의 데이터가 나타남

* New blank point : 또 다른 데이터 추가

5장. 데이터 시각화의 스위스칼, 태블로(tableau) 활용하기

5.23. 태블로 ‘스토리 포인트’기능 활용하기

같은 방식으로 지진 발생 추이, 지진 규모 추이, 한반도 지진 분포, 지진 분포와 지진 top 10 까지 원하는 만큼 데이터를 계속 추가함으로써 스토리 텔링 하듯 데이터 제공 가능

* 소제목 캡션의 글자크기,형식 조절 불가 적절하고 간단한 소제목 필요