02.자료다루기

18
통계에서의 자료

Upload: yoonwhan-lee

Post on 24-May-2015

964 views

Category:

Education


3 download

TRANSCRIPT

Page 1: 02.자료다루기

통계에서의 자료

Page 2: 02.자료다루기

용어

• 모집단 – 관심있는 연구대상 전체 집합

• 표본 – 모집단을 닮은 모집단의 부분집합

• 모수 – 모집단의 특성을 나타내는 측도, 상수이며 일반적으로

미지

• 통계량 – 표본의 특성을 나타내는 측도

이윤환 ([email protected])

Page 3: 02.자료다루기

측정

• 개체 – 관찰 대상

• 요인 – 개체에 관한 특성 중 연구자가 관심을 갖는 특성

• 변수 – 요인의 특성을 수치화하기 위해 쓰이는 속성

• 데이터 – 변수를 측정해서 수치화하는 것

• 측정 – 개체의 특성, 요인을 수치화하는 것

이윤환 ([email protected])

Page 4: 02.자료다루기

연구 대상

흡연산모의 신생아

요인

흡연산모의 영향

변수

신생아 몸무게

척도

g(비율 척도)

자료

둘리 = 2940 도우너 = 4020 또치 = 2740

이윤환 ([email protected])

Page 5: 02.자료다루기

통계 유형

• 기술통계 (Descriptive Statistics) – 자료 수집 및 정리

– 자료 형태 표현

– 자료의 특성값 도출 등

• 추측통계 (Inferential Statistics) – 표본으로부터 관찰하고자 하는 특성값 도출

• 표본은 모집단을 잘 대표하여야 한다.

– 이를 바탕으로 모집단의 특성 파악

이윤환 ([email protected])

Page 6: 02.자료다루기

자료 입력

• 다음의 자료를 어떻게 입력하시겠습니까?

남학생 50명의 체중

72 74 73 76 66 86 70 71 77 71

70 72 71 72 70 72 79 74 70 74

72 77 78 72 69 68 76 67 69 73

72 73 66 67 72 68 68 67 71 67

69 75 70 68 73 70 68 69 70 71

기초통계학-R을 이용한 통계분석, 노맹석 외, 자유아카데미, 2011, p17

이윤환 ([email protected])

Page 7: 02.자료다루기

자료 입력

• 속성, 특성 혹은 변수 – 관측하고자 하는 특성값의 집합

– Excel 같은 응용 프로그램에서는 한 개의 행 혹은 한 개의 열에 입력한다.

이윤환 ([email protected])

Page 8: 02.자료다루기

자료 입력 - R

• c() 함수 이용 – 괄호(“(“)를 열고 닫지 않으면 Prompt가 “>”에서

“+”로 바뀐다.

이윤환 ([email protected])

Page 9: 02.자료다루기

자료 입력 - R

• scan() 함수 이용 – 저장할 이름 = scan() 입력후 개별 값들을 공백(Space)으로 구

별하여 입력한다.

– 끝까지 입력후 엔터를 누르고 다시 한번 눌러 끝낸다.

이윤환 ([email protected])

Page 10: 02.자료다루기

자료 입력 - R

• 외부 파일 가져오기 : csv 파일

이윤환 ([email protected])

Page 11: 02.자료다루기

자료 입력 - R

이윤환 ([email protected])

Page 12: 02.자료다루기

자료 입력 - R

• CSV(Comma Seperated Value) 파일 – 열의 구분은 Comma(,)

– 행의 구분은 줄 바꿈(Enter)

이윤환 ([email protected])

Page 13: 02.자료다루기

자료 입력 - R

• read.csv() 함수 이용 – ?read.csv : read.csv에 대한 도움말 보기

이윤환 ([email protected])

Page 14: 02.자료다루기

자료 수정 - R

• data.entry() 이용 – data.entry(자료이름)

– 수정할 자료를 찾아 수정후 “x”를 눌러 닫는다.

이윤환 ([email protected])

Page 15: 02.자료다루기

자료의 형태

• 측정 – 키 →

– 안경을 착용한 사람의 수 →

– 학점 →

– 성별 →

– 우리 반의 전체 인원수 중 남성의 비율 →

– 자료에 포함된 정보의 양을 결정하는 것

이윤환 ([email protected])

Page 16: 02.자료다루기

자료의 형태

자료

양적자료

연속형자료

이산형자료

질적자료

순위형자료

명목형자료

어떤 것이 있을까요?

이윤환 ([email protected])

Page 17: 02.자료다루기

자료의 형태 - R

• Excel 에서 마우스 오른쪽을 클릭하여 “셀 서식”을 열어보신 적이 있나요?

이윤환 ([email protected])

Page 18: 02.자료다루기

자료의 형태 - R

• R 자료형은 간단합니다. – 수치형 : 정수와 실수 모두 입력

• Ex) x = 3; y= 3.14

– 문자형 : 큰 따옴표를 이용하여 입력 • Ex) name = “yoonani”

– 논리형 : 정해진 상수 TRUE(축약형 T), FALSE(F) 입력 • Ex) isFemale = FALSE; isFemalie = F

– 복소수형 : “실수부 + 허수부i” 형태 입력 • Ex) cmplx = 2 + 3i

이윤환 ([email protected])