02.자료다루기
TRANSCRIPT
통계에서의 자료
용어
• 모집단 – 관심있는 연구대상 전체 집합
• 표본 – 모집단을 닮은 모집단의 부분집합
• 모수 – 모집단의 특성을 나타내는 측도, 상수이며 일반적으로
미지
• 통계량 – 표본의 특성을 나타내는 측도
이윤환 ([email protected])
측정
• 개체 – 관찰 대상
• 요인 – 개체에 관한 특성 중 연구자가 관심을 갖는 특성
• 변수 – 요인의 특성을 수치화하기 위해 쓰이는 속성
• 데이터 – 변수를 측정해서 수치화하는 것
• 측정 – 개체의 특성, 요인을 수치화하는 것
이윤환 ([email protected])
연구 대상
흡연산모의 신생아
요인
흡연산모의 영향
변수
신생아 몸무게
척도
g(비율 척도)
자료
둘리 = 2940 도우너 = 4020 또치 = 2740
…
이윤환 ([email protected])
통계 유형
• 기술통계 (Descriptive Statistics) – 자료 수집 및 정리
– 자료 형태 표현
– 자료의 특성값 도출 등
• 추측통계 (Inferential Statistics) – 표본으로부터 관찰하고자 하는 특성값 도출
• 표본은 모집단을 잘 대표하여야 한다.
– 이를 바탕으로 모집단의 특성 파악
이윤환 ([email protected])
자료 입력
• 다음의 자료를 어떻게 입력하시겠습니까?
남학생 50명의 체중
72 74 73 76 66 86 70 71 77 71
70 72 71 72 70 72 79 74 70 74
72 77 78 72 69 68 76 67 69 73
72 73 66 67 72 68 68 67 71 67
69 75 70 68 73 70 68 69 70 71
기초통계학-R을 이용한 통계분석, 노맹석 외, 자유아카데미, 2011, p17
이윤환 ([email protected])
자료 입력
• 속성, 특성 혹은 변수 – 관측하고자 하는 특성값의 집합
– Excel 같은 응용 프로그램에서는 한 개의 행 혹은 한 개의 열에 입력한다.
이윤환 ([email protected])
자료 입력 - R
• scan() 함수 이용 – 저장할 이름 = scan() 입력후 개별 값들을 공백(Space)으로 구
별하여 입력한다.
– 끝까지 입력후 엔터를 누르고 다시 한번 눌러 끝낸다.
이윤환 ([email protected])
자료 입력 - R
이윤환 ([email protected])
자료 입력 - R
• CSV(Comma Seperated Value) 파일 – 열의 구분은 Comma(,)
– 행의 구분은 줄 바꿈(Enter)
이윤환 ([email protected])
자료 수정 - R
• data.entry() 이용 – data.entry(자료이름)
– 수정할 자료를 찾아 수정후 “x”를 눌러 닫는다.
이윤환 ([email protected])
자료의 형태
• 측정 – 키 →
– 안경을 착용한 사람의 수 →
– 학점 →
– 성별 →
– 우리 반의 전체 인원수 중 남성의 비율 →
– 자료에 포함된 정보의 양을 결정하는 것
이윤환 ([email protected])
자료의 형태 - R
• R 자료형은 간단합니다. – 수치형 : 정수와 실수 모두 입력
• Ex) x = 3; y= 3.14
– 문자형 : 큰 따옴표를 이용하여 입력 • Ex) name = “yoonani”
– 논리형 : 정해진 상수 TRUE(축약형 T), FALSE(F) 입력 • Ex) isFemale = FALSE; isFemalie = F
– 복소수형 : “실수부 + 허수부i” 형태 입력 • Ex) cmplx = 2 + 3i
이윤환 ([email protected])