r과 기초통계 : 01.자료다루기
DESCRIPTION
R에서 자료입력에 대해 알아본다.TRANSCRIPT
자료 다루기
R과 함께하는 기초통계
통계 유형
• 기술통계 (Descriptive Statistics)
– 자료 수집 및 정리
– 자료 형태 표현
– 자료의 특성값 도출 등
• 추측통계 (Inferential Statistics)
– 표본으로부터 관찰하고자 하는 특성값 도출
• 표본은 모집단을 잘 대표하여야 한다.
– 이를 바탕으로 모집단의 특성 파악
자료 이해
자료 다루기
자료 입력
• 다음의 자료를 어떻게 입력하시겠습니까?
자료 입력
• 속성, 특성 혹은 변수
– 관측하고자 하는 특성값의 집합
– Excel 같은 응용 프로그램에서는 한 개의 행 혹은 한 개의 열에 입
력한다.
자료 입력 - R
• c() 함수 이용
– 괄호(“(“)를 열고 닫지 않으면 Prompt가 “>”에서 “+”로
바뀐다.
자료 입력 - R
• scan() 함수 이용
– 저장할 이름 = scan() 입력후 개별 값들을 공백(Space)으로 구별
하여 입력한다.
– 끝까지 입력후 엔터를 누르고 다시 한번 눌러 끝낸다.
자료 입력 - R
• 외부 파일 가져오기 : csv 파일
자료 입력 - R
자료 입력 - R
• CSV(Comma Seperated Value) 파일
– 열의 구분은 Comma(,)
– 행의 구분은 줄 바꿈(Enter)
자료 입력 - R
• read.csv() 함수 이용
– ?read.csv : read.csv에 대한 도움말 보기
자료 수정 - R
• data.entry() 이용
– data.entry(자료이름)
– 수정할 자료를 찾아
수정후 “x”를 눌러 닫는
다.
자료의 형태
• 측정
– 키 →
– 안경을 착용한 사람의 수 →
– 학점 →
– 성별 →
– 우리 반의 전체 인원수 중 남성의 비율 →
– 자료에 포함된 정보의 양을 결정하는 것
자료의 형태
자료
양적자료
연속형자료
이산형자료
질적자료
순위형자료
명목형자료
어떤 것이 있을까요?
자료의 형태 - R
• Excel 에서 마우스 오른쪽을 클릭하여 “셀 서식”
을 열어보신 적이 있나요?
자료의 형태 - R
• R 자료형은 간단합니다. (p.382)
– 수치형 : 정수와 실수 모두 입력
• Ex) x = 3; y= 3.14
– 문자형 : 큰 따옴표를 이용하여 입력
• Ex) name = “yoonani”
– 논리형 : 정해진 상수 TRUE(축약형 T), FALSE(F) 입력
• Ex) isFemale = FALSE; isFemalie = F
– 복소수형 : “실수부 + 허수부I” 형태 입력
• Ex) cmplx = 2 + 3i
• 실습 : P11의 예제 2.1에 있는 응답결과를 변수
burden에 넣어 봅시다.