biostatistics i - med.cmu.ac.th · ordinal scale rank-ordered ... scales of measurement numerical...
TRANSCRIPT
Biostatistics I
รศ.นพ. เกรยงไกร ศรธนวบญชย
ภาควชาเวชศาสตรชมชน
26 ม.ค. 2559
Topic outline
Statistical concepts in medical practice
Quantitative and qualitative data
Types of variables
Frequency distribution
Measures of central tendency
Measures of dispersion
ASSOC. SARITA TEERAWATSAKUL
Statistical concepts in medical practice
ประชากรและกลมตวอยาง (population and sampling)
Population
Sample
Inferential statistics Probability and randomness
Statistics
Descriptive Analytic
ประโยชนของการเรยนรเรองระบาดวทยา สถต และการวจยเชงปรมาณ
เปนพนฐานของ Evidence-based Medicine (EBM) เขาใจและประเมนคณคารายงานการวจยทางการแพทย เลอกแนวทางการวนจฉยและใหการรกษาพยาบาลผปวย พนฐานในการท าการวจยทางการแพทย
Quantitative and qualitative data
ลกษณะหรอคณสมบตทสนใจรวมกนของประชากร
ตวแปร (variable) ขอมล (data)
สญลกษณหรอตวเลขทบอกลกษณะหรอปรมาณ
ของตวแปรทศกษา
ตวแปร (variable)
ขอมล (data) ลกษณะของขอมล
น าหนก 53.5 kg., 63.8 kg.,… บอกปรมาณ
(Quantitative)จ านวนบตร 1, 2, 3, 4, 5,…
Heart murmurs intensity
Grade I - VI
บอกลกษณะ (Qualitative)HIV status positive,
negative
Types of variable
Two basic types of variables in analytic studies
Independent variables (predictor) : the variables that can take different values and can cause corresponding changes in other variables
Dependent variables (outcome): the variable that can take different values only in response to an independent variable.
Nominal scale
Unordered, dichotomous, either-or, non-numeric or have no value.
Table 1. Survival status of propranolol-treated and control patients with myocardial infarction
Status 28 days after admission
propranolol-treated patients
Control patients
Dead 7 17
Alive 38 29
Total 45 46
Survival rate 84% 63%Data by Snow from statistics in Medicine,1974
Ordinal scale
rank-ordered
variables where the order matters but the differences do not matter
Grade Risk of Stroke
Social class Stage of cancer
A Low 1 wealthy 1
B moderate 2 upper middle class 2
C high 3 middle class 3
D 2 lower middle class 4
5 poor
Interval scale
The differences or distance between two number has meaning
Not only difference but also relative differences between the objects
The zero point and the unit of measurement are arbitrary (untrue zero)
Example oF = 9/5 oC+32
Celsius
-18 0 10 30 100
Fahrenheit
0 32 50 86 212
Ratio on differences between temperature on scale is equal.Ex. Celsius : (30-10)/(10-0) = 2
Fahrenheit: (86-50)/(50-32)= 2
Interval scale (cont.)
Ratio scale
Scale has all characteristics of an interval scale. True zero scale Ex. Height, weight, west circumference, age,
income(baht/month), no. of WBC, no. bacteria colonies
Variable Nominal Ordinal interval Ratio
weight obese Below normal <18.5 (BMI) True weight
Non obese Normal 18.5-22.9 ex. 45, 50, 24.5,...
Pre-obesity 23-24.9
obesity 25-29.9
Severs obesity
30 and over
Discrete or continuous?
Numerical discrete scale (count)
ex. no. of bacteria colonies on plate
no. of birth (parity)
no. of heart beat/min
no. episode of illness
Numerical continuous scale (measure)
ex. Weight, height, age, income
Serum cholesterol level, blood pressure,
serum uric acid …
ตวแปร(variable)
อตราสวน(ratio)
มอนดบ(ordinal)บอกลกษณะ
(qualitative)
ชวง(interval)
บอกปรมาณ(quantitative)
ไมมอนดบ(nominal)
Heart murmurs
Tumor stagingระดบการศกษา
HIV statusเพศBlood group
Scales of measurement
Numerical discrete scale
Numerical continuous scale
quantitative data
qualitative data
Bone density
Blood sugar
BMI
Temperature(oF,oC)
Knowledge score
Frequency distributions
Distribution
Qualitative data
การมชวตของบดา มารดา ของเดกทไดรบผลกระทบจากเอดส
16
63
15
84
0
20
40
60
80
100
ทงคมชวต บดาเสยชวต มารดาเสยชวต ทงคเสยชวต
จ านว
น
ทงคมชวต, 16, 9%
บดาเสยชวต, 63, 35%
มารดาเสยชวต, 15, 8%
ทงคเสยชวต, 84, 48%
Bar diagram Pie diagram
Distribution
Quantitative data: Frequency table, Range, IQR, Standard deviation (SD)
20.0015.0010.005.00
age
60
50
40
30
20
10
0
Freq
uenc
y
age
fre
qu
en
cy
Histogram Frequency polygon
Probability
โอกาสการเกดเหตการณทสนใจในอนาคต จากความเปนไปไดทงหมด มคาอยระหวาง 0 ถง 1
ม 2 ลกษณะ Classical Probability
Relative Frequency Probability
แพทยใชหลกความนาจะเปนในการตรวจวนจฉย และตดสนใจเลอกการรกษาใหผปวย
P (E) =number of times E occurs
number of times E can occurs
Probability distribution
Normal distribution
ส าคญ และใชบอยทสดใชกบขอมลตอเนอง
มลกษณะเปนรประฆงคว า สมมาตร
Binomial distribution
ขอมลทมความเปนไปไดเพยงสองอยาง (Proportion)
Poisson distribution
ขอมลจ านวนนบ (counts), อตรา (Rates)
Measure of central tendency
Central tendency
Mean (คาเฉลยเลขคณต) Median (มธยฐาน) Mode (ฐานนยม)
Mean (คาเฉลยเลขคณต)
เปนผลเฉลยของขอมลทกตวในขอมลชดนนตวอยาง 2 6 6 8 9 9 10
mean = (2 + 6 + 6 + 8 + 9 + 9 +10) / 7
= 50 / 7 = 7.14
เปน measure of central tendency ทใชบอยทสด ใชคกบ SD
ขอเสย Sensitive ตอ outliers
ตวอยาง 6 7 7 8 8 8 9 32
mean = 10.62
Median (มธยฐาน)
ขอมลตวทอยตรงกลางของขอมลชดนนเมอเรยงจากนอยไปมาก หรอจากมากไปนอย
ถาขอมลชดนนเปนจ านวนค median คอขอมลทอยตรงกลางตวอยาง 2 6 6 8 9 9 10
median = 8
ถาขอมลชดนนเปนจ านวนค median คอคาเฉลยของขอมลสองตวทอยตรงกลาง
ตวอยาง 3 4 5 6 7 8
median = (5+6) / 2 = 5.5
Mode (ฐานนยม)
คาของขอมลในชดนนทมความถหรอมคาซ ากนมากทสดตวอยาง 2 6 6 8 9 9 9 10
mode = 9
ขอมลชดหนงอาจจะไมมฐานนยมเลยตวอยาง 3 4 5 6 7 8
หรออาจมฐานนยมหลายคาตวอยาง 2 3 4 4 5 7 7 9
มฐานนยมสองคา ไดแก 4 และ 7
การเลอกใช mean, median, mode
ขนกบลกษณะของขอมล mean ใชเมอขอมลมการแจกแจงแบบโคงปกต median ใชเมอขอมลมการแจกแจงแบบเบซาย หรอเบขวา mode
มทใชนอยในการศกษาเชงปรมาณ ใชไดกบขอมลทง qualitative และquantitative
เหมาะกบขอมลทมการแจกแจงแบบ bimodal
Measures of dispersion
Measure of dispersion
How the data is spread out (how stretched or squeezed a distribution is)
Also known as: variability, scatter, or spread
Example: range, SD, IQR
Variability
Biologic variation (ความไมแนนอนทางชวภาพ) True biologic variation (ความไมแนนอนทางชวภาพแท ) Temporal biologic variation (ความไมแนนอนจากเวลาการวด)
Measurement variation (ความไมแนนอนจากการวด) Random measurement error (เชงสม) Systematic measurement error (Bias) (เชงระบบ)