pengolahan data numerik
DESCRIPTION
Materi Kuliah Statistik pada Jurusan Analis Kesehatan Poltekkes Kemkes jakarta IIITRANSCRIPT
![Page 1: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/1.jpg)
PENGOLAHAN DATA NUMERIK
Oleh
Heru Setiawan
![Page 2: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/2.jpg)
A. Distribusi Frekuensi
B. Nilai Tengah (Central Tendency)
![Page 3: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/3.jpg)
1. Raw data hasil pengukuran data kuantitatif tidak akan memberikan informasi apa-apa jika tidak diolah kedalam suatu distribusi frekuensi.
2. Distribusi frekuensi adalah suatu pengelompokkan data kedalam kelas atau group tertentu.
![Page 4: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/4.jpg)
Istilah dalam Distribusi Frekuensi
a. Jumlah kelas– Biasanya antara 6 – 14 (Umumnya ± 9)– Jika ≥ 250 gunakan kaidah Sturgess– Dihitung dengan rumus Sturgess, yaitu :
k = 1 + 3.3 log n, di mana:
k = jumlah kelas &
n = jumlah pengamatan.
![Page 5: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/5.jpg)
3. Istilah dalam Distribusi Frekuensi
b. Interval• Merupakan jarak antar kelas :
– usahakan sama– tidak ada nila yang tumpang tindih– ada istilah batas bawah (lower limit), batas atas (upper limit)
dan nilai tengah (mid point)– dihitung dengan rumus :
dimana:
I = Interval,
R= Range ( nilai max-min) &
k = jumlah kelas
k
RI
![Page 6: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/6.jpg)
4. Cara menyusun distribusi frekuensi :
a. Carilah nilai terbesar dan terkecil
b. Tentukan jumlah kelas dengan interval yang sama
c. Hitunglah banyak nilai observasi yang masuk kedalam masing-masing kelas (disebut dengan istilah frekuensi)
![Page 7: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/7.jpg)
Keterangan :Kelas : 50 – 54.9; 55 – 59.9; dst.Lower limit kelas: 50 ; 55 ; dst.Upper limit kelas: 54.9 ; 59.9 ; dst.Interval kelas : 5 (Selisih upper limit denganlower limit suatu
kelas)Kelas tertutup : 50 – 54.9Kelas terbuka : - 54.9 atau 70 –
Kelas frekuensi (f)50 51 54 55 55 50 - 54,9 357 58 59 60 61 55 - 59,9 561 61 61 62 62 60 - 64,9 1063 64 64 65 65 65 - 69,9 866 67 67 67 68 70 - 74,9 469 71 71 72 75 Jumlah 30
![Page 8: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/8.jpg)
Nilai Tengah (Central Tendency)
1. Jenis-jenis nilai tengah :
– Mean/Arithmatic mean (x, y)
– Median (Md)
– Modus = Mode (Mo)
– Geometric mean (Gm)
– Harmonic mean (Hm)
– Quadratic mean (Qm)
Sering digunakan dalam bidang ekonomi
![Page 9: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/9.jpg)
Mean = rata-rata hitung (x, y)
• Simbol untuk mean :– x atau y (x bar atau y bar) = untuk sampel (statistik) (miu) = untuk populasi (parameter).
• Merupakan nilai yang mewakili data agregate• Bersifat labil (mudah dipengaruhi oleh nilai ekstrim)• Mudah dihitung dan paling banyak digunakan• Dihitung dengan rumus :
– Data tidak berkelompok :
– Data berkelompok : x = xg + (1/n x fd)
n
xx
i
ii
f
fxx
.
atau
fdxn
xx g
1
n
mpfx
.
![Page 10: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/10.jpg)
Contoh
No. Kelas f mp d fd1 150 - 5 152.5 -15 -752 155 - 10 157.5 -10 -1003 160 - 15 162.5 -5 -754 165 - 35 167.5 0 05 170 - 20 172.5 5 1006 175 - 10 177.5 10 1007 180 - 185 5 182.5 15 75
Jumlah 100 1172.5 0 25
![Page 11: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/11.jpg)
• Diketahui : xg = 167.5
N = 100
fd = 25
• Ditanya mean = ….?
• Jawab : Rumus : x = xg + (1/n x Sfd) = 167.5 + (1/100 x 25) = 167.75
fdxn
xx g
1
![Page 12: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/12.jpg)
Median (Md) = Nilai tengah
• Merupakan nilai yang terletak paling tengah, sehingga membagi data menjadi 2 kelompok yang sama jumlah pengamatannya.
• Relatif stabil (tidak dipengaruhi oleh nilai ekstrim)• Sebelum mencari posisi median, terlebih dahulu data harus diurut• Nilai median adalah nilai observasi pada posisi median• Posisi median ditentukan dengan rumus :
• Data tidak berkelompok :
• Data berkelompok :
2
1n
Md
ix
fMd
fknLlMd
2/1
![Page 13: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/13.jpg)
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya median = ….?Jawab : Rumus :
ix
fMd
fknLlMd
2/1
93.1675
35
302/1100165
xMd
![Page 14: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/14.jpg)
Modus/Mode (Mo) = Nilai tengah
• Merupakan nilai yang paling sering muncul dalam pengamatan.
• Pada data yang tidak berkelompok, modus adalah frekuensi pengamatan yang paling besar/banyak.
• Ditentukan dengan rumus :• Data tidak berkelompok :
Mo =
– di mana n = jumlah pengamatan– Contoh :
Data = 11 ; 12 ; 12 ; 13 ; 14 ; 15 ; 15 ; 16 ; 17 ; 18– Modus = 12 dan 15
![Page 15: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/15.jpg)
Modus/Mode (Mo) = Nilai tengah
• Data berkelompok : a. Rumus Delta (Thum method) : sering dipakai untuk
distribusi skewed
– Ll = Lower limit kelas mode– i = interval kelas 1 = Selisih frekuensi kelas mode dengan frekuensi
kelas sebelum kelas mode 2 = Selisih frekuensi kelas mode dengan frekuensi
kelas setelah kelas mode
21
1.
i
LlMo
![Page 16: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/16.jpg)
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya modus/mode = ….?Jawab : Rumus :
21
1.
i
LlMo
86.1671520
20.5165
Mo
![Page 17: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/17.jpg)
Modus/Mode (Mo) = Nilai tengah
b. Rumus Empiris : sering dipakai untuk distribusi simetrisMo = x {3(x Md)},
dimana x = Mean dan Md = Median
Diketahui : • x = 167.75 (soal mean data berkelompok)• Md = 167.93 (soal median data berkelompok)• Ditanya modus/mode = ….?• Jawab : Rumus :
MdxxMo 3
29.16893.16775.167375.167 Mo
MdxxMo 3
![Page 18: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/18.jpg)
Hubungan antara nilai Mean, Median dan Modus/Mode
1. Nilai Median selalu berada di antara Mean dan Modus
2. Jika x = Md = Mo (berhimpitan), maka kurvanya disebut simetris
3. Jika x < Md & Mo), maka kurvanya akan menceng ke kiri disebut skewed to the left
4. Jika x > Md & Mo), maka kurvanya akan menceng ke kanan disebut skewed to the right
![Page 19: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/19.jpg)
UKURAN DISPERSI/VARIASI
• Pengertian :
Nilai tengah (ukuran sentral) merupakan wakil dari data yang telah tersusun. Tidak semua nilai bisa diwakili oleh nilai tengah, ada nilai-nilai yang menyimpang dari nilai tengah tersebut.
Ukuran terhadap penyimpangan ini disebut dispersi.
![Page 20: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/20.jpg)
Kegunaan
1. Memberikan informasi deskriptif tentang derajat penyimpangan suatu kelompok data.
2. Menilai ketepatan nilai tengah dalam mewakili distribusinya. Bila nilai dispersi besar berarti nilai tengah kurang mewakili distribusinya, sebaliknya bila nilai dispersi kecil berarti nilai tengah mempunyai ketepatan yang tinggi dalam mewakili distribusinya. (Pengukuran nilai tengah tanpa mengikutsertakan ukuran dispersi akan kurang lengkap).
3. Berguna untuk perhitungan statistik lebih lanjut agar diperoleh informasi yang lebih mendalam tentang data.
![Page 21: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/21.jpg)
Jenis-jenis Ukuran Variasi
1. Range2. Interquartile range3. Mean deviation (Simpangan rata-rata)4. Variance (Variasi)5. Standard Deviation (Simpangan Baku)6. Coefficient of variation (Koefisien variasi)7. Standard Error
• Ukuran dispersi digunakan karena nilai sentral (mean) kadang-kadang kurang berarti jika nilai variasi tidak diketahui.
![Page 22: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/22.jpg)
Contoh
Jika melihat meannya saja Data A = Data B, padahal Data A Data B.
Mean SDData A 60 60 55 60 65 60 60 3.2Data B 90 50 30 70 40 80 60 23.7
![Page 23: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/23.jpg)
Range (Rentang)
• Suatu nilai yang merupakan selisih antara nilai tertinggi dengan nilai terendah
• Hanya ditentukan oleh 2 nilai saja (nilai tertinggi dan nilai terendah)
• Sering dipakai untuk Quality control• Dalam pemakaiannya sering digabung dengan ukuran lain,
(misalnya mean) karena jika hanya range saja yang dipakai kadang-kadang menyesatkan.
![Page 24: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/24.jpg)
Range (Rentang)
Mean RangeData A 3 4 5 6 8 11 15 20 9 17Data B 3 3 4 9 11 11 11 20 9 17Data C 3 4 9 9 9 9 9 20 9 17
![Page 25: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/25.jpg)
Interquartile Range
• Hampir sama dengan range, hanya ditentukan oleh selisih (Q3) kuatil-3 dengan (Q1) kuartil-1.
• Sering digunakan untuk melihat penyebaran pendapatan.
• Dihitung dengan rumus : dQ = (Q3 Q1)/2, di mana dQ = Interquartile range
• Q3 = kuartil-3• Q1 = kuartil-1
![Page 26: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/26.jpg)
Quartile (Kuartil)
• Kuartil adalah suatu ukuran yang membagi distribusi data menjadi 4 bagian yang sama.
• Kuartil-1 (Q1) 25% dari seluruh distribusi• Kuartil-2 (Q2) 50% dari seluruh distribusi (= Median)• Kuartil-3 (Q3) merupakan 75% dari seluruh distribusi• Dihitung dengan rumus sebagai berikut :
Posisi kuartil = (ki * n)/4, – ki = 1, 2, 3 dst. dan n = jumlah pengamatan
• Nilai kuartil = – Ll = Lower limit kelas kuartil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas kuartil– fki = frekuensi kelas kuartil– i = interval kelas
i
fk
fknk
LlkuartilNilaii
i
.4.
![Page 27: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/27.jpg)
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya :
1. kuartil-1/k1 …?
2. Kuartil-2/k2 …?
3. Kuartil-3/k3 …?
![Page 28: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/28.jpg)
Desil
• Suatu ukuran yang membagi kumpulan/distribusi data menjadi 10 bagian yang sama. Prinsipnya sama dengan kuartil, hanya bedanya jika dengan desil kita dapat memperoleh informasi lebih detail.
• Dihitung dengan rumus sebagai berikut :Posisi desil = (di*n)/10, – di = 1, 2, 3 dst. dan n = jumlah pengamatan
Nilai Desil =– Ll = Lower limit kelas desil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas desil– fdi = frekuensi kelas desil– i = interval kelas
i
fd
fknd
LldesilNilaii
i
.10.
![Page 29: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/29.jpg)
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya Desil-1 …?
![Page 30: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/30.jpg)
Persentil • Suatu ukuran yang membagi kumpulan/distribusi data menjadi 100 bagian
yang sama. Prinsipnya sama dengan kuartil/desil, hanya bedanya jika dengan desil kita dapat memperoleh informasi lebih detail lagi.
• Dihitung dengan rumus sebagai berikut :
– pi = 1, 2, 3 dst. dan n = jumlah pengamatan
– Ll = Lower limit kelas persentil– n = jumlah pengamatan– fk = frekuensi kumulatif sebelum kelas persentil– fdi = frekuensi kelas persentil– i = interval kelas
iifp
fknip
LlpersentilNilai .10
.
n
nppersentilPosisi i .
![Page 31: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/31.jpg)
Contoh
No. Kelas f fk mp d fd1 150 - 5 5 152,5 -15 -752 155 - 10 15 157,5 -10 -1003 160 - 15 30 162,5 -5 -754 165 - 35 65 167,5 0 05 170 - 20 85 172,5 5 1006 175 - 10 95 177,5 10 1007 180 - 185 5 100 182,5 15 75
Jumlah 100 1172,5 0 25
Ditanya persentil …?
![Page 32: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/32.jpg)
Mean deviation (Simpangan rata-rata)
• Suatu nilai yang ditentukan oleh perbedaan semua nilai terhadap mean.
• Kadang2 (jika perlu), dapat juga perbedaan semua nilai terhadap median (median deviation)
• Dihitung dengan rumus :
n
xxxd i
n
xmpfxd
n
MdxdMd i
n
MdmpfdMd
![Page 33: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/33.jpg)
Variance (Variasi)
• Merupakan rata-rata kuadrat dari selisih nilai dengan mean• Adalah harga mutlak sehingga sulit untuk dimanipulasi secara
matematik.• Untuk standarisasi, maka harus diakarkan sehingga disebut
sebagai standar deviasi• Dihitung dengan rumus :
1
2
n
xxV i
![Page 34: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/34.jpg)
Standard Deviation (Simpangan Baku)
• Merupakan ukuran yang paling banyak dipakai dalam analisa statistik• Diberi simbol S (parameter) dan (populasi)• Dihitung dengan rumus :1. Untuk data tidak berkelompok :
di mana (n – 1) = Faktor koreksi “Fisher & Willes”
2. Untuk data berkelompok :
1
2
n
xxS i
1
22
nn
xxS
22 ''
n
fd
n
fdiS
1
22
nn
fxfxS
![Page 35: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/35.jpg)
Coefficient of variation (Koefisien variasi)
• Adalah rasio standar deviasi dengan mean, yang dinyatakan dalam persen (%).
• Berfungsi untuk membandingkan antara 2 kelompok yang mempunyai unit pengukuran berbeda (misalnyaTB dan BB) atau unit pengukurannya sama tetapi derajat/gradasinya berbeda.
• Dihitung dengan rumus :
%100xx
SDCoV
![Page 36: Pengolahan Data Numerik](https://reader037.vdocuments.pub/reader037/viewer/2022102412/5571f8b349795991698dea81/html5/thumbnails/36.jpg)
Standard Error (SE)
• Merupakan ukuran variasi dari populasi (bukan ukuran variasi dari sampel).
• Muncul karena adanya pengambilan sampel dari populasi.• Suatu populasi dibagi menjadi beberapa kelompok, setiap
kelompok dicari meannya (x) kemudian mean tersebut membentuk suatu kelompok data gabungan:
– Jika kelompok data gabungan itu dicari mean-nya, maka diperoleh mean populasi ().
– Jika kelompok data gabungan itu dicari SD-nya, maka diperoleh SD populasi ()
• Dihitung dengan rumus :
n
SSE
NSE