73485202-metode-statistika.pdf

93
DIKTAT KULIAH METODE STATISTIKA Dr. I MADE SUMERTAJAYA, M.Si GUSTI NGURAH ADHI WIBAWA, S.Si, M.Si

Upload: nikitha-ashardika-putri

Post on 11-Aug-2015

171 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: 73485202-Metode-Statistika.pdf

DIKTAT KULIAH

METODE STATISTIKA

Dr. I MADE SUMERTAJAYA, M.Si

GUSTI NGURAH ADHI WIBAWA, S.Si, M.Si

Page 2: 73485202-Metode-Statistika.pdf

ii

DAFTAR ISI

DAFTAR ISI ......................................................................................................................... ii1 PENDAHULUAN........................................................................................................... 1

1.1 Pengertian Statistika ........................................................................................ 11.2 Beberapa Istilah dalam Statistika................................................................... 21.3 Peranan statistika dan Perkembangannya .................................................... 41.4 Latihan Soal ........................................................................................................ 5

2 PENYAJIAN DATA ....................................................................................................... 62.1 Pendahuluan ....................................................................................................... 62.2 Penyajian Data untuk Peubah Kategorik ....................................................... 62.3 Penyajian Data untuk Peubah Numerik ......................................................... 92.4 Latihan Soal ...................................................................................................... 12

3 UKURAN PEMUSATAN DAN PENYEBARAN DATA .................................................. 133.1 Pendahuluan ..................................................................................................... 133.2 Ukuran pemusatan .......................................................................................... 133.3 Ukuran Penyebaran ......................................................................................... 183.4 Kemiringan distribusi data ............................................................................. 213.5 Keruncingan distribusi data ........................................................................... 213.6 Penyajian data dengan diagram kotak garis (boxplot) ............................. 223.7 Latihan Soal ...................................................................................................... 24

4 KONSEP DASAR PELUANG ....................................................................................... 254.1 Pendahuluan ..................................................................................................... 254.2 Ruang Contoh dan Kejadian........................................................................... 254.3 Operasi Kejadian ............................................................................................. 264.4 Cara Menghitung Ukuran Ruang Contoh ...................................................... 274.5 Peluang Suatu Kejadian.................................................................................. 304.6 Peluang Bersyarat............................................................................................ 314.7 Kaidah Bayes .................................................................................................... 334.8 Latihan Soal ...................................................................................................... 34

5 KONSEP DASAR PEUBAH ACAK............................................................................... 365.1 Pengertian Peubah Acak ................................................................................ 365.2 Sebaran Peluang Diskret................................................................................. 375.3 Sebaran Peluang Kontinu ............................................................................... 385.4 Nilai Harapan Peubah Acak............................................................................ 395.5 Ragam Peubah Acak ........................................................................................ 405.6 Sifat Nilai harapan Dan Ragam...................................................................... 405.7 Latihan Soal ...................................................................................................... 41a. Peluang semua tv yang terbeli tidak ada yang rusak. .............................. 41b. Peluang ada satu tv yang rusak..................................................................... 41c. Tentukanlah nilai X ......................................................................................... 41d. Carilah fungsi sebaran peluang X ................................................................. 41e. Hitunglah nilai tengah dan ragam X. ........................................................... 41

Page 3: 73485202-Metode-Statistika.pdf

iii

6 SEBARAN PELUANG TEORITIS ................................................................................ 426.1 Sebaran Binom ................................................................................................. 426.2 Sebaran Hipergeometrik ................................................................................ 446.3 Sebaran Poisson ............................................................................................... 466.4 Sebaran Seragam ............................................................................................. 476.5 Sebaran Normal ............................................................................................... 486.6 Latihan Soal ...................................................................................................... 51

7 SEBARAN PERCONTOHAN ....................................................................................... 547.1 Contoh Acak...................................................................................................... 547.2 Teori Pengambilan Contoh............................................................................. 547.3 Sebaran Contoh dari Rataan (Mean) ............................................................ 557.4 Sebaran contoh dari (n-1)S2/ 2 .................................................................. 567.5 Sebaran t-student............................................................................................ 567.6 Sebaran F .......................................................................................................... 577.7 Sebaran Contoh Bagi Beda Dua Nilaitengah ............................................... 577.8 Latihan Soal ...................................................................................................... 58

8 PENDUGAAN PARAMETER ....................................................................................... 598.1 Penduga Paramater ......................................................................................... 598.2 Pendugaan Nilai tengah.................................................................................. 608.3 Pendugaan Beda Dua Nilai Tengah Populasi ............................................... 618.4 Pendugaan Proporsi......................................................................................... 638.5 Pendugaan Beda Dua Proporsi....................................................................... 648.6 Latihan Soal ...................................................................................................... 65

9 PENGUJIAN HIPOTESIS ............................................................................................ 679.1 Hipotesis Statistik............................................................................................ 679.2 Pengujian Hipotesis......................................................................................... 68Keadaan yang sesungguhnya .................................................................................... 689.3 Uji Satu Arah Dan Dua Arah ........................................................................... 719.4 Uji Rataan Populasi ......................................................................................... 729.5 Latihan Soal ...................................................................................................... 77

10 ANALISIS REGRESI DAN KORELASI...................................................................... 7810.1 Regresi Linear Sederhana ........................................................................... 7810.2 Pendugaan Koefisien Regresi ..................................................................... 7910.3 Pengujian Hipotesis Bagi Koefisien Regresi ............................................ 8010.4 Peramalan / Pendugaan Bagi Y ................................................................. 8210.5 Kesesuaian Model ......................................................................................... 8310.6 Korelasi .......................................................................................................... 8410.7 Latihan Soal .................................................................................................. 89

DAFTAR PUSTAKA ........................................................................................................... 90

Page 4: 73485202-Metode-Statistika.pdf

1 PENDAHULUAN

1.1 Pengertian Statistika

Statistika merupakan suatu cabang ilmu yang mempelajari berbagai teknik

perancangan, pengumpulan data, pengolahan data, penyajian data, dan pembuatan kesimpulan

berdasarkan data yang dimiliki. Data yang dimiliki seringkali tidak lengkap sehingga dalam

pengambilan keputusan tentunya akan menimbulkan ketidakpastian, dengan kata lain ada

peluang kesalahan dalam pengambilan keputusan. Dengan statistika diharapkan peluang

kesalahan yang terjadi sekecil mungkin.

Berdasarkan cara pengolahan datanya, statistika dibagi ke dalam dua kelompok besar,

yaitu statistika deskriptif dan statistika inferensia. Statistika deskriptif merupakan bidang

statistika yang mempelajari cara atau metode mengumpulkan, menyederhanakan dan

menyajikan data serta meringkas data sehingga bisa memberikan informasi yang jelas dan

mudah dipahami. Dalam statistika deskripsi belum sampai pada upaya menarik suatu

kesimpulan, tetapi baru sampai pada tingkat memberikan suatu bentuk ringkasan data

sehingga khalayak/masyarakat awam statistika pun dapat memahami informasi yang

terkandung dalam data. Beberapa teknik statistika yang termasuk dalam kelompok ini seperti

distribusi frekuensi, ukuran pemusatan dan penyebaran data. Sedangkan statistika inferensia

merupakan bidang statistika yang mempelajari cara atau metode penarikan kesimpulan

berdasarkan data yang diperoleh dari sampel untuk menggambarkan karakteristik atau ciri dari

suatu populasi.

Gambaran penarikan kesimpulan dari data dengan menggunakan analisis statistika

secara ringkas disajikan pada bagan berikut ini:

Gambar 1. Tahapan analisis statistika

Page 5: 73485202-Metode-Statistika.pdf

2

1.2 Beberapa Istilah dalam Statistika

Beberapa istilah yang sering dijumpai dalam statistika, diantaranya adalah:

1. Populasi dan contoh

Populasi adalah suatu keseluruhan pengamatan atau obyek yang menjadi perhatian

kita. Sedangkan Sampel adalah bagian dari suatu populasi. Jadi jika dikaitkan dengan Teori

Himpunan, populasi adalah himpunan semesta/ruang contoh, sedangkan sampel adalah

himpunan bagian. Populasi bersifat ideal atau teoritis, sedangkan sampel bersifat nyata

atau empiris.

Meskipun gambaran tentang populasi sangat ideal, namun sangat jarang digunakan

untuk penelitian, pada umumnya yang dipakai adalah sampel, dengan alasan :

Waktu yang diperlukan untuk mengumpulkan data lebih singkat.

Dana yang digunakan lebih sedikit

Dengan Statistika Inferensia dapat diperoleh generalisasi. Artinya hasil perhitungan

yang diperoleh dari sampel, dapat digunakan untuk menyimpulkan karakteristik dari

populasi.

2. Parameter dan statistik

Parameter adalah nilai besaran atau karakteristik yang dihitung/diukur dari seluruh

unsur yang ada dalam populasi, sedangkan statistik adalah nilai besaran atau karakteristik

yang dihitung dari sampel.

3. Peubah/Variabel

Peubah merupakan suatu karakteristik dari suatu objek. Beberapa contoh variabel

antara lain seperti: nama, umur, tinggi badan, berat badan, asal SMA, dan jenis kelamin

merupakan karakteristik peserta mata kuliah metode statistika.

Berdasarkan nilai-nilainya, peubah bisa dikelompokkan dalam dua kelompok, yaitu

numerik dan kategorik. Suatu peubah dikatakan numerik jika nilai dari peubah itu

merupakan bilangan yang mencerminkan nilai yang sesungguhnya, bukan hanya sebuah

kode. Misalnya tinggi badan 176 cm, merupakan peubah numerik karena 176 merupakan

nilai hasil pengukuran yang sebenarnya. Berbeda dengan kalau hanya sebuah kode

misalnya pendidikan diberi kode 1 untuk SD, 2 untuk SMP dan seterusnya. Yang seperti

terakhir itu adalah kategorik.

a. Peubah Kategorik, terdiri atas dua jenis lagi :

1. Peubah Nominal, yaitu jenis peubah yang penggolongannya atau pengkategoriannya

hanya berupa nama saja (lambang), tidak ada urutan yang memberikan makna

tertentu. Yang termasuk dalam peubah ini, misalnya

- jenis kelamin : laki-laki, perempuan

- warna : merah, kuning, ungu, hijau, dsb

Page 6: 73485202-Metode-Statistika.pdf

3

Tidak ada alasan tertentu kategori mana yang disebut di awal dan mana yang di

akhir.

2. Peubah Ordinal, yaitu jenis peubah yang pengkategoriannya bisa diurutkan

berdasarkan kriteria tertentu yang bermakna. Yang termasuk dalam jenis peubah

ini, misalnya :

- pendidikan : SD, SMP, SMA, Diploma, S1, S2, S3. Urutan tersebut merupakan

urutan pendidikan rendah ke tinggi.

- tingkat kesetujuan : sangat tidak setuju, tidak setuju, netral, setuju, sangat

setuju. Urutan tersebut dari tingkat yang paling tidak setuju hingga setuju.

b. Peubah Numerik dibagi lagi menjadi dua jenis, yaitu:

1. Peubah Selang (interval), yaitu peubah yang nilai-nilainya numerik tapi tidak bisa

dirasiokan satu dengan lainnya. Hal ini karena nilai 0 pada peubah ini bukan nilai

nol mutlak, tapi merupakan kesepakatan saja. Misalnya suhu (dalam derajat

celcius), merupakan peubah selang karena 0 pada peubah ini adalah kesepakatan

orang yaitu suhu ketika air membeku pada tekanan 4 atm. Jika ada sebuah benda

bersuhu 5oC dan benda lain bersuhu 100oC, tidak bisa dikatakan bahwa benda kedua

suhunya 20 kali benda pertama.

2. Peubah Nisbah (rasio), yaitu peubah yang nilai-nilainya numerik dan bisa dirasiokan

satu dengan lainnya. Hal ini terjadi karena nilai 0 pada peubah ini bersifat mutlak.

Yang termasuk peubah ini adalah :

- Produksi gabah (dalam ton/ha), merupakan peubah rasio karena kalau

produksinya 0 berarti tidak ada gabah yang dihasilkan. Jika produksi gabah

petani A sebesar 4 ton/ha dan petani B sebesar 8 ton/ha, maka petani B

memperoleh gabah 2 kali lebih banyak dari petani A.

- Berat (dalam kg), merupakan peubah rasio karena kalau beratnya 0 itu berarti

bendanya tidak ada, serta juga dapat dirasiokan.

Peubah dalam skala pengukuran rasio ataupun selang bisa dinyatakan sebagai peubah

dalam skala pengukuran ordinal maupun nominal, setelah dikategorikan terlebih dahulu.

Misalnya pendapatan per bulan sebuah keluarga. Jika diukur dalam satuan rupiah maka itu

merupakan peubah rasio, namun jika peubah yang sama kemudian nilai-nilainya

dikelompokkan menjadi misalnya :

- < 1 juta

- 1 juta s/d 2 juta

- 2 juta s/d 5 juta

- > 5 juta

maka yang terakhir menjadi peubah ordinal.

Page 7: 73485202-Metode-Statistika.pdf

4

Atau kalau misalnya yang diukur adalah diameter ujung bolpoin pada suatu

pemeriksaan pengendalian mutu produk (diukur dalam mm). Kemudian dikategorikan

seperti berikut :

- < 1 mm atau > 2 mm dinyatakan tidak memenuhi syarat

- 1 mm s/d 2 mm dinyatakan memenuhi syarat

Pada akhirnya diameter bolpoin dinyatakan menjadi dua kategori : memenuhi syarat dan

tidak memenuhi syarat, dan ini adalah peubah nominal.

Pengetahuan tentang jenis peubah ini sangat perlu untuk diketahui karena menyangkut

analisis yang digunakan dan ketajaman analisisnya. Setiap analisis hanya bisa untuk jenis

peubah tertentu, tidak sembarangan. Jadi perlu diperhatikan benar analisis apa yang bisa

untuk data kita.

4. Data

Data adalah semua bentuk keterangan yang berhubungan dengan variabel tertentu yang

dicatat dari objek yang sedang menjadi perhatian. Dilihat dari rentang waktu

pengumpulannya, data dapat dibedakan ke dalam tiga kelompok, yaitu data runtun waktu,

data cross section, dan data panel. Data runtun waktu adalah hasil pengukuran pada satu

atau lebih variabel yang pengamatannya dilakukan secara teratur sepanjang periode

tertentu. Data cross section adalah data yang tersusun dari satu atau lebih variabel yang

dikumpulkan dari banyak objek pada satu masa tertentu. Sedangkan data panel adalah

data yang tersusun dari satu atau lebih variabel yang berasal dari banyak objek yang

dicatat secara teratur sepanjang periode tertentu.

1.3 Peranan statistika dan Perkembangannya

Istilah STATISTIKA (statistics) berasal kata STATE, karena pada awalnya pengumpulan

data diperuntukkan oleh perumus kebijakan negara, misalnya saja pemungutan pajak, data

kelahiran, data kematian, potensi sumberdaya, dan kebutuhan tenaga militer. Perkembangan

pesat statistika didominasi pada perkembangan di bidang pertanian dan psikologi

Dewasa ini statistika memegang peranan yang sangat penting dalam berbagai bidang.

Penggunaan statistika bisa dikatakan telah diterapkan oleh seluruh bidang, antara lain:

Medis: pendeteksian penyebab timbulnya penyakit, pencarian hubungan teknik pengobatan

dan penyembuhan, penentuan dosis dan komposisi obat

Pertanian: pencarian galur tanaman dengan produksi terbesar (pemuliaan), pencarian

teknik pemupukan, penentuan faktor pendukung keberhasilan produksi tanam

Bisnis: segmentasi pasar, peningkatan citra merek produk, peningkatan kualitas produk

Page 8: 73485202-Metode-Statistika.pdf

5

Industri: perencanaan desain produk yang bisa diterima pasar, pemilihan bahan baku yang

sesuai

Sosial: penentuan faktor-faktor demografi yang mempengaruhi keberhasilan pembangunan,

penentuan strategi penyuluhan, penentuan strategi peningkatan motivasi

Ekonomi: hubungan antar peubah ekonomi, pemodelan ekonometrika

Percepatan penerapan statistika menjadi semakin berkembang secara luas dengan

adanya kemajuan di bidang komputer dan tekhnologi software. Dengan adanya komputer

penghitungan statistik menjadi semakin cepat, teliti, dan akurat, sehingga peranan statistika

menjadi semakin berkembang di berbagai bidang kehidupan terutama dalam analisis data dan

keperluan perencanaan. Beberapa contoh paket program statistika antara lain:

SAS (Statistics Analysis System)

SPSS (Statistics Program Science For Social)

MINITAB

1.4 Latihan Soal

1. Jelaskan apa yang dimaksud dengan :

a. statistik b. statistika

c. statistika deskriptif d. statistika inferensia

e. data numerik f. data kategorik

g. data diskret h. data kontinu

2. Data apa kiranya akan dicatat seorang kepala desa untuk mengukur:

a. produktivitas lahan sawah di desanya

b. tingkat penghasilan penduduk di desanya

c. potensi tenaga kerja di desanya

d. keberadaan kepala keluarga di desanya

e. kemajuan pelayanan kesehatan ibu dan anak di desanya

3. Seorang petugas keamanan jalan raya lintas cepat mencatat setiap peristiwa kecelakaan

lalu lintas yang terjadi di jalan raya itu. Yang dicatat adalah:

a. jenis kendaraan bermotor yang mengalami kecelakaan

b. warna kendaraan bermotor itu

c. umur pengemudi

d. panjang batas tapak mengerem di jalan raya sebelum kendaraan tersebut bertabrakan

e. ruas jalan tempat kecelakaan itu terjadi

f. Jalur alan tempat kecelakaan terjadi

manakah dari data yang dicatat tersebut menghasilkan:

(i) data numerik

(ii) data kategorik berskala nominal

(iii) data kategorik berskala ordinal

Page 9: 73485202-Metode-Statistika.pdf

6

2 PENYAJIAN DATA

2.1 Pendahuluan

Data yang telah dikumpulkan, baik dari populasi maupun dari sampel, perlu ditata atau

diorganisir, diolah dan disajikan secara sistematis dan rapi sehingga mudah dan cepat dipahami

dan dimengerti.

Teknik penyajian data umumnya disesuaikan dengan jenis peubah yang akan disajikan.

Namun secara garis besar ada dua cara penyajian data, yaitu tabel dan grafik/gambar. Ada

beberapa bentuk tabel yang biasanya digunakan, seperti tabel frekuensi. Sedangkan beberapa

bentuk gambar, seperti diagram batang, diagram lingkaran, diagram dahan daun, histogram,

diagram kotak garis dan scater plot. Penggunaan beberapa teknik penyajian data tersebut

disesuaikan dengan tipe peubahnya.

2.2 Penyajian Data untuk Peubah Kategorik

Peubah kategorik merupakan suatu peubah yang nilainya hanya berupa sebuah kode.

Tehnik penyajian data dari peubah jenis ini dapat dilakukan dengan menggunakan tabel

frekuensi atau gambar.

Untuk lebih memahami teknik penyajian data, berikut ini diberikan data karakteristik

anggota koperasi simpan pinjam “HARMONI”.

Tabel Karakteristik Anggota Koperasi simpan pinjam “HARMONINo Jenis kelamin Tinggi (cm) Berat (kg) Agama Pendidikan1 0 175 65 1 02 0 154 50 1 03 1 167 59 1 14 1 169 60 2 05 0 149 48 1 26 0 162 53 1 27 1 163 55 2 18 1 170 69 3 19 0 165 63 1 110 1 166 58 1 211 0 168 53 4 212 1 172 56 1 313 1 161 53 3 314 0 159 50 1 115 0 155 46 2 216 1 165 57 5 317 0 160 51 4 318 1 170 61 1 419 1 162 51 1 420 1 164 58 3 2

Keterangan:Jns Kel. : 0 =Perempuan; 1=Laki-lakiAgama : 1=Islam; 2=Kristen; 3=Katholik; 4=Hindu; 5=BudhaPdd : 0=Tidak sekolah; 1=SD; 2=SLTP; 3=SLTA; 4=S0/S1/S2/S3

Page 10: 73485202-Metode-Statistika.pdf

7

Dari peubah-peubah yang diamati, yang termasuk peubah kategorik adalah jenis kelamin,

agama dan pendidikan. Penyajian data dari ketiga peubah tersebut dapat dilakukan dengan:

1. Tabel frekuensi

Tabel atau daftar merupakan kumpulan angka yang disusun menurut kategori-kategori

data. Tabel frekuensi merupakan gambaran frekuensi atau banyaknya objek menurut

kategori yang ada. Selain menyajikan frekuensi data, untuk memudahkan interpretasi

biasanya dalam tabel juga disajikan persentase dari masing-masing kategori yang

merupakan rasio dari frekuensi masing-masing kategori terhadap total objek yang ada. Ada

tiga jenis tabel frekuensi berdasarkan banyaknya peubah yang terdapat pada tabel, yaitu

tabel satu arah, dua arah dan multi arah.

a. tabel satu arah yaitu tabel yang hanya terdiri dari satu kategori atau peubah

misalnya akan disajikan tabel banyaknya anggota koperasi menurut jenis kelamin, maka

tabel yang diperoleh adalah:

Jenis Kelamin Frekuensi Persentase

Perempuan 9 0.45

Laki-laki 11 0.55

Total 20 1Dari tabel di atas kita dapat mengetahui bahwa anggota koperasi sebagian besar adalah

laki-laki.

b. tabel dua arah, yaitu tabel yang terdiri dari dua kategori atau dua peubah

misalnya akan disajikan tabel banyaknya anggota koperasi menurut jenis kelamin dan

tingkat pendidikan, maka tabel yang diperoleh adalah:

Jenis KelaminPendidikan *)

TotalData 0 1 2 3 4

perempuan N 2 2 4 1 9

% Baris 22.2% 22.2% 44.4% 11.1% 0.0% 100.0%

% Kolom 66.7% 40.0% 66.7% 25.0% 0.0% 45.0%

% Total 10.0% 10.0% 20.0% 5.0% 0.0% 45.0%

Laki-laki N 1 3 2 3 2 11

% Baris 9.1% 27.3% 18.2% 27.3% 18.2% 100.0%

% Kolom 33.3% 60.0% 33.3% 75.0% 100.0% 55.0%

% Total 5.0% 15.0% 10.0% 15.0% 10.0% 55.0%

Total N 3 5 6 4 2 20

% Baris 15.0% 25.0% 30.0% 20.0% 10.0% 100.0%

% Kolom 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%

% Total 15.0% 25.0% 30.0% 20.0% 10.0% 100.0%

Keterangan: *) 0=Tidak sekolah; 1=SD; 2=SLTP; 3=SLTA; 4=S0/S1/S2/S3

Page 11: 73485202-Metode-Statistika.pdf

8

2. Gambar

Penyajian data dengan gambar/grafik adakalanya lebih efektif dalam menyajikan

informasi/karakteristik suatu data. Pesan visual yang diberikan oleh gambar selain lebih

menarik untuk dilihat juga lebih memudahkan dalam melakukan pembandingan.

Gambar/grafik yang biasanya digunakan untuk data dengan peubah kategorik adalah:

a. diagram batang. Diagram ini berupa batang-batang yang menggambarkan nilai dari

masing-masing kategori. Untuk membuat diagram batang, data yang diambil biasanya

diambil setelah dalam bentuk tabel frekuensi atau tabel kontingensi. Pada contoh di

atas, jika frekuensi jenis kelamin anggota koperasi disajikan dalam bentuk grafik akan

berupa:

0

2

4

6

8

10

12

Perempuan Laki-laki

Jenis Kelamin

Fre

ku

en

si

Sedangkan jika frekuensi jenis kelamin dan tingkat pendidikan dari anggota koperasi

disajikan dalam bentuk grafik akan berupa:

0

1

2

3

4

5

perempuan Laki-laki

Jenis Kelamin

Fre

ku

en

si

0 1 2 3 4

Pendidikan:

b. Diagram lingkaran. Diagram ini berupa lingkaran yang terbagi-bagi dalam beberapa

bagian. Masing-masing bagian merupakan representasi dari berbagai kategori, dan luas

dari bagian itu berdasarkan persentase masing-masing kategori. Jika frekuensi anggota

Page 12: 73485202-Metode-Statistika.pdf

9

koperasi menurut jenis kelamin disajikan dalam bentuk diagram lingkaran, maka

langkah-langkah pembuatannya adalah:

- hitung luas masing-masing kategori:

Perempuan = 360o x 45% = 162o

Laki-laki = 360o x 55% = 198o

- gambarkan masing-masing kategori berdasarkan besar luasannya

2.3 Penyajian Data untuk Peubah Numerik

Peubah numerik merupakan suatu peubah yang nilainya merupakan bilangan yang

mencerminkan nilai yang sesungguhnya, bukan hanya sebuah kode. Tehnik penyajian data dari

peubah jenis ini dapat dilakukan dengan menggunakan tabel frekuensi atau gambar. Beberapa

teknik penyajian data yang biasanya digunakan pada data dengan peubah numerik adalah:

1. diagram dahan daun

Diagram dahan daun digunakan untuk mendapatkan gambaran pemusatan data dan

perkisaran data. Diagram ini terdiri atas sebuah “dahan” yang dilekati “daun-daunan”.

Dahan terdiri atas buku-buku yang melambangkan satuan terbesar, sedangkan daun

melambangkan satuan berikutnya. Misalnya dibuat diagram dahan daun untuk peubah

tinggi badan anggota koperasi, hasilnya adalah:

Stem-and-leaf of Tinggi N = 20Leaf Unit = 1.0

1 14 92 15 44 15 5910 16 01223410 16 5567894 17 0021 17 5

Page 13: 73485202-Metode-Statistika.pdf

10

Sedangkan untuk peubah berat badan adalah:

Stem-and-leaf of Berat N = 20Leaf Unit = 1.01 4 62 4 86 5 00119 5 33310 5 510 5 678 5 8895 6 013 6 32 6 51 61 6 9

2. tabel distribusi frekuensi

Dengan tabel frekuensi, karakteristik penting suatu data dapat diketahui melalui

pengelompokan data ke dalam beberapa kelas dan kemudian dihitung banyaknya

pengamatan yang masuk ke dalam setiap kelas. Adapun langkah-langkah dalam menyusun

tabel frekuensi adalah:

a. tentukan rentang data yaitu selisih dari nilai terbesar dengan nilai terkecil suatu data

b. tentukan banyaknya kelas yang digunakan. Ada suatu kaidah yang dapat digunakan

untuk menentukan banyaknya kelas (c) yang ditentukan oleh ukuran kumpulan data n

yaitu kaidah Sturge, dimana:

250log3.31

2509

nuntukn

nuntukc

c. Hitung lebar selang kelas yaitu rasio antara rentang data dengan banyaknya kelas

d. Hitung banyaknya pengamatan pada setiap kelas

e. Hitung frekuensi relatif tiap-tiap kelas yang merupakan rasio antara frekuensi kelas

dengan total pengamatan (n).

Misalnya akan dibuat tabel frekuensi untuk peubah tinggi badan. Bentuk tabelnya adalah:

SelangNilai

tengahkelas

Frekuensifrekuensi

relatif

148.5 - 151.5 150 1 0.05

151.5 - 154.5 153 1 0.05

154.5 - 157.5 156 1 0.05

157.5 - 160.5 159 2 0.10

160.5 - 163.5 162 4 0.20

163.5 - 166.5 165 4 0.20

166.5 - 169.5 168 3 0.15

169.5 - 172.5 171 3 0.15

172.5 - 175.5 174 1 0.05

Total 20 1.00

Page 14: 73485202-Metode-Statistika.pdf

11

3. Histogram

Histogram merupakan grafik dari tabel distribusi frekuensi. Histogram digambarkan pada

sistem salib sumbu X-Y. Kelas-kelas selang diletakkan pada sumbu X, sedangkan frekuensi

kelas diletakkan pada sumbu Y. Misalkan tabel frekuensi tinggi badan dibuat dalam bentuk

histogram, akan diperoleh gambar seperti berikut ini.

Berdasarkan histogram yang terbentuk, dapat diketahui bentuk sebaran dari data tinggi

badan. Bentuk histogram ini dapat mengalami perubahan tergantung banyaknya kelas dan

lebar selang. Dengan adanya komputer, berbagai histogram dengan lebar selang yang

berbeda-beda dapat dibuat. Dari berbagai hasil itu kemudian dapat dipilih histogram yang

memberikan gambaran yang diinginkan.

Selain menggunakan data dari tabel distribusi frekuensi, histogram juga dapat dibuat

berdasarkan tabel distribusi frekuensi relatif. Bentuk histogramnya sama, yang berbeda

hanya skala pada sumbu Y.

4. Scatter Plot

Plot ini merupakan grafik yang digunakan untuk melihat hubungan antara dua buah peubah

numerik. Misalkan kita ingin tahu hubungan antara tinggi badan dengan berat badan.

Grafik yang diperoleh mungkin akan berupa grafik sebagai berikut :

Page 15: 73485202-Metode-Statistika.pdf

12

0

10

20

30

40

50

60

70

80

145 150 155 160 165 170 175 180

Tinggi badan (cm)

Be

rat

bad

an

(kg)

2.4 Latihan Soal

1. a. Mengapa data perlu disajikan dengan menggunakan tabel dan grafik, jelaskan!

b. Dalam hal tertentu mengapa penyajian data dengan grafik lebih baik daripada dengan

tabel ?

2. a. sebutkan beberapa cara penyajian data dengan tabel

b. sebutkan beberapa cara penyajian data dengan grafik

3. buatlah disain tabel :

a. tabel satu arah mengenai data pendidikan yaitu jumlah mahasiswa menurut fakultas .

b. tabel dua arah mengenai data pembelian barang yaitu banyaknya barang yang dibeli

oleh perusahaan menurut jenis barang dan harga.

c. Tabel tiga arah mengenai data investasi menurut negara asal, lokasi usaha dan jenis

usaha.

4. Buatlah contoh grafik garis, batang, dan lingkaran untuk menggambarkan suatu

karakteristik data tertentu.

Page 16: 73485202-Metode-Statistika.pdf

13

3 UKURAN PEMUSATAN DAN PENYEBARAN DATA

3.1 Pendahuluan

Pada setiap upaya pengumpulan data untuk menjawab suatu masalah, selalu diperoleh

hasil pengukuran atau pencacahan berupa angka-angka yang cukup banyak. Oleh karena itu

setiap kegiatan pengumpulan data diikuti oleh suatu kegiatan meringkas data sehingga

mendapatkan bentuk yang lebih mudah dipahami. Peringkasan data dimaksudkan untuk

mencari sesederhana mungkin informasi dari data yang dikumpulkannya tapi memiliki

pengertian yang dapat menjelaskan data secara keseluruhan. Untuk keperluan ini dalam

statistika dikenal istilah ukuran pemusatan dan ukuran penyebaran.

3.2 Ukuran pemusatan

Ukuran pemusatan merupakan suatu gambaran (informasi) yang memberikan

penjelasan bahwa data memiliki satu (mungkin lebih) titik dimana dia memusat atau

terkumpul.

Ukuran-ukuran pemusatan yang sering digunakan antara lain modus, median, kuartil,

desil, persentil, rata-rata (aritmatic mean), geometric mean, dan harmonic mean.

Modus

Suatu nilai data yang paling sering terjadi atau yang mempunyai frekuensi paling tinggi.

Suatu kumpulan data mungkin saja mempunyai modus lebih dari satu buah.

Contoh 3.1

Berikut ini adalah data sampel rata-rata pendapatan 25 rumah tangga desa A per bulan (dalam

juta rupiah).

1.5 0.9 0.5 1.3 1.0 1.2 1.5 1.4 1.7 1.8 1.2 1.0 1.9

2.0 2.0 2.4 3.0 2.2 1.5 1.6 1.6 1.5 1.0 0.8 1.5

Berdasarkan data di atas, maka modusnya adalah 1.5.

Median

Median adalah suatu nilai data yang membagi dua sama banyak kumpulan data yang

telah diurutkan. Apabila banyaknya data ganjil, median adalah data yang tepat ditengah-

tengah, sedangkan bila banyaknya data genap, median adalah rata-rata dua data yang ada

ditengah.

Langkah-langkah yang dapat digunakan untuk mencari nilai median cara sebagai berikut:

Urutkan data amatan mulai amatan terkecil sampai data amatan terbesar

Page 17: 73485202-Metode-Statistika.pdf

14

Posisi median (nmed) = (n+1)/2

Jika posisi median bernilai bulat maka median adalah X[(n+1)/2] sedangkan jika bernilai

pecahan maka median adalah rata-rata dari X[n/2] dan X[n/2+1]

Contoh 3.2

Berdasarkan data pada contoh 3.1, maka nilai mediannya dapat dihitung dengan tahapan:

1. urutkan data menggunakan diagram dahan daun:

Stem-and-leaf of C1 N = 25Leaf Unit = 0.10

1 0 51 03 0 896 1 0009 1 223

(6) 1 45555510 1 6677 1 895 2 003 2 22 2 41 21 21 3 0

2. posisi median (nmed) = (n+1)/2 = 26/2 = 13

3. karena nmed bernilai bulat, maka median (m) = X[13] = 1.5

Kuartil

Kuartil adalah nilai-nilai yang menyekat gugus data menjadi empat kelompok data yang

masing-masing terdiri dari 25% amatan. Nilai-nilai yang menyekat data menjadi empat

kelompok data tersebut dikenal dengan sebutan kuartil 1 (Q1), kuartil 2 (Q2) dan kuartil 3 (Q3).

Kuartil 1 (Q1) adalah nilai data yang menyekat kumpulan data yang telah diurutkan

sehingga banyaknya data yang lebih kecil dari Q1 adalah 25 % dan yang lebih besar dari Q1

adalah 75 %.

Kuartil 2 (Q2) sama dengan median yang merupakan nilai pembatas 50% data disebelah

kiri Q2 dan 50% data disebelah kanan Q2.

Kuartil 3 (Q3) adalah nilai data yang menyekat kumpulan data yang telah diurutkan

sehingga banyaknya data yang lebih kecil dari Q3 adalah 75 % dan yang lebih besar dari Q3

adalah 25 %.

Langkah-langkah perhitungan yang dapat digunakan sebagai pedoman dalam menentukan nilai-

nilai kuartil adalah sebagai berikut:

Urutkan data mulai data amatan terkecil sampai data amatan yang terbesar

Hitung posisi kuartil 2 (nq2), caranya sama dengan perhitungan posisi median, nq2 = (n+1)/2

Page 18: 73485202-Metode-Statistika.pdf

15

Jika posisi kuartil 2 bernilai bulat maka kuartil 2 adalah X[(n+1)/2] sedangkan jika bernilai

pecahan maka kuartil 2 adalah rata-rata dari X[n/2] dan X[n/2+1]

Hitung posisi kuartil 1 dan 3 dengan menggunakan rumus berikut:

nq1 = (posisi kuartil 2 terpangkas +1) / 2 = (nq2* + 1) = nq3

Penetapan nilai kuartil 1 dan kuartil 3 prinsipnya sama dengan penentuan kuartil 2. Nilai

kuartil 1 posisi dihitung mulai pengamatan terkecil sedangkan nilai kuartil 3 dihitung dari

pengamatan terbesar.

Contoh 3.3

Berdasarkan data pada contoh 3.1, maka nilai kuartilnya dapat dihitung dengan tahapan:

1. urutkan data

0.5 0.8 0.9 1 1 1 1.2 1.2 1.3 1.4 1.5 1.5 1.51.5 1.5 1.6 1.6 1.7 1.8 1.9 2 2 2.2 2.4 3

2. hitung q2:

a. nq2 = (n+1)/2 = 26/2 = 13

b. q2 = X[13] = 1.5

3. hitung q1:

a. nq1 = (nq2* +1)/2 = (13+1)/2 = 7

b. q1 = X[7] = 1.2

4. hitung q3:

a. nq3 = (n+1) – nq1 = (25+1) – 7 =19

b. q3 = X[19] = 1.8

Selain dengan cara seperti di atas, untuk mencari nilai kuartil dapat juga dilakukan dengan

cara interpolasi, yaitu dengan tahapan sebagai berikut:

1. urutkan data

2. tentukan posisi kuartil, nqi = i(n+1)/4; dengan i = 1, 2, 3

3. jika nqi bulat, maka qi = x[nqi]

4. jika nqi tidak bulat, maka

qi = x[nilai bulat] + nilai pecahan (x[nilai bulat+1] – x[nilai bulat])

Contoh 3.4

Misalkan untuk menentukan nilai kuartil pada contoh 3.3 digunakan cara interpolasi, maka

hasilnya adalah:

1. posisi kuartil:

Page 19: 73485202-Metode-Statistika.pdf

16

a. nq1= (n+1)/4 = 26/4 = 6.5

b. nq2= 2(n+1)/4 = 26/2 = 13

c. nq3= 3(n+1)/4 =3(26)/4 = 19.5

2. nilai kuartil:

a. q1 = x[6] + 0.5(x[7] – x[6]) = 1.0 + 0.5(1.2 – 1.0) = 1.1

b. q2 = x[13] = 1.5

c. q3 = x[19] + 0.5(x[20] – x[19]) = 1.8 + 0.5(1.9 – 1.8) = 1.85

Desil

Desil adalah nilai-nilai yang membagi segugus pengamatan menjadi 10 bagian yang sama. Nilai-

nilai pembaginya ada 9, dilambangkan dengan D1, D2, …, D9, mempunyai sifat bahwa 10% data

jatuh di bawah D1, 20% jatuh di bawah D2, …, dan 90% jatuh di bawah D9.

Dengan cara interpolasi seperti dalam penentuan kuartil, maka tahapan dalam menentukan

desil adalah:

1. urutkan data

2. tentukan posisi desil, ndi = i(n+1)/10; dengan i = 1, 2, ..., 9

3. jika ndi bulat, maka di = x[ndi]

4. jika ndi tidak bulat, maka

di = x[nilai bulat] + nilai pecahan (x[nilai bulat+1] – x[nilai bulat])

Contoh 3.5

Berdasarkan data pada contoh 3.1, maka nilai desil ke-3 dapat dihitung dengan tahapan:

1. urutkan data (hasil seperti contoh 3.3)

2. posisi desil-3: nd3 = 3(n+1)/10 = 3(26)/10 =7.2

3. nilai d3:

d3 = x[7] + 0.2(x[8] – x[7]) = 1.2 + 0.2(1.2 – 1.2) = 1.2

Persentil

Persentil adalah nilai-nilai yang membagi segugus pengamatan menjadi 100 bagian yang sama.

Nilai-nilai pembaginya ada 99, dilambangkan dengan P1, P2, …, P99, bersifat bahwa 1% dari

seluruh data terletak di bawah P1, 2% terletak di bawah P2, …, dan 99% terletak di bawah P99.

Page 20: 73485202-Metode-Statistika.pdf

17

Dengan cara interpolasi seperti dalam penentuan desil, maka tahapan dalam menentukan

persentil adalah:

1. urutkan data

2. tentukan posisi persentil, npi = i(n+1)/100; dengan i = 1, 2, ..., 99

3. jika npi bulat, maka pi = x[npi]

4. jika npi tidak bulat, maka

pi = x[nilai bulat] + nilai pecahan (x[nilai bulat+1] – x[nilai bulat])

Contoh 3.6

Nilai persentil 10 dan 90 Dari data pada contoh 3.1, dapat dicari dengan tahapan perhitungan

sebagai berikut:

1. urutkan data (hasil seperti contoh 3.3)

2. posisi persentil:

a. np10 = 10(n+1)/100 = 10(26)/100 =2.6

b. np90 = 90(n+1)/100 = 90(26)/100 = 23.4

3. nilai persentil:

a. p10 = x[2] + 0.6(x[3] – x[2]) = 0.8 + 0.6(0.9 – 0.8) = 0.86

b. p90 = x[23] + 0.4(x[24] – x[23]) = 2.2 + 0.4(2.4 – 2.2) = 2.28

Rata-rata

Rata-rata sering juga disebut dengan nilai tengah. Nilai ini merupakan ukuran pemusatan data

yang menimbang data menjadi dua kelompok data yang memiliki massa yang sama. Dengan

kata lain nilai tengah merupakan titik keseimbangan massa dari segugus data. Apabila x1, x2,

...,xN adalah anggota suatu populasi terhingga berukuran N, maka nilai tengah populasinya

adalah:

1

NXi

i 1

N

sedangkan jika x1, x2, ...,xn adalah anggota suatu contoh berukuran n, maka nilai tengah contoh

tersebut adalah:

x1

nXi

i 1

n

Page 21: 73485202-Metode-Statistika.pdf

18

Contoh 3.7

Berdasarkan data pada contoh 3.1, maka nilai rata-ratanya adalah:

52.125

38)5.1...9.05.1(

25

1X

n

1x

n

1i

i

Rata-rata terpangkas

Karena dalam menentukan nilai rata-rata suatu data mempertimbangkan seluruh nilai

pengamatan, maka sifat nilai rata-rata tidak “kekar” (unrobust) artinya nilai rata-rata

terpengaruh oleh nilai ekstrim. Jika ada nilai ekstrim besar, maka rata-rata akan bergeser ke

kanan (ke nilai besar). Sebaliknya jika ana nilai yang ekstrim kecil, rata-rata akan bergeser ke

kiri 9 ke nilai kecil). Dengan demikian diperlukan kehati-hatian dalam menggunakan rata-rata.

Untuk mengatasi keberadaan data ekstrim sering disarankan untuk menggunakan rata-rata

terpangkas (trimmed mean). Misalkan rata-rata terpangkas 5%, artinya kita menghitung rata-

rata setelah membuang 5% data terkecil dan 5% data terbesar.

Contoh 3.8

Berdasarkan data pada contoh 3.1, jika akan dihitung rata-rata terpangkas 5%, maka

tahapannya adalah:

1. urutkan data

0.5 0.8 0.9 1 1 1 1.2 1.2 1.3 1.4 1.5 1.5 1.51.5 1.5 1.6 1.6 1.7 1.8 1.9 2 2 2.2 2.4 3

2. buang 5% nilai pengamatan terkecil dan 5% terbesar (25 x 5% = 1.25 1). Jadi nilai yang

dibuang adalah 0.5 dan 3.

3. hitung nilai rata-rata dari 23 data lainnya (tanpa 0.5 dan 3)

5.123

34.5)4.2...9.08.0(

23

1X

n

1*x

*n

1i

i*

3.3 Ukuran Penyebaran

Ukuran penyebaran data memberikan gambaran seberapa besar data menyebar dalam

kumpulannya. Dengan ukuran penyebaran kita dapat melihat seberapa jauh data-data

menyebar dari titik pemusatannya.

Ukuran penyebaran yang sering digunakan antara lain :

Wilayah (Range)

Ukuran penyebaran data yang paling sederhana adalah mencari selisih pengamatan terkecil

dengan pengamatan terbesar.

w = xmax-xmin

Page 22: 73485202-Metode-Statistika.pdf

19

Ukuran ini cukup baik digunakan untuk mengukur penyebaran data yang simetrik dan nilai

pengamatannya menyebar merata. Tetapi ukuran ini akan menjadi tidak relevan jika nilai

pengamatan maksimum dan minimum merupakan data-data ekstrem.

Contoh 3.9

Berdasarkan data pada contoh 3.1, wilayah dari data tersebut adalah: W=3.0 – 0.5 = 2.5

Jangkauan antar Kuartil (Inter Quartil Range)

Jangkauan antar kuartil mengukur penyebaran 50% data ditengah-tengah setelah data diurut.

Ukuran penyebaran ini merupakan ukuran penyebaran data yang terpangkas 25% yaitu dengan

membuang 25% data yang terbesar dan 25% data terkecil. Ukuran ini sangat baik digunakan

jika data yang dikumpulkan banyak mengandung data pencilan. Jangkaun antar kuartil dihitung

dari selisih antara kuartil 3 (Q3) dengan kuartil 1 (Q1), atau dapat dirumuskan sebagai berikut:

Jak = Q3 -Q1

Contoh 3.10

Jangkauan antarkuartil dari data pada soal 3.1 adalah: JAK=q3 – q1 = 1.8 – 1.2 = 0.6

Ragam (Variance)

Ukuran penyebaran data yang paling sering digunakan adalah ragam. Ragam merupakan ukuran

penyebaran data yang mengukur rata-rata jarak kuadrat semua titik pengamatan terhadap titik

pusat (rataan). Apabila x1, x2, ...,xN adalah anggota suatu populasi terhingga berukuran N,

maka ragam populasinya adalah:

2 2

1

NX i

i 1

N

( )

dan apabila x1, x2, ...,xn adalah anggota suatu contoh berukuran n, maka ragam contoh

tersebut adalah:

n

1i

2i

2 )X(1-n

1xs

Bentuk rumus di atas dapat diuraikan menjadi lebih sederhana untuk memudahkan perhitungan

yaitu:

)1(1

)(

2n

1i1

2n

1i

22

2

nn

xxn

n

xnx

si

n

iii

Akar dari ragam dikenal dengan simpangan baku yang dinotasikan dengan , sedangkan

simpangan baku contoh dilambangkan dengan s.

Page 23: 73485202-Metode-Statistika.pdf

20

Contoh 3.11

Ragam dari data pada soal 3.1 adalah:

299.0600

1444)94.64(25

)125(25

38)5.1...9.05.1(25

)1(

2222

2n

1i1

2

2

nn

xxn

si

n

ii

Sedangkan simpangan bakunya adalah:

547.0299.02 ss

Koefisien keragaman

Ukuran penyebaran data seperti jangkauan, ragam, simpangan baku, dan jangkauan antar

kuartil merupakan keragaman mutlak. Ukuran keragaman ini tidak dapat dipakai untuk

membandingkan penyebaran dua kelompok data atau lebih. Untuk tujuan tersebut, ukuran

keragaman yang dipakai merupakan keragaman relatif. Salah satu ukuran keragaman relatif

yang sangat terkenal adalah koefisien keragaman (KK) yang dirumuskan sebagai berikut :

%100x

SKK

Contoh 3.12

Koefisien keragaman dari data pada contoh 3.1 adalah:

KK = (0.547/1.52) x 100% = 35.97%

Perlu diketahui bahwa sebagian besar data (sekitar 70%) berada pada kisaran sx . Gabungan

informasi dari kedua nilai tersebut akan lebih berguna dalam menyajikan informasi mengenai

data dibandingkan hanya nilai rata-rata saja.

Perhatikan hasil ringkasan terhadap data pendapatan rumah tangga (juta rupiah per bulan) dari

dua desa berikut ini:

Desa rata-rata ( x ) simpangan baku (s)

A 1.5 0.547

B 1.4 0.214

Jika kita hanya menyajikan nilai rata-rata saja dari kedua desa, maka dapat dinyatakan bahwa

rumah tangga di kedua desa memiliki pendapatan yang relatif sama. Penjelasan yang lebih

banyak akan diperoleh jika kita melihat nilai simpangan bakunya. Desa A memiliki simpangan

baku yang lebih besar daripada desa B. Artinya pendapatan rumah tangga di desa A lebih

heterogen dibanding di desa B.

Page 24: 73485202-Metode-Statistika.pdf

21

3.4 Kemiringan distribusi data

Kemiringan adalah derajat atau ukuran dari ketidaksimetrisan suatu distribusi data. Salah satu

cara yang dipakai untuk menghitung derajat kemiringan distribusi data adalah rumus pearson,

yaitu :

s

x mod atau

s

medx )(3

dengan : derajat kemiringan pearson

x : rata-rata hitung

mod : modus

s : standar deviasi

med : median

Jika :

kanankejulurmiring/mendatadistribusi0

kirikejulurmiring/mendatadistribusi0

simetrisdatadistribusi0

Semakin besar nilai || maka distribusi data akan semakin miring artinya semakin tidak

simetris.

Contoh 3.13

Berdasarkan data pada contoh 3.1, derajat kemiringan dari distribusi datanya adalah:

165.0547.0

)5.152.1(3)(3

s

medx

Karena nilai > 0, maka distribusi data menjulur ke kanan (seperti yang terlihat pada diagram

dahan daun pada contoh 3.2)

3.5 Keruncingan distribusi data

Keruncingan distribusi data merupakan derajat atau ukuran tinggi rendahnya puncak suatu

distribusi data terhadap distribusi normalnya. Keruncingan distribusi data disebut juga dengan

kurtosis. Ada tiga jenis kurtosis :

1. leptokurtis yaitu distribusi data yang puncaknya relatif tinggi

2. mesokurtis yaitu distribusi data yang puncaknya normal

3. platikurtis yaitu distribusi data yang puncaknya relatif rendah

Untuk mengukur kurtosis digunakan koefisien kurtosis persentil (k) dengan rumus :

Page 25: 73485202-Metode-Statistika.pdf

22

1090

1321

1090

)(

pp

qq

pp

JAKk

dengan k : derajat kurtosis

q1 : kuartil 1

q3 : kuartil 3

p10 : persentil ke-10

p90 : persentil ke-90

Ada tiga kriteria untuk menentukan keruncingan distribusi data, yaitu:

1. jika k = 0.263, maka distribusinya mesokurtis

2. jika k < 0.263, maka distribusinya platikurtis

3. jika k > 0.263, maka distribusinya leptokurtis

Contoh 3.14

Derajat keruncingan distribusi dari data pada contoh 3.1 adalah:

528.042.1

75.0

86.028.2

)1.185.1()( 21

1090

1321

pp

qqk

Karena nilai k > 0.263, maka distribusi datanya leptokurtis yaitu data yang memiliki puncak

relatif tinggi.

3.6 Penyajian data dengan diagram kotak garis (boxplot)

Untuk menggambarkan letak relatif berbagai statistik secara menyeluruh dapat dirancang

suatu bagan yang disebut diagram kotak garis. Dinamakan demikian karena bentuknya terdiri

atas kotak persegipanjang yang berekor ke kiri dan kanan. Penyajian informasi dalam bentuk

boxplot, lebih meringkaskan informasi walaupun data asli tidak ditampilkan. Informasi yang

dapat diperoleh dengan penyajian boxplot antara lain :

Kesimetrikan penyebaran data, dapat dilihat dari apakah box (kotak) terbagi dua oleh garis

median sama besar atau tidak dan apakah ‘ekor’ kiri (bawah) dan ‘ekor’ kanan (atas) sama

panjang atau tidak.

Keanehan data, jika data pengamatan berada di luar batas BB1 dan BA1 disebut pencilan

minor dan jika data pengamatan berada di luar batas BB2 dan BA2 disebut data ekstrem.

Page 26: 73485202-Metode-Statistika.pdf

23

Bagan kotak garis dapat digambarkan sebagai berikut:

+

BB2 BB1 Q1 Q2 Q3 BA1 BA2

keterangan: Q1, Q2, Q3 adalah nilai kuartil 1, 2 dan 3;

BA1=Q3+3/2(Q3-Q1);

BA2=Q3+3(Q3-Q1);

BB1=Q1-3/2(Q3-Q1);

BB2=Q1-3(Q3-Q1)

Diagram Kotak Garis juga dapat digunakan untuk perbandingan sebaran.

Contoh 3.15

Bentuk diagram kotak garis dari data pada contoh 3.1 dapat dibuat dengan tahapan sebagai

berikut:

1. tentukan nilai kuartil (k1= 1.1, k2 = 1.5, dan k3 = 1.85)

2. hitung batas bawah dan batas atas:

a. batas bawah: BB1 = q1 – 3/2(q3-q1) = 1.1 – 3/2(1.85 – 1.1) = -0.025, untuk BB2 tidak

perlu dihitung karena sudah tidak ada nilai pengamatan yang kurang dari nilai BB1.

b. Batas atas : BA1 = q3 + 3/2(q3-q1) = 1.85 + 3/2(1.85 – 1.1) = 2.975

BA2 = q3 + 3(q3-q1) = 1.85 + 3(1.85 – 1.1) = 4.10

3. grafiknya adalah:

Page 27: 73485202-Metode-Statistika.pdf

24

3.7 Latihan Soal

1. Berikut ini adalah 40 data nilai MK. Metode Statistika I, program studi D3 Statistika

semester 1 :

40 21 54 26 98 74 54 35 46 65

54 23 47 85 75 78 65 34 23 20

56 55 40 41 75 65 26 63 51 50

74 25 45 54 65 35 35 36 39 46

a. Buatlah diagram daun untuk data di atas, bagaimana pola sebaran datanya?

b. Tentukan nilai rata-rata dan ragam dari data di atas

c. Tentukan nilai kuartil dan jangkauan antar kuartilnya

d. Buatlah tabel distribusi frekuensi kemudian buat histogramnya.

e. Buatlah diagram kotak garisnya. Apakah ada data ekstrim?

2. Pemerintah ingin mengevaluasi besarnya subsidi minyak yang akan disalurkan kepada

masyarakat pedesaan dan perkotaan. Untuk mengevaluasi besarnya subsidi yang disalurkan,

pemerintah melimpahkan tugas ini kepada suatu lembaga riset. Penelitian dilakukan pada

10 desa/kelurahan yang berstatus pedesaan dan 15 desa/kelurahan yang berstatus

perkotaan. Data konsumsi minyak tanah (liter) per kapita diperoleh sebagai berikut:

Pedesaan:

0.20 0.16 0.17 0.15 0.11 0.13 0.14 0.15 0.17 0.28

Perkotaan:

0.10 0.26 0.27 0.15 0.18 0.19 0.15 0.19 0.21 0.25 0.18 0.15 0.16 0.21 0.33

a. Buatlah diagram dahan daun untuk kedua gugus data tersebut!

b. Hitunglah rata-rata dan ragam konsumsi minyak tanah pada masing-masing daerah

c. Buatlah diagram kotak garis untuk kedua gugus data tersebut. Apakah mengandung

data ekstrim?

d. Berdasarkan diagram kotak garis yang Anda buat, apakah ada indikasi bahwa konsumsi

minyak tanah di daerah perkotaan lebih besar daripada di daerah pedesaan? Jelaskan!

Page 28: 73485202-Metode-Statistika.pdf

25

4 KONSEP DASAR PELUANG

4.1 Pendahuluan

Statistika adalah ilmu pengetahuan tentang pengumpulan dan analisis data dengan tujuan

untuk menarik kesimpulan/inferensia mengenai populasi. Bila data telah terkumpul, kita dapat

menggunakan inferensia statistika untuk memilih di antara berbagai model alternatif yang

tersedia. Proses penarikan inferensia ini sangat bergantung pada teori peluang.

Bila statistika pada hakekatnya merupakan suatu penalaran induktif (yaitu dari hal

khusus/sampel yang diketahui ke hal umum/populasi yang tidak diketahui), maka teori peluang

bekerja dalam arah sebaliknya, yaitu bersifat deduktif (dari hal umum/populasi yang diketahui

ke hal khusus/sampel yang tidak diketahui).

Deduksi menjawab pertanyaan-pertanyaan seperti: Bila populasinya diketahui, bagaimana sifat-

sifat sampel yang akan ditarik dari populasi tersebut? Apakah sampelnya akan dapat mewakili

populasi? Hanya bila masalah-masalah deduktif ini teratasi, maka kita dapat membalik

argumentasi dan mengajukan pertanyaan: Seberapa tepatkah kita dapat mendeskripsikan suatu

populasi yang tidak diketahui berdasarkan data sampel yang teramati?

Teori peluang memberi kerangka dan model-model bagi statistika. Model pada hakekatnya

adalah suatu mekanisme acak dan teori peluang mempelajari model ini untuk mengetahui

konsekuensinya. Model-model ini didasar kepada asumsi tertentu. Statistika memilih satu atau

lebih model untuk menganalisis data/sampel yang diambil dari populasi dengan cara tertentu

(acak). Bila model sesuai terhadap data, maka model dapat digunakan untuk menganalisis data.

Bila model tidak sesuai, maka harus dicari model lain yang sesuai.

4.2 Ruang Contoh dan Kejadian

Untuk mempelajari peluang, kita membutuhkan konsep percobaan acak. Percobaan diartikan

sebagai suatu tindakan yang dapat diulang-ulang di bawah kondisi tertentu. Bila percobaan

yang diulang-ulang itu selalu memberi hasil (outcome) yang sama, percobaan dikatakan

deterministik, bila tidak demikian maka percobaan dikatakan acak atau stokastik. Dalam

kerangka ini, teori peluang digunakan untuk meramal atau memprediksi hasil suatu percobaan

acak.

Perhatikan sebuah percobaan acak sederhana berupa pelemparan sebuah dadu bersisi enam

yang seimbang. Hasil yang mungkin diperoleh dari percobaan ini ialah munculnya sisi 1, 2, 3, 4,

5, atau 6. Percobaan ini termasuk acak karena kita tidak bisa memastikan sisi apa yang akan

Page 29: 73485202-Metode-Statistika.pdf

26

muncul. Dengan menggunakan konsep himpunan, suatu himpunan/gugus yang memuat semua

hasil yang berbeda, yang mungkin terjadi dari suatu percobaan dinamakan ruang sampel

(sample space). Sedangkan unsur-unsur dari suatu ruang sampel disebut titik sampel.

Ruang sampel dapat dipandang sebagai himpunan semesta bagi permasalahan yang dihadapi.

Ruang sampel dilambangkan dengan S. Dengan demikian, ruang sampel dari percobaan di atas

ialah S={1, 2, 3, 4, 5, 6}.

Ruang kejadian adalah himpunan bagian (anak gugus) dari ruang sampel, yang memiliki

karakteristik tertentu. Ada dua jenis kejadian, yaitu kejadian dasar dan kejadian majemuk.

Kejadian dasar hanya terdiri dari satu unsur, sedangkan kejadian majemuk minimal terdiri dari

satu unsur. Dengan demikian, suatu kejadian dasar juga merupakan kejadian majemuk. Suatu

kejadian dinotasikan dengan huruf kapital (A, B, ..., dan seterusnya).

Sebagai contoh, kejadian terambilnya kartu hati dari seperangkat (52 helai) kartu bridge dapat

dinyatakan sebagai A = {hati} yang merupakan himpunan bagian dari ruang contoh S={hati,

sekop, klaver, wajik}. Jadi A adalah kejadian sederhana. Kejadian B yaitu terambilnya kartu

merh merupakan kejadian majemuk, karena B = {hati wajik} = {hati, wajik}. Perhatikan

bahwa gabungan atau paduan beberapa kejadian sederhana menghasilkan kejadian majemuk

yang tetap menjadi himpunan bagian ruang contohnya.

Suatu kejadian mungkin saja berbentuk himpunan bagian yang meliputi seluruh ruang contoh S.

demikian juga sebaliknya, suatu kejadian dapat berbentuk himpunan bagian dari S yang tidak

mengandung satu pun anggota yang disebut dengan ruang nol atau himpunan kosong dan

biasanya dilambangkan dengan . Sebagai contoh, bila A menyatakan kejadian menemukan

suatu organisme mikroskopis dengan mata telanjang dalam suatu percobaan biologi maka A =

.

4.3 Operasi Kejadian

Suatu keuntungan dari penggunaan notasi himpunan bagi kejadian adalah kita dapat melakukan

operasi himpunan terhadap kejadian. Beberapa operasi himpunan yang dapat dilakukan untuk

kejadian:

Komplemen suatu kejadian A terhadap S adalah himpunan semua unsur S yang tidak

termasuk A, biasanya dinotasikan dengan lambang Ac.

Page 30: 73485202-Metode-Statistika.pdf

27

Contoh 4.1

Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}

Jika A = {1,3,5}, maka Ac = {2,4,6}

Irisan dua kejadian A dan B adalah kejadian yang unsurnya termasuk dalam A dan B,

dinotasikan dengan lambang A B.

Contoh:

Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}

Jika A = {1,2,3} dan B = {2,4,6}, maka A B = {2}

Gabungan dua kejadian A dan B adalah kejadian yang mengandung semua unsur yang

termasuk A atau B atau keduanya, yang dinotasikan dengan lambang A B.

Contoh 4.2

Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}

Jika A = {1,2,3} dan B = {2,4,6}, maka A B ={1,2,3,4,6}.

Kejadian A dan B dikatakan saling terpisah (mutually exclusive) bila A dan B tidak memiliki

unsur persekutuan (bila A B =)

Contoh 4.3

Ruang contoh melempar sebuah dadu : S={1,2,3,4,5,6}

Jika A = {1,3,5} dan B = {2,4,6}, maka A dan B saling terpisah, karena A B =.

Kejadian A dan B dikatakan saling bebas bila A dan B tidak saling mempengaruhi.

Contoh 4.4

Pada pelemparan dua uang logam, kejadian munculnya sisi muka dari uang logam

pertama dan uang logam kedua saling bebas

4.4 Cara Menghitung Ukuran Ruang Contoh

Dalam menghitung peluang suatu kejadian, kita tidak perlu mendaftar unsur-unsur dari suatu

kejadian dan ruang sampelnya, tetapi cukup dengan menghitung banyaknya titik sampel suatu

kejadian dan ruang sampel tersebut.

Berdasarkan banyaknya unsur suatu ruang sampel, ruang sampel dapat dibedakan menjadi dua

jenis yaitu ruang sampel diskret dan ruang sampel kontinu. Suatu ruang sampel dikatakan

diskret jika banyaknya unsur dari ruang sampel tersebut berhingga atau tidak berhingga

Page 31: 73485202-Metode-Statistika.pdf

28

terhitung (countable). Sedangkan ruang sampel dikatakan kontinu jika ruang sampel memuat

semua bilangan dalam suatu interval tertentu.

Jika ruang contoh suatu percobaan terdiri atas kejadian dasar yang diskret terhingga, ada tiga

kaidah dasar cara menghitung banyaknya ukuran ruang contoh, yaitu:

1. pengisian tempat yang tersedia

ada dua kaidah yang dapat digunakan untuk pengisian tempat yang tersedia, yaitu kaidah

penggandaan dan kaidah penjumlahan. Pada kaidah penggandaan, misalnya n1 adalah

banyaknya cara mengisi tempat pertama, n2 adalah banyaknya cara mengisi tempat kedua

setelah tempat pertama terisi dan nk adalah banyaknya cara mengisi tempat ke-k setelah

(k-1) tempat-tempat sebelumnya terisi, maka banyaknya cara mengisi k tempat yang

tersedia adalah:

n1.n2. ... .nk

Contoh 4.5

Pada sebuah dealer motor tersedia 4 merk sepeda motor. Masing-masing merk

menyediakan 3 jenis kapasitas silinder. Masing-masing sepeda motor dikeluarkan dengan 2

macam warna. Jika seorang pengojek hendak membeli sepeda motor baru, berapa macam

pilihan yang dapat dilakukan olehnya?

Pikiran pengojek sewaktu memilih merk bercabang empat, sewaktu memilih kapasitas

silinder bercabang tiga dan sewaktu memilih warna bercabang dua. Jadi, pilihannya ada

4 x 3 x 2 = 24 macam

Kaidah penjumlahan digunakan jika dalam mengisi tempat kedua setelah tempat pertama

terisi tidak dapat dilakukan menggunakan benda-benda yang digunakan sebagai pilihan

untuk mengisi tempat pertama. Jadi, misalnya n1 adalah banyaknya cara mengisi tempat

pertama, n2 adalah banyaknya cara mengisi tempat kedua dan nk adalah banyaknya cara

mengisi tempat ke-k, maka banyaknya cara mengisi k tempat yang tersedia adalah:

n1 + n2 + ... + nk

Contoh 4.6

Dari Jakarta kita dapat pergi ke Bogor menggunakan kendaraan bermotor melalui (1)

Parung, (2) jalan lama Cibinong, atau (3) jalan tol Jagorawi. Dari Bogor kita dapat ke

Bandung melalui (1) Sukabumi atau (2) Cianjur. Dari Jakarta kita juga dapat ke Bandung

melalui (1) jalan tol Cikampek atau (2) jalan lama Bekasi lewat Purwakarta. Hanya ada satu

jalan raya dari Purwakarta menuju Bandung. Ada berapa pilihan untuk pergi ke Bandung

dari Jakarta?

Page 32: 73485202-Metode-Statistika.pdf

29

Jika melalui Bogor ada 3x2 pilihan dan jika melalui Purwakarta ada 2x1 pilihan. Jadi,

banyaknya pilihan ada 3x2 + 2x1 = 8 macam

2. permutasi

Pemilihan benda-benda dari suatu gugus benda-benda S = {e1, e2, …, en} dapat dilakukan

dengan permutasi. Permutasi merupakan kejadian dimana susunan objek yang terpilih

diperhatikan. Misalkan memilih orang untuk membentuk kepengurusan suatu organisasi,

dimana jika Si A terpilih menempati posisi ketua berbeda maknanya dengan Si A terpilih

menempati posisi wakil ketua.

Banyaknya permutasi n benda yang berlainan adalah n!

Contoh 4.8

Banyaknya permutasi yang berbeda yang dapat disusun dari huruf-huruf dalam kata “LATIH”

adalah 5! = 120

Banyaknya permutasi n benda berlainan jika diambil r benda sekaligus (r<n) adalah:

)!(

!

rn

nPrn

Contoh 4.9

Dari 5 orang kandidat akan dibentuk susunan pengurus (Ketua, Wakil, Bendahara)

N(S) = P53 = 5!/(5-3)! = 60

Banyaknya permutasi n benda berlainan yang disusun melingkar adalah (n – 1)!

Contoh 4.10

Dalam suatu ruangan diskusi dengan bentuk meja melingkar, akan berlangsung diskusi yang

akan diikuti 6 peserta. Banyaknya cara keenam orang tersebut duduk pada 6 kursi yang

disusun melingkar adalah (6 – 1)! = 5! = 120 cara.

Banyaknya permutasi yang berlainan dari n benda jika n1 diantaranya berjenis pertama, n2

berjenis kedua, …, nk berjenis ke k adalah:

!!!

!

21 knnn

n

Page 33: 73485202-Metode-Statistika.pdf

30

Contoh 4.11

Banyaknya permutasi yang berbeda yang dapat disusun dari huruf-huruf dalam kata “CACAH”

adalah 5!/(2!2!1!) = 30

Banyaknya cara menyekat suatu himpunan n benda dalam r sel, masing-masing berisi n1 unsur

dalam sel pertama, n2 dalam sel kedua, …, adalah:

,!!!

!

,,, 2121 rr nnn

n

nnn

n

dengan n1+n2+…+nr = n

Contoh 4.12

Ada suatu kelas yang terdiri atas 12 orang. Banyaknya cara untuk membagi kelas tersebut

dalam tiga kelompok yang terdiri atas 5, 4, dan 3 orang adalah 12!/(5!4!3!)=27720

cara

3. kombinasi

Selain permutasi, Pemilihan benda-benda dari suatu gugus benda-benda S = {e1, e2,

…, en} juga dapat dilakukan dengan cara kombinasi . Kombinasi merupakan kejadian dimana

susunan objek yang terpilih tidak diperhatikan. Misalkan memilih sejumlah orang untuk

menempati suatu sejumlah kursi tempat duduk, dimana susunan tempat duduk tidak menjadi

perhatian. Kombinasi tingkat r dari n unsur/objek dapat dirumuskan sebagai berikut:

!!0...)1()(

!0...)2()1(

!)!(

!

xrxxrnxrn

xxnxnnx

rrn

nC n

r

Contoh 4.13

Dari 5 orang akan dibentuk tim cepat tepat yang beranggotakan 3 orang.

N(S) = C53 = 5!/(5-3)!3! = 10

4.5 Peluang Suatu Kejadian

Ada tiga pendekatan yang dapat dilakukan untuk menentukan peluang suatu kejadian.

Pendekatan tersebut adalah:

1. secara intuitif kita mungkin merasa, atau didukung oleh percobaan, bahwa dari k hasil

percobaan mempunyai kemungkinan sama untuk muncul;

Page 34: 73485202-Metode-Statistika.pdf

31

2. peluang suatu kejadian dapat dihitung berdasarkan kepada frekuensi relatif yang

teramati dari serangkaian percobaan;

3. peluang suatu kejadian ditentukan secara subyektif berdasarkan pandangan pribadi.

Jika A adalah suatu kejadian sembarang, terdapat tiga aksioma peluang:

1. 0 P(A) 1

2. P(S) = 1

3. P(Ai Aj) = P(Ai) + P(Aj), asalkan Ai Aj =

Berdasarkan aksioma (3), misalnya, kita dapat menentukan peluang suatu kejadian sebagai

jumlah peluang masing-masing titik sampel yang menjadi anggota kejadian tersebut.

Beberapa sifat peluang:

1. untuk sembarang dua kejadian A dan B yang merupakan himpunan bagian S, maka

peluang paduan dua kejadian tersebut adalah:

P(AB)= P(A) + P(B) – P(AB)

2. untuk sembarang dua kejadian A dan B yang merupakan himpunan bagian S berlaku:

P(B) = P(BA) + P(BAc)

3. untuk setiap kejadian A berlaku:

P(A) = 1 - P(Ac)

4. Jika A dan B saling bebas, maka P(AB) = P(A) + P(B)

5. Jika A1, A2, ..., An saling bebas, maka

P(A1A2...An)= P(A1) + P(A2) + ... + P(An)

4.6 Peluang Bersyarat

Seringkali di dalam penerapan kita tertarik pada peluang yang terkait dengan sebagian dari

populasi (ruang sampel). Di sini kita berkepentingan dengan kendala tambahan yang

dikenakan oleh sebagian dari populasi yang mungkin saja tidak berlaku bagi populasi

keseluruhan. Peluang yang terkait dengan subpopulasi ini dinamakan peluang bersyarat

(conditional probability).

Contoh 4.14

Jika sebuah dadu seimbang digulirkan, maka ruang contohnya adalah S={1, 2, 3, 4, 5, 6}.

Jika A adalah kejadian munculnya dadu yang bersisi genap, maka P(A)=P{2, 4, 6} = ½. Bila

ada informasi tambahan bahwa sisi yang muncul lebih besar dari 3, maka ruang sampelnya

adalah S*={4, 5, 6}, sehingga peluang memperoleh sisi genap dengan adanya informasi ini

adalah P(A)=P{4, 6} = 2/3.

Page 35: 73485202-Metode-Statistika.pdf

32

Dari teladan di atas terlihat bahwa informasi tambahan berakibat ruang contohnya

menyempit dari S={1, 2, 3, 4, 5, 6} menjadi S*={4, 5, 6}, dan pada gilirannya akan

mengubah nilai peluang.

Permasalahan peluang seperti tersebut di atas disebut peluang bersyarat. Jika A dan B dua

kejadian, peluang bersyarat bagi A setelah B dilambangkan oleh P (A|B) didefinisikan

sebagai

)(

)()|(

BP

BAPBAP

, asalkan P(B) 0

Dari definisi di atas, kita memperoleh kaidah penggandaan berikut, yang penting untuk

menentukan peluang irisan dua atau lebih kejadian.

P(AB) = P(A)P(B|A)

P(ABC) = P(A)P(B|A)P(C|(AB))

Contoh 4.15

Dalam sebuah kotak berisi 2 bola merah dan 3 bola biru. Jika diambil dua buah bola tanpa

pemulihan. Tentukanlah:

a. peluang kedua bola yang terambil berwarna merah!

b. Peluang terambilnya bola merah pada pengambilan pertama dan biru pada

pengambilan kedua!

Jawab

Karena bola hanya dibedakan menurut warna, maka sebagai ruang sampelnya adalah:

S={M1M2, M1B2, B1M2, B1B2}, dengan M1M2 artinya terambilnya bola merah pada pengambilan

pertama dan merah pada pengambilan kedua.

Dengan demikian,

a. P(M1M2) = P(M1)P(M2|M1) =(2/5)(1/4) = 2/20

b. P(M1B2) = P(M1)P(B2|M1) =(2/5)(3/4) = 6/20

Penerapan penting dari peluang bersyarat adalah pada masalah kebebasan antar dua kejadian.

Di dalam bahasa sehari-hari, dua kejadian dikatakan bebas bila kejadian yang satu tidak ada

kaitannya dengan kejadian yang lain. Namun, secara tepat dalam pengertian statistik,

pengertian kebebasan antar dua kejadian adalah:

1. dua kejadian A dan B dikatakan bebas (stokastik) bila P(A|B) = P(A)

2. berdasarkan kaidah penggandaan untuk irisan dua atau lebih kejadian, dua kejadian A

dan B dikatakan bebas bila P(AB) = P(A)P(B)

Page 36: 73485202-Metode-Statistika.pdf

33

4.7 Kaidah Bayes

Penerapan menarik lainnnya dari peluang bersyarat adalah apa yang disebut peluang pasterior;

hal ini diberikan oleh Kaidah Bayes. Pada teladan di atas, dengan mudah kita dapat menjawab

pertanyaan berapa peluang terambilnya bola biru pada ambilan kedua, bila pada ambilan

pertama terambil bola merah?

Karena pada ambilan pertama diperoleh merah, maka di dalam kotak masih ada 1 merah dan 3

biru, sehingga peluang terambilnya bola biru pada ambilan kedua bila pada ambilan pertama

terambil bola merah adalah ¾. Sekarang pertanyaannya dibalik. Bila pada ambilan kedua

terambil bola biru, berapa peluang pada ambilan pertama terambil bola merah, P(M1|B2)?

Menurut rumus peluang bersyarat,

)(

)()|(

2

2121

BP

BMPBMP

Akan tetapi,

P(M1B2) = P(M1)P(B2|M1)

Dan

P(B2) = P(M1B2) + P(B1B2)

= P(M1)P(B2|M1) + P(B1)P(B2|B1)

Sehingga

2

1

)4/2)(5/3()4/3)(5/2(

)4/3)(5/2(

)|()()|()(

)|()()|(

121121

12121

BBPBPMBPMP

MBPMPBMP

Perhatikan bahwa informasi terjadinya B2 telah mengubah peluang awal dari P(M1)=2/5 menjadi

P(M1|B2)=1/2.

Contoh di atas mengilustrasikan teorema berikut yang dikenal sebagai Kaidah Bayes:

Bila kejadian-kejadian B1, B2, ..., Bk merupakan sekatan dari ruang sampel S dengan P(Bi) 0

untuk i = 1, 2, ..., k, maka untuk sembarang kejadian A yang bersifat P(A) 0,

kjBAPBPBAPBPBAPBP

BAPBPABP

kk

jj

j ,,2,1;)|()()|()()|()(

)|()()|(

2211

Page 37: 73485202-Metode-Statistika.pdf

34

4.8 Latihan Soal

1. Suatu kesebelasan sepak bola memiliki:

a. kaus oblong biru, kuning, merah dan hijau

b. celana pendek putih dan hitam

c. kaus kaki putih, hitam dan hijau

Berapa macam kombinasi warna seragam kesebelasan yang dapat disusun?

2. Ada berapa banyak cara 6 orang dapat didudukkan pada sebuah sofa jika yang tersedia

hanya 4 tempat duduk?

3. Ada berapa banyak cara 7 buku dapat disusun pada rak jika:

a. sembarang susunan dimungkinkan

b. 3 buku tertentu harus selalu berdiri berdampingan

c. 2 buku tertentu harus menempati ujung-ujung?

4. Dari 4 apel merah, 5 hijau, dan 6 kuning, berapa banyak kemungkinan pilihan yang terdiri

atas 9 apel bila setiap warna harus diambil 3?

5. Agen penjual komputer ECS Pentium IV mempunyai stock barang sebanyak 5 buah, dua

diantaranya dalam kondisi rusak. Seorang mahasiswa membeli tiga buah komputer,

hitunglah:

a. Berapa banyaknya kemungkinan komputer yang terpilih

b. Berapa banyak kemungkinan dua komputer yang terpilih dalam keadaan rusak

c. Berapa banyak kemungkinan ketiganya dalam kondisi baik?

6. Dari 5 buah bilangan yaitu 1,2,3,4,5 diambil 3 bilangan secara serentak.

a. Berapakah banyak kemungkinan bilangan yang terpilih ketiganya ganjil

b. Berapakah banyak kemungkinan bilangan yang terpilih dua genap dan satu ganjil

c. Jika ketiga bilangan terpilih disusun menjadi sebuah bilangan, ada berapa kemungkinan

bahwa bilangan tersebut bernilai ganjil.

7. Dari 5 orang sarjana ekonomi dan 7 orang sarjana tehnik akan dibentuk suatu tim yang

terdiri atas 2 sarjana ekonomi dan 3 sarjana tehnik. Ada berapa banyak tim itu dapat

dibentuk jika:

a. Setiap sarjana ekonomi dan tehnik boleh ikut dalam tim.

b. Seorang sarjana tehnik tertentu harus masuk tim

c. Dua orang sarjana ekonomi tidak boleh ikut dalam tim itu.

8. Dua kartu diambil secara acak (satu-satu) dari sekumpulan 52 kartu Bridge yang dikocok

dengna baik. Tentukan probabilitas untuk memperoleh 2 kartu as jika :

a. pengambilan kartu pertama dikembalikan

Page 38: 73485202-Metode-Statistika.pdf

35

b. pengambilan kartu kedua tidak dikembalikan

9. Satu kantong berisi 5 bola putih dan 3 bola merah. Satu kantong yang lain lagi berisi 4 bola

4 bola putih dan 5 bola merah. Jika dari setiap kantong diambil sebuah bola, tentukan

peluang kejadian terambilnya :

a. dua bola itu putih

b. keduanya merah

c. satu putih dan satu merah

10. Dalam suatu penelitian menunjukkan bahwa setiap 100 produk yang dihasilkan suatu pabrik

pada siang hari (S) 2 diantaranya cacat (C), dan setiap 100 produk yang dihasilkan pada

malam hari (M) 5 diantaranya cacat. Selama 24 jam kerja, 100 produk dihasilkan pada siang

hari, dan 60 produk dihasilkan pada malam hari. Dengan rumus bayes, hitunglah peluang

bahwa suatu produk cacat yang dipilih secara acak dari 160 ptoduk yang dihasilkan selama

24 jam :

a. diproduksi pada malam hari

b. diproduksi pada siang hari

11. Sejumlah kelereng berwarna dimasukkan ke dalam tiga kotak yang tidak dapat dibedakan

sebagai berikut :

Warna Kotak 2 Kotak 1 Kotak 3

Merah 2 4 3

Putih 3 1 4

Biru 5 3 3

Sebuah kotak diambil secara acak dan kemudian dari kotak yang terpilih tersebut diambil

secara acak sebuah kelereng

a. hitung peluang terambilnya kelereng putih

b. bila diketahui kelerengnya putih, berapa peluang bahwa kelereng itu berasal dari kotak

2

Page 39: 73485202-Metode-Statistika.pdf

36

5 KONSEP DASAR PEUBAH ACAK

5.1 Pengertian Peubah Acak

Istilah percobaan atau percobaan statistik telah digunakan untuk menjelaskan

sembarang proses yang menghasilkan satu atau lebih ukuran bagi factor kebetulan. Sering kali

kita tidak tertarik pada keterangan rinci setiap titik contoh, namun hanya pada suatu

keterangan numeric hasil percobaan. Misalnya, ruang contoh yang rinci bagi percobaan

pelemparan uang logam sebanyak tiga kali dapat dituliskan sebagai :

S = {GGG, GGA, GAG, AGG, GAA, AGA, AAG, AAA}.

Bila kita hanya tertarik pada berapa kali sisi gambar muncul, maka nilai numeric 0, 1, 2, atau

3, dapat diberikan pada setiap titik contoh.

Bilangan-bilangan 0, 1, 2, dan 3 merupakan besaran acak yang nilainya ditentukan oleh

hasil percobaan. Nilai-nilai itu dapat dipandang sebagai nilai-nilai yang dapat diambil oleh

suatu peubah acak atau variable acak X tertentu, yang dalam hal ini menyatakan berapa kali

sisi gambar muncul bila sekeping uang logam dilempar tiga kali.

Dari uraian di atas dapat disimpulkan bahwa peubah acak adalah suatu fungsi yang

nilainya berupa bilangan nyata yang ditentukan oleh setiap unsur dalam ruang contoh. Kita

dapat menggunakan huruf kapital, misalnya X, untuk melambangkan suatu peubah acak, dan

huruf kecil, dalam hal ini x, untuk menyatakan salah satu di antara nilai-nilainya.

Dari ilustrasi pelemparan uang logam di atas, kita lihat bahwa peubah acak X bernilai 2

untuk semua unsure dalam himpunan bagian

E = {GGA, GAG, AGG}

ruang contoh S. Jadi setiap kemungkinan nilai X menyatakan kejadian yang merupakan

himpunan bagian ruang contoh S bagi percobaannya.

Ada 2 macam ruang contoh :

1. Ruang Contoh Diskret

Bila suatu ruang contoh mengandung jumlah titik contoh yang terhingga banyaknya.

2. Ruang Contoh Kontinu

Bila suatu ruang contoh mengandung jumlah titik contoh yang tak terhingga banyaknya

Sehingga peubah acak pun ada 2, yaitu peubah acak diskret (peubah acak yang didefinisikan di

atas ruang contoh dikret) dan peubah acak kontinu (peubah acak yang didefinisikan di atas

ruang contoh kontinu.

Dalam prakteknya peubah acak kontinu digunakan untuk data yang diukur. Misalnya

tinggi, bobot, suhu, jarak, atau umur. Sedangkan peubah acak diskret digunakan untuk data

yang berupa hitungan atau cacahan. Contohnya banyaknya produk yang cacat, banyaknya

kecelakaan pertahun di suatu kota dan banyaknya kelereng merah yang diambil pada suatu

percobaan .

Page 40: 73485202-Metode-Statistika.pdf

37

Contoh 5.1

Pada pelemparan tiga uang logam, bila X menyatakan banyaknya muncul sisi angka, tentukan :

a. nilai-nilai peubah acak X

b. Sebaran peluang X

Penyelesaian :

Pelemparan tiga uang logam mempunyai ruang contoh :

S={(AAA), (AAG),(AGA),(GAA),(GGA),(GAG),(AGG),(GGG)}

a. Karena X menyatakan banyaknya muncul sisi angka, pada S, maka nilai-nilai dari X adalah :

X={0, 1, 2, 3}

X=0, artinya tidak ada sisi angka yang muncul

X=1, artinya ada satu sisi angka yang muncul

X=2, artinya ada dua sisi angka yang muncul

X=3, artinya ketiganya muncul sisi angka

b. Peluang dari nilai-nilai X adalah :

P(X=0)=P(GGG)=1/8

P(X=1)=P(GGA)+P(GAG)+P(AGG)=1/8+1/8+1/8=3/8

P(X=2)=P(AAG)+P(AGA)+P(GAA)=1/8+1/8+1/8=3/8

P(X=3)=P(AAA)=1/8

Sehingga sebaran peluang X adalah :

X=x 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

5.2 Sebaran Peluang Diskret

Yaitu sebuah table atau rumus yang mencamtumkan semua kemungkinan nilai suatu

peubah acak diskret beserta peluangnya. Pada peubah acak diskret, setiap nilainya dikaitkan

dengan peluang tertentu. Misalnya pelemparan uang logam sebanyak 3 kali. Peubah acak X

menyatakan banyaknya sisi gambar yang muncul. Dengan mengasumsikan peluang yang sama

untuk setiap kejadian sederhana, maka semua kemungkinan nilai X berikut peluangnya adalah

x 0 1 2 3

P(X=x) 1/8 3/8 3/8 1/8

Perhatikan bahwa nilai-nilai X mencakup semua kemungkinan sehingga total peluangnya sama

dengan 1

Seringkali, suatu peluang peubah acak dinyatakan dalam sebuah rumus, yang

merupakan fungsi nilai-nilai x. Biasanya dilambangkan dengan f(x), g(x), r(x) dan sebagainya.

Page 41: 73485202-Metode-Statistika.pdf

38

Himpunan semua pasangan berurutan (x,f(x)) disebut fungsi peluang atau sebaran peluang bagi

peubah acak X.

Sifat-sifat peubah acak diskret :

a. f(x)=P(X=x)

b. f(x) 0

c. x

xf 1)(

5.3 Sebaran Peluang Kontinu

Untuk memahami pengertian sebaran peluang kontinu, perhatikan ilustrasi berikut:

Suatu peubah acak menyatakan tinggi badan semua orang yang berusia di atas 21 tahun. Antara

2 nilai sembarang, misalnya 163.5 dan 164.5, terdapat tak terhingga banyaknya tinggi badan.

Dan sangat sulit sekali untuk mencari tinggi badan yang tepat 164 cm.Tetapi tidak demikian,

bila kita membicarakan peluang terambilnya seseorang yang tingginya antara 163 sampai 165.

Dalam hal ini kita berhadapan dengan sebuah selang nilai peubah acak, dan bukan tepat satu

nilai peubah acak.

Sehingga sebaran peluang peubah acak kontinu tidak dapat disajikan dalam bentuk

tabel, tetapi sebaran ini dapat disajikan dalam bentuk rumus. Rumus ini merupakan fungsi

nilai-nilai peubah acak kontinu X, sehingga dapat digambarkan sebagai kurva kontinu. Fungsi

peluang yang digambarkan dengan kurva disebut fungsi kepekatan peluang atau fungsi

kepekatan. Kebanyakan fungsi kepekatan dalam analisis satistika bersifat kontinu untuk semua

nilai X, dan luas daerah menyatakan besarnya peluang.Karena nilai peluang positif, maka fungsi

kepekatan seluruhnya terletak di atas sumbu x. Fungsi kepekatan peluang dibuat sedemikian

rupa sehingga luas daerah di bawah kurva dan di atas sumbu x sama dengan 1.Sehingga dapat

disimpulkan bahwa Fungsi Kepekatan Peluang peubah acak kontinu X adalah fungsi peluang

yang digambarkan dengan sebuah kurva, dengan luas daerah di bawah kurva dan di atas sumbu

x sama dengan 1, dan bila luas daerah di bawah kurva antara x=a dan x=b, menyatakan

peluang X terletak antara a dan b, P(a<X<b).

Sifat-sifat peubah acak kontinu :

a. P(a<X<b)= b

a

dxxf )(

b. f(x) 0

c. 1)(

dxxf

Page 42: 73485202-Metode-Statistika.pdf

39

5.4 Nilai Harapan Peubah Acak

Nilai harapan dari peubah acak adalah pemusatan dari nilai peubah acak jika percobaannya

dilakukan secara berulang-ulang sampai tak berhingga kali.

Secara matematis nilai harapan dapat dirumuskan sebagai berikut:

kontinup.aXjika,)(

diskretp.aXjika),(

)(1

dxxfx

xpx

X

ii

n

iix

Ε

Contoh 5.2

Jika diketahui distribusi peluang dari peubah acak X sebagai berikut:

Nilai peubah Acak XX 0 1 2 3 4 5

P(X=xI) 1/6 1/6 1/6 1/6 1/6 1/6Xip(xi) 0 1/6 2/6 3/6 4/6 5/6

Dengan demikian nilai harapan p.a X adalah:

E(X) = 0 + 1/6 + 2/6 + 3/6 + 4/6 + 5/6 = 15/6

E(3X) = 3 E(X) = 45/6

Contoh 5.3

Ruang contoh untuk percobaan dua buah uang logam adalah

S = {GG, GA, AG, AA}

Karena keempat titik contoh berpeluang sama untuk terjadi, peluang-peluang tersebut dapat

dipandang sebagai frekuensi relatif bagi kejadian-kejadian itu dalam jangka panjang. Sehingga

jika seseorang melemparkan dua uang logam yang setimbang berulang-ulang kali, maka rata-

rata ia akan memperoleh 1 sisi gambar perlemparan adalah 1, yang didapat dari

= E(Y) = 0.1/4 + 1.1/2 + 2.1/4 = 1

Misalkan X adalah suatu peubah acak diskret dengan sebaran peluang

X X1 X2 ……. Xn

P(X=x) F(x1) F(x2) ……. F(xn)

Page 43: 73485202-Metode-Statistika.pdf

40

Maka nilai tengah atau nilai harapan peubah acak g(X) adalah

n

iiixg xfxgXgE

1)( )()())((

5.5 Ragam Peubah Acak

Ragam dari peubah acak X didefinisikan sebagai berikut:

V(X) = E(X-E(X))2

= E(X2) – [E(X)]2

Contoh 5.4

Untuk contoh sebelumnya, ragam dari peubah acak X adalah:

V(X) = (0+1/6+4/6+9/6+16/6+25/6) - (15/6)2

= 55/6 - 225/36 = 105/36

5.6 Sifat Nilai harapan Dan Ragam

a. Bila a dan b konstanta, maka

baba xbaX

b. Nilai harapan jumlah atau selisih dua atau lebih peubah acak sama dengan jumlah atau

selisih nilai harapan masing-masing peubah.

YXYX dan YXYX

c. Nilai harapan hasilkali dua atau lebih peubah acak yang bebas satu sama lain sama

dengan hasilkali nilai harapan masing-masing peubah acak. Jadi jika X dan Y bebas,

maka

YXXY

d. Bila X suatu peubah acak dan b konstanta, maka

222 XbX

e. Bila X peubah acak dan a adalah konstanta, maka

22222 aa XaX

f. Ragam jumlah atau selisih dua atau lebih peubah acak yang bebas sama dengan jumlah

ragam masing-masing peubah acak. Jadi bila X dan Y bebas, maka

222YXYX dan

222YXYX

Page 44: 73485202-Metode-Statistika.pdf

41

5.7 Latihan Soal

1. Dalam suatu gudang terdapat 7 pesawat televisi. Dua diantaranya rusak. Sebuah hotel

membeli secara acak 3 dari ketujuh televisi tersebut. Bila X menyatakan banyaknya

televisi yang rusak yang terbeli oleh hotel tersebut, tentukanlah :

a. Peluang semua tv yang terbeli tidak ada yang rusak.

b. Peluang ada satu tv yang rusak

c. Tentukanlah nilai X

d. Carilah fungsi sebaran peluang X

e. Hitunglah nilai tengah dan ragam X.

2. Suatu peubah acak diskret X mempunyai sebaran peluang

3,2,1,03

)(3

43

41

xuntuk

xxf

xx

Tentukan nilai tengah X

3. Tentukan nilai harapan banyaknya kaset jazz, bila 4 kaset diambil secara acak dari

sebuah koleksi yang terdiri dari 5 kaset jazz, 2 kaset klasik dan 3 kaset polka.

4. Misalkan sebuah peubah acak X memiliki sebaran peluang sebagai berikut

X 0 1 2 3

P(X=x) 8/27 4/9 2/9 1/27

Tentukan nilaitengah X

5. Dengan menanamkan modalnya dalam suatu stock tertentu, seseorang dapat menerima

keuntungan $4000 setahun dengan peluang 0.3 atau kerugian $1000 setahun dengan

peluang 0.7. Tentukan nilai harapan penerimaan orang ini dari stock tersebut.

6. Misalkan X menyatakan hasil bila sebuah dadu setimbang dilemparkan. Tentukan

43)(, 2)( XXgbilaXg

7. Untuk soal nomor 4, hitunglah2

)( )12()(, XXgbilaXg

8. Dari soal nomor 4, tentukan simpangan baku X.

9. Peubah acak X yang menyatakan banyaknya potongan coklat dalam sebuah kue

mempunyai sebaran peluang sebagai berikut :

X 2 3 4 5 6

P(X=x) 0.01 0.25 0.4 0.3 0.04

Hitunglah ragam X

Page 45: 73485202-Metode-Statistika.pdf

42

6 SEBARAN PELUANG TEORITIS

Secara garis besar, sebaran peluang teoritis dapat dibedakan atas sebaran diskret dan

sebaran kontinu. Sebaran diskret adalah fungsi peluang dari peubah-peubah acak diskret,

seperti Bernoulli, Binomial, Hipergeometrik, Poisson, dan lain-lain. Sedangkan sebaran kontinu

adalah fungsi peluang peubah-peubah acak kontinu, antar lain Seragam , Normal, dan lain-lain.

Berikut ini akan diuraikan beberapa jenis sebaran peluang diskret dan sebaran peluang

kontinu.

6.1 Sebaran Binom

Peubah X yang menyatakan banyaknya kesuksesan dalam n ulangan suatu percobaan

binom disebut peubah acak binom, dan sebaran peluang bagi peubah acak binom disebut

sebaran binom.

Ciri-ciri percobaan binom :

a. percobaannya terdiri atas n ulangan

b. dalam setiap ulangan, hasil percobaannya hanya ada 2, yaitu sukses atau gagal

c. peluang sukses, dilambangkan dengan p, dan untuk setiap ulangan besarnya peluang

sama, tidak berubah-ubah

d. ulangan-ulangan tersebut bersifat bebas satu sama lain

Bila suatu ulangan binom mempunyai peluang sukses p dan peluang gagal q = 1-p, maka sebaran

peluang bagi peubah acak binom X, yaitu banyaknya kesuksesan dalam n ulangan yang bebas,

adalah

,),;( xnx qpx

npnxb

untuk x = 0, 1, 2,…….,n

Nilai sebaran di atas diperoleh dari uraian berikut ini :

1. pandang peluang sukses x dan gagal n-x dalam suatu urutan tertentu. Karena ulangan

semuanya bebas, maka peluang tiap hasil yang berbeda dapat digandakan. Tiap sukses

terjadi dengan peluang p dan gagal dengan peluang q=1 – p. jadi peluang untuk urutan

tersebut adalah pxqn-x.

2. tentukan banyaknya semua titik contoh dalam percobaan tersebut yang menghasilkan x

yang sukses dan n-x yang gagal. Banyaknya ini sama dengan banyaknya cara memisahkan n

hasil menjadi dua kelompok sehingga x hasil berada pada kelompok pertama dan sisanya,

n-x hasil, pada kelompok kedua. Banyaknya x hasil yang sukses dapat dinyatakan dengan

x

n .

Page 46: 73485202-Metode-Statistika.pdf

43

3. karena pembagian kelompok pada (2) saling terpisah, maka peluang x sukses diperoleh dari

hasil penggandaan

x

n dengan pxqn-x.

Nilai tengah dan ragam bagi sebaran binom b(x;n,p) adalah npqdannp 2

Sebaran Binomial Kumulatif

Ada kalanya perhitungan peluang sebaran binomial lebih mudah dilakukan dengan memakai

sebaran kumulatif. Bila pada n percobaan terdapat paling tidak sebanyak r sukses, maka

sebaran binomial kumulatif yang ditulis P(Xr), dengan r<n, adalah:

n

rx

pnxb

pnnbpnrbpnrbrXP

),,(

),,(),,1(),,()(

Untuk memperoleh nilai peluang binomial kumulatif dapat menggunakan tabel sebaran

binomial.

Contoh 6.1

Dari hasil kajian akademik diperoleh bahwa peluang dosen hadir dalam kegiatan belajar

mengajar sebesar 90%. Jika proses belajar mengajar per semester dilakukan sebanyak 14 kali,

hitunglah :

a. peluang dosen hadir dalam kegiatan belajar mengajar sebanyak 10 kali !

b. peluang dosen hanya tidak hadir satu kali !

c. peluang dosen hanya tidak hadir pada pertemuan ke 14 !

d. peluang dosen hanya hadir pada pertemuan pertama !

Penyelesaian :

X = banyaknya dosen mengajar dalam satu semester

p = 0.9, n = 14

,),;( xnxqpx

npnxb

sehingga ,1.09.0

14)9.0,14;( 14 xx

xxb

x=0, 1, 2, …, 14

a. P(X=10)= 035.049.3)1001(1.09.0!)1014(!10

!141.09.0

10

14 5410101410

Atau dengan melihat tabel binom :

P(X=10) = P(X10) – P(X9)

=

9

0

10

0

)9.0,14;()9.0,14;(xx

xbxb = 0.0441- 0.0092 = 0.0349

Page 47: 73485202-Metode-Statistika.pdf

44

b. Jika dosen tidak hadir sekali, maka ada 14 kemungkinan dosen tersebut tidak hadir dari 14

pertemuan. Dengan demikian peluangnya :

356.0)254.0)(1.0(149.01.01

14 1141

c. Karena sudah ditentukan bahwa dosen tidak hadir pada pertemuan ke 14, maka peluangnya

:

0254.0)254.0)(1.0(9.01.01141

d. Karena sudah ditentukan bahwa dosen hanya hadir pada pertemuan pertama, maka

peluangnya :

09)1)(9.0(1.09.0 14131141

Contoh 6.2

Seorang penjual mengatakan bahwa 25% dari seluruh dagangannya rusak akibat truk yang

membawa barang itu mengalami kecelakaan. Jika seseorang membeli barang dagangan itu

sebanyak 10 buah, tentukan :

a. peluang orang itu akan mendapat 5 barang yang rusak

b. peluang orang tersebut memperoleh minimal 3 tetapi kurang dari 7 barang yang rusak

c. rata-rata dan simpangan baku barang yang rusak

penyelesaian

Misalkan X = banyaknya barang yang rusak

p = 0.25, n = 10

a. P(X =5) =P(X5) – P(X4) = 0.9803 – 0.9219 = 0.0584

b. P(3X<7)=P(3X6) = P(X6) – P(X2) =0.9991-0.6778 = 0.3213

c. µ = n.p = 10x0.25 = 25, = n.p.(1-p) = 10x0.25x0.75 = 1.875

6.2 Sebaran Hipergeometrik

Ciri-ciri percobaan hipergeometrik :

a. suatu contoh acak berukuran n diambil dari populasi yang berukuran N

b. k dari N benda diklasifikasikan sebagai sukses dan N-k benda diklasifikasikan sebagai

gagal

Banyaknya kesuksesan X dalam suatu percobaan hipergeometrik disebut peubah acak

hipergeometrik,dan sebaran peluang bagi peubah acak hipergeometrik disebut sebaran

hipergeometrik.

Page 48: 73485202-Metode-Statistika.pdf

45

Bila dalam populasi N benda, k benda diantaranya diberi label sukses dan N-k benda

lainnya diberi label gagal maka sebaran peluang bagi peubah acak hipergeometrik X, yang

menyatakan banyaknya kesuksesan dalam contoh acak berukuran n, adalah

,),,;(

n

N

xn

kN

x

k

knNxh untuk x = 0,1,2,…..,k

Nilaitengah dan ragam bagi sebaran hipergeometrik h(x;N,n,k) adalah

N

k

N

kn

N

nNdan

N

nk1..

12

Contoh 6.3

Dalam suatu kantong terdapat 10 bola merah dan 5 bola putih. Bila diambil 3 bola secara acak,

tentukan peluang untuk memperoleh 0, 1, 2, dan 3 bola merah!

Penyelesaian :

Misalkan :

N1 : banyaknya bola merah =10

N2 : banyaknya bola putih=5

N : banyaknya bola = N1 + N2 = 10+5=15

n : banyaknya sampel yang diambil

X : banyaknya bola merah yang diperoleh

Kombinasi bola merah yang diperoleh adalah

k

10

Kombinasi bola putih yang diperoleh adalah

k3

5

Kombinasi semua sampel yang diperoleh adalah

3

15

Maka peluang untuk memperoleh banyaknya bola merah X=k dalam sampel tersebut adalah :

,

3

15

3

510

)(

kk

kXP k=0, 1, 2, 3

Dengan demikian :

Page 49: 73485202-Metode-Statistika.pdf

46

455

10

3

15

3

5

0

10

)0(

XP ,455

100

3

15

2

5

1

10

)1(

XP

455

225

3

15

1

5

2

10

)2(

XP ,455

120

3

15

0

5

3

10

)3(

XP

Perhatikan bahwa P(X=0)+ P(X=1)+ P(X=2)+ P(X=3)=1

6.3 Sebaran Poisson

Percobaan yang menghasilkan nilai-nilai bagi suatu peubah acak X, yaitu banyaknya

hasil percobaan yang terjadi selama suatu selang waktu tertentu atau di suatu daerah tertentu

disebut percobaan poisson. Bilangan X yang menyatakan banyaknya hasil percobaan dalam

suatu percobaan poisson disebut peubah acak poisson, dan sebaran peluangnya disebut sebaran

poisson.

Sebaran peluang bagi peubah acak poisson X, yang menyatakan banyaknya hasil

percobaan yang terjadi selama suatu selang waktu atau daerah tertentu adalah

,!

);(x

exp

x

untuk x = 1, 2, …..

sedangkan dalam hal ini adalah rata-rata hasil percobaan yang terjadi selama selang waktu

atau dalam daerah yang dinyatakan, dan e = 2.71828….

Sebaran poisson cocok digunakan untuk n besar dan p kecil sekali, sedangkan binom cocok

untuk n kecil dan p besar.

npdannp 2

Contoh 6.4

Bila variabel acak X mempunyai sebaran binom denagn n=100, p=0.005, hitunglah P(X=15)!

Jawab :

f(x)=P(X=x)= xx

x

100995.0005.0

100, x= 0, 1, 2, ……, 100

maka :

f(15)=P(X=15)= 8515995.0005.0

15

100

Page 50: 73485202-Metode-Statistika.pdf

47

Peluang ini sulit dihitung karena n=100 adalah besar dan p=0.005 adalah kecil. Oleh karena itu

kita pakai pendekatan sebaran poisson, yaitu :

np =100(0.005)=0.5

,!

);(x

exp

x

!

5.0)(

5.0

x

exXp

x

, x= 0, 1, 2, ……, 100

Maka

00000.0

!15

5.0)15(

155.0

e

Xp

6.4 Sebaran Seragam

Sebaran peluang seragam adalah suatu bentuk sebaran peluang dimana untuk setiap titik

pengamatan pada suatu selang nilai tertentu mempunyai peluang yang sama.

Sebaran peluang seragam untuk data diskrit dapat dituliskan sebagai berikut:

P(X=x) = 1/n : x = 1, 2, ..., n

sedangkan sebaran peluang seragam untuk data kontinu dituliskan sebagai berikut:

ab

1)(

xf ; a x b

Nilai harapan peubah acak X adalah:

b

a

b

a

b

a

abab

abx

abdx

abxdxxxfXE )(

2

1

)(

)(

2

1

2

1

)(

1

)(

1)()(

22

Ragam peubah acak X adalah:

2

2

2

23

2

2

2

222

)(12

1)(

2

1)(

3

1)(

2

1

)(3

1)(

)(2

1

)(

1)(

2

1)()()()(

ababababa

b

ab

xXV

abdxab

xabdxxfxXEXEXVb

a

b

a

Page 51: 73485202-Metode-Statistika.pdf

48

6.5 Sebaran Normal

Suatu peubah acak kontinu X yang memiliki sebaran berbentuk genta disebut peubah acak

normal. Bila X adalah suatu peubah acak normal dengan nilaitengah dan ragam2 , maka

persamaan kurva normalnya adalah

2

2

1

2

1),;(

x

exn , untuk - < x <

sedangkan dalam hal ini = 3.14159…. dan e = 2.71828….

Bila nilai-nilai dan diketahui, maka kurva normal itu telah tertentu dengan pasti.

Misalkan bila = 50 dan =5, maka ordinal-ordinat n(x;50,5) dengan mudah dapat dihitung

untuk berbagai nilai x, dan kemudian kurvanya dapat digambar.

Sifat-sifat kurva normal :

a. Modusnya hanya satu dan terletak di x =

b. Kurvanya simetris/setangkup terhadap garis tegak x =

c. Grafik selalu berada di atas sumbu x atau f(x)>0

d. Kurvanya mendekati sumbu x secara asimtotik dalam dua arah, jika semakin menjauhi

nilaitengahnya

e. Luas daerah di bawah kurva dan di atas sumbu x sama dengan 1

Kurva sembarang sebaran peluang kontinu atau fungsi kepekatan dibuat sedemikian

rupa sehingga luas daerah di bawah kurva yang dibatasi oleh x = x1 dan x = x2 sama dengan

peluang bahwa peubah acak X mengambil nilai antara x = x1 dan x = x2. Untuk menghitung nilai

peluang sebaran normal, dari kalkulus integral sangatlah rumit. Sehingga untuk menghindari hal

itu digunakan table kenormalan atau table normal baku, yaitu dengan mentransformasikan

setiap pengamatan dari peubah acak normal X menjadi suatu nilai peubah acak normal Z

dengan nilaitengah nol dan ragam satu. Transformasi normal baku atau transformasi Z yang

dimaksud adalah

XZ

Nilaitengah Z adalah nol, karena

0)(1

)(1

)(

XEZE

sedangkan ragamnya adalah

Page 52: 73485202-Metode-Statistika.pdf

49

11

2

22

2

222

XXXZ

Sehingga sebaran normal baku adalah sebaran peubah acak normal dengan nilaitengah nol dan

simpangan baku 1.

Bila X berada di antara x = x1 dan x = x2 maka peubah acak Z akan berada di antara

nilai-nilai padanannya.

1

1

XZ , dan

2

2

XZ

Karena semua nilai X yang jatuh antara x1 dan x2 mempunyai nilai z padanannya antara z1 dan

z2, maka luas daerah di bawah kurva X sama dengan luas daerah di bawah kurva Z. Dengan

demikian

P(x1<X<x2) = P(z1<Z<z2)

b

a

xb

a

dxedxxfbxaP

2

2

1

2

1)()(

2

1

22

1

2

1

212

1)()(

z

z

zz

z

dzedzzfzZzP

Contoh 6.5

Untuk sebaran normal dengan = 50 dan = 10, hitunglah peluang bahawa X mengambil

sebuah nilai antara 45 dan 62.

Jawab :

Diketahui

x1 = 45 dan x2 = 62

= 50 dan = 10

Ditanyakan P(45<X<62) = …….?

Nilai X harus ditransformasi ke nilai Z, yaitu

1

1

XZ dan

2

2

XZ

5.010

50451

Z dan 2.1

10

50622

Z

Dengan demikian

P(45<X<62) = P(-0.5<Z<1.2)

= P(Z<1.2) – P(Z<-0.5)

= 0.8849 - 0.3085

= 0.5764

Page 53: 73485202-Metode-Statistika.pdf

50

Contoh 6.6

Untuk sebaran normal dengan = 300 dan = 50, hitunglah peluang peubah acak X mengambil

nilai yang lebih besar dari 362.

Jawab :

Diketahui

= 300 dan = 50

Ditanyakan P(X>362) = …..?

XZ

50

300362 Z = 1.24

P(X>362) = P(Z>1.24)

= 1 – P(Z<1.24)

= 1 – 0.8925

= 0.1075

Contoh 6.7

Suatu penelitian yang dilakukan oleh seorang mahasiswa menyebutkan bahwa secara rata-rata

seorang pengunjung mengeluarkan uang belanja di suatu pusat perbelanjaan adalah Rp

247.000,00 dengan simpangan baku Rp 84.600,00. Jika diasumsikan sebaran normal, berapakah

:

a. peluang orang itu mengeluarkan uang belanja paling sedikit Rp 300.000,00

b. peluang orang itu mengeluarkan uang belanja antara Rp 200.000,00 sampai Rp 400.000,00

c. jika diasumsikan banyaknya pengunjung mencapai 200 orang setiap hari, berapa banyaknya

orang yang diperkirakan mengeluarkan uangnya untuk berbelanja sebanyak-banyaknya Rp

150.000,00

penyelesaian

Misalkan X = besarnya pengeluaran uang belanjaan setiap pengunjung suatu pusat perbelanjaan

dalam ribuan rupiah.

6,84,247 , n = 200

a. P(X300) = ….?

Nilai X harus ditransformasi ke nilai Z, yaitu

xz 63.0

6,84

247300

z

dengan demikian

P(X300) = P(Z0.63) = 1 – P(Z<0.63) = 1 – 0.7357 = 0.2643

b. P(200X400) = ….?

Page 54: 73485202-Metode-Statistika.pdf

51

1

1

xz 56.0

6,84

2472001

z

2

2

xz 81,1

6,84

2474002

z

P(200X400) = P(-0,56 Z 1,81) = P(Z1,81) – P(Z-0,56) = 0.9649 – 0.2877 = 0.6722

c. misalkan m =banyaknya pengunjung yang mengeluarkan uang paling banyak Rp 150.000,00

m = nP(X150)P(X150) = P(Z-1,15) = 0.1251Jadi m = 200(0.1251) = 25 orang

Contoh 6.7

Nilai ujian statistika sebagian besar mahasiswa mempunyai sebaran normal dengan rata-rata

=34 dan simpangan baku =4. Jika X menyatakan nilai-nilai mahasiswa tersebut, berapakah

batas nilai Xo agar 10% dari kelompok nilai terendah berada di bawah Xo ?

Penyelesaian :

Diketahui = 34 dan = 4

XZ

4

34

XZ

P(XXo)=0.1 1.04

34

4

34

XoXP P(ZZo) = 0.1

Dari tabel sebaran normal kumulatif diperoleh Zo=-1.282

Maka

Xo=34+(-1.282)4=28.87

Jadi batas atas nilai untuk 10% kelompok mahasiswa yang mendapat nilai terendah adalah

28.87

6.6 Latihan Soal

1. Peluang seseorang sembuh dari suatu penyakit darah adalah 0.4. Bila 15 orang

diketahui menderita penyakit ini, berapa peluang bahwa

a. sekurang-kurangnya 10 orang dapat sembuh

b. ada 3 sampai 8 orang yang sembuh

c. 5 orang yang sembuh

2. Pupuk urea yang ditawarkan kepada petani ada dua jenis yaitu urea tablet dan urea

biasa. Dari hasil survey diketahui 3/5 petani menggunakan pupuk urea tablet dan 2/5

petani menggunakan pupuk urea biasa. Jika empat petani dikunjungi ke lapangan,

hitunglah :

Page 55: 73485202-Metode-Statistika.pdf

52

a. peluang tidak ada petani yang menggunakan pupuk urea tablet.

b. peluang tiga petani menggunakan pupuk urea tablet.

c. paling banyak dua petani menggunakan urea tablet.

3. Menurut teori genetika, suatu persilangan kelinci percobaan akan menghasilkan

keturunan warna merah, hitam, dan putih dalam perbandingan 8:4:4. Hitunglah

peluang bahwa diantara 8 keturunan ada 5 yang berwarna merah, 2 hitam, dan 1 putih.

4. Bila 5 kartu diambil secara acak dari seperangkat kartu brigde, berapa peluang

diperoleh 3 kartu hati

5. Putri hendak menanami halaman depan dan samping rumahnya dengan tanaman bunga.

Dari sebuah kotak yang berisi 3 umbi tulip, 4 umbi daffodil, dan 3 umbi hyacinth, ia

mengambil 5 umbi secara acak untuk ditanam di halaman depan dan 5 umbi sisanya di

halaman samping. Berapa peluang ketika musim bunga tiba di halaman depan

berbunga tulip, 2 daffodil dan 2 hyacinth

6. Misalkan bahwa secara rata-rata 1 orang di antara 1000 orang adalah pecandu alcohol.

Hitung peluang bahawa dalam suatu contoh acak 8000 orang terdapat kurang dari 7

pecandu alcohol.

7. Sebuah restoran menyediakan salad yang rata-rata mengandung 5 macam sayuran.

Hitunglah peluang bahwa salad yang disediakan mengandung lebih dari 5 macam

sayuran

a. pada suatu hari tertentu

b. pada 3 diantara 4 hari berikutnya

c. pertama kali dalam bulan April pada tanggal 5 April

8. Misalkan secara rata-rata 1 di antara 1000 orang membuat kesalahan angka dalam

melaporkan pajak pendapatannya. Bila 10000 formulir diambil secara acak dan

diperiksa, berapa peluang ada 6, 7, atau 8 formulir yang mengandung kesalahan

9. Pada ujian statistika, nilai rata-ratanya adalah 74 dan simpangan bakunya 7. Bila 12%

diantara peserta ujian akan diberi nilai A, dan nilai itu mengikuti sebaran normal,

berapakah batas terendah bagi A dan batas nilai tertinggi bagi nilai B

10. Rata-rata tinggi anjing pudel jenis tertentu adalah 30 cm, dan simpangan bakunya 4.1

cm. Berapa persentase banyaknya anjing pudel jenis tersebut yang tingginya lebih dari

35 cm, bila tinggi menyebar normal dan dapat diukur sampai ketelitian berapapun.

11. untuk soal nomor 9, hitunglah

a. nilai tertinggi D, bila 10% nilai terendah mendapat nilai E

b. nilai tertinggi B bila 5% mahasiswa mendapat nilai A

Page 56: 73485202-Metode-Statistika.pdf

53

c. nilai terendah B bila 10% mendapat nilai B, dan 25% mendapat nilai C

12. Di suatu daerah diketahui 10% penduduknya tergolong kaya. Suatu sampel acak terdiri

dari 400 penduduk telah diambil. Tentukan peluang :

a. paling banyak 30 orang yang tergolong kaya

b. antara 30 sampai 50 orang yang tergolong kaya

c. 55 orang atau lebih yang tergolong kaya

13. Krisis moneter menyebabkan tingkat penjualan rumah mengalami penurunan. Dari

seluruh developer di Kota tertentu diketahui tingkat penjualan rata-rata 1 milyar

dengan simpangan baku 0.2 milyar. Jika diasumsikan tingkat penjualan menyebar

normal :

a. hitunglah peluang sebuah developer mempunyai tingkat penjualan minimal 1.2

milyar

b. Jika di daerah tersebut terdapat 50 developer, estimasikan jumlah developer

yang mempunyai tingkat penjualan 0.5 sampai 1 milyar.

Page 57: 73485202-Metode-Statistika.pdf

54

7 SEBARAN PERCONTOHAN

7.1 Contoh Acak

Hasil suatu percobaan statistika dapat dicatat dalam bentuk numerik ataupun huruf.

Bila sepasang dadu dilantumkan dan jumlah mata dadu yang terjadi merupakan hal yang ingin

diselidiki, sehingga hasilnya dicatat dalam bentuk numerik.

Suatu POPULASI terdiri atas keseluruhan pengamatan yang menjadi pusat perhatian.

Banyaknya pengamatan dalam populasi dinamakan UKURAN populasi. Tiap pengamatan dalam

populasi merupakan satu nilai dari suatu peubah acak (X) dengan suatu sebaran peluang f(x).

Oleh karena itu, sering kita mendengar tentang istilah populasi binomial, populasi normal,

atau secara umum disebut sebagai populasi f(x). Istilah tersebut sebenarnya mengacu pada

harga peubah acak X yang memiliki sebaran binomial, normal atau sebaran peluang f(x).

Hal pokok yang menjadi pusat perhatian seorang statistikawan adalah menarik

kesimpulan tentang parameter populasi yang tidak diketahui. Pada populasi normal, misalnya,

parameter µ dan 2 mungkin tidak diketahui dan hendaknya ditaksir berdasarkan keterangan

yang diperoleh dari contoh yang mewakili suatu populasi. Contoh yang mewakili suatu populasi

disebut contoh acak, apabila setiap anggota populasi mempunyai peluang yang sama untuk

dipilih sebagai contoh. Dengan demikian dasar teori pengambilan contoh perlu dipelajari

dengan baik.

Misalkanlah x1, x2, x3, ...., xn merupakan n peubah acak bebas yang masing-masing memiliki

sebaran peluang f(x). Gugus x1, x2, x3, ..., xn didefinisikan sebagai contoh acak berukuran n

dari populasi f(x) dan sebaran peluang gabungannya ditulis sebagai:

f(x1,x2,x3,...,xn) = f(x1)f(x2)f(x3)...f(xn).

7.2 Teori Pengambilan Contoh

Tujuan utama menarik contoh adalah untuk mendapatkan keterangan mengenai

parameter populasi yang tidak diketahui. Misalkan kita ingin menarik kesimpulan mengenai

proporsi penduduk Indonesia yang menyukai kopi robusta. Sangatlah tidak efesien jika kita

menanyai seluruh penduduk Indonesia dan kemudian menghitung parameter yang

menggambarkan proporsi sebenarnya. Tetapi sebagai pendekatannya akan diambil contoh acak

yang cukup besar dan kemudian dihitung proporsi yang menyukai kopi robusta. Nilai ini

kemudian dipakai untuk menarik kesimpulan mengenai proporsi sesungguhnya.

Suatu nilai yang dihitung dari contoh disebut statistik. Karena banyak contoh acak yang

mungkin diambil dari suatu populasi yang sama maka statistik yang diperoleh akan berlainan

dari contoh ke contoh. Karena itu, statistik merupakan peubah acak yang hanya tergantung

pada contoh acak yang diamati.

Page 58: 73485202-Metode-Statistika.pdf

55

7.3 Sebaran Contoh dari Rataan (Mean)

Sebaran contoh yang penting untuk dibahas adalah rataan ( x ). Misalkan contoh acak

berukuran n pengamatan diambil dari populasi normal dengan rataan µ dan simpangan baku

(). Tiap pengamatan xi, i=1,2,...,n adalah contoh acak yang memiliki sebaran normal yang

sama dengan populasi yang menjadi pusat pengambilan contoh.

Rataan contoh mengikuti sebaran normal dengan rataan dan ragam adalah sebagai

berikut:

nx

xE

x /)var(

)(22

Teorema Limit Pusat:

Jika contoh acak diambil dari populasi sembarang dengan rataan µ dan simpangan baku

, maka sebaran dari rataan ( x ) dapat dihampiri normal jika n cukup besar, dengan

rataan µ dan galat baku / n. Dengan kata lain,

)1,0(~/

Nn

xZ

Pertanyaan yang sering muncul akibat teorema di atas adalah seberapa banyak n yang

harus diambil dan berapa batasan n yang dapat dikatakan cukup besar ? Untuk menjawab

pertanyaan ini tentunya diperlukan hampiran n yang cukup baik. Berdasarkan pengalaman

diketahui bahwa jika n>30 maka sudah cukup digunakan sebagai pendekatan teorema limit

pusat.

Untuk data pengamatan yang mengikuti sebaran Binomial juga dapat dihampiri dengan

sebaran normal dan tidak bertentangan dengan teorema limit pusat. Untuk memahami

permasalahan ini, kita kembalikan lagi pada sebaran Bernoulli:

xi=1, jika percobaan sukses

xi=0, jika percobaan gagal

Peubah acak x1, x2, ..., xn adalah saling bebas, dan setiap pengamatan memiliki sebaran

peluang sebagai berikut:

x 0 1----------------------------------

f(x) (1-p) pdengan rata-rata p dan ragam p(1-p).

Akibat dari teorema limit pusat maka sebaran contoh dari rataan adalah mendekati

normal dengan rataan p dan ragam p(1-p)/n jika n besar. Dengan demikian proporsi contoh

dari kejadian sukses dalam percobaan Bernoulli mengikuti sebaran;

Page 59: 73485202-Metode-Statistika.pdf

56

)1,0(~/)1(

Nnpp

ppZ

7.4 Sebaran contoh dari (n-1)S2/ 2

Bila contoh acak berukuran n diambil dari populasi normal dengan rataan µ dan

simpangan baku , maka diperoleh suatu nilai statistik S yang merupakan simpangan baku

contoh. Sebaran contoh S2 hanya sedikit kegunaannya dalam praktek, oleh karena itu akan

dibahas sebaran dari peubah acak (n-1)S2/ 2. Dengan menjumlahkan semua kuadrat dari

pengamatan dikurangi rataan contoh mudah terlihat bahwa:

212

2

21

2

1

2

~)1(

~)(

ndb

ndb

n

ii

Sn

xx

dengan demikian diperoleh bahwa (n-1)S2/

2menyebar khi-kuadrat dengan derajat bebas n-1.

Teorema berikut tidak ditunjukkan dengan bukti yang lengkap.

Teorema :

Bila S2 ragam contoh acak berukuran n diambil dari populasi normal dengan ragam 2,

maka peubah acak,

2 = (n-1)S2/ 2

menyebar khi-kuadrat dengan derajat bebas n-1.

7.5 Sebaran t-student

Dalam prakteknya jarang sekali orang begitu beruntung mengetahui ragam populasi

yang digunakan sebagai acuan dalam pengambilan contoh acak. Untuk contoh acak berukuran

n 30, taksiran 2 yang baik adalah statistik S2. Apa yang terjadi dengan ( x -µ)/( / n)

bila diganti dengan S ?

Selama S2 merupakan taksiran yang baik bagi 2 dan tidak berubah dari contoh ke

contoh dan untuk n 30 maka nilai tersebut masih baik dihampiri dengan normal baku Z.

Tetapi bila ukuran contoh kecil (n<30), nilai S berubah cukup besar dari contoh ke contoh dan

nilai tersebut tidak lagi menyebar normal baku. Dalam hal ini kita menghadapi sebaran

statistik yang akan disebut dengan t-student.

ns

xt

/

dimana nilai ini adalah peubah acak yang menyebar t-student dengan derajat bebas n-1.

Page 60: 73485202-Metode-Statistika.pdf

57

7.6 Sebaran F

Salah satu sebaran yang terpenting dalam statistika terapan adalah sebaran F. Statistik

F didefinisikan sebagai nisbah dua peubah acak khi-kuadrat yang saling bebas, masing-masing

dibagi dengan derajat bebasnya. Misal peubah acak U dan V menyebar khi-kuadrat dengan

derajat bebas v1 dan v2 dimana U>V maka sebaran F dapat ditulis sebagai berikut:

F = (U/v1) / (V/v2),

Teorema :

Bila S12 dan S2

2 adalah ragam contoh acak berukuran n1 dan n2 yang diambil dari

populasi normal masing-masing dengan 12 dan 2

2, bila S12 S2

2 maka,

menyebar F dengan derajat bebas v1=n1-1 dan v2=n2-1

7.7 Sebaran Contoh Bagi Beda Dua Nilaitengah

Bila contoh-contoh bebas berukuran n1 dan n2 diambil dari dua populasi yang besar

atau takhingga, masing-masing dengan nilaitengah 1 dan 2 ragam21 dan

22 , maka beda

kedua nialitengah contoh, 21 XX , akan menyebar menghampiri sebaran normal dengan

nilaitengah dan simpangan baku

danXX 21

21

2

22

1

21

21 nnXX

Dengan demikian

)/()/(

)()(

2221

21

2121

nn

xxz

merupakan nilai normal baku Z

Bila dua peubah acak X dan Y bebas dan masing-masing menyebar normal dengan

nilaitengah x dan y dan ragam2x dan

2y maka beda X-Y menyebar normal dengan

nilaitengah yxYX dan ragam222YXYX .

2/}/)1{(

1/}/)1{(

222

22

122

11

vSn

vSnF

Page 61: 73485202-Metode-Statistika.pdf

58

7.8 Latihan Soal

1. Sejenis tambang dibuat dengan kekuatan regangan rata-rata 70 kg dan simpangan

baku 5 kg. Dengan mengasumsikan populasinya takhingga, bagaimana galat baku

nilatengahcontoh itu berubah bila ukuran contohnya

a. dinaikkan dari 64 menjadi 196

b. diturunkan dari 784 menjadi 49

2. Tinggi 1000 mahasiswa menghampiri sebaran normal dengan nilaitengah 160 cm dan

simpangan baku 5 cm. Bila 200 contoh acak masing-masing berukuran 25 ditarik dari

populasi ini, dan nilai tengah contohnya diukur sampai satuan sentimeter terdekat,

tentukan :

a. nilaitengah dan simpangan baku sebaran penarikan contoh bagi X

b. banyaknya nilaitengah contoh yang jatuh antara 158 dan 162 cm

c. banyaknya nilaitengah contoh yang jatuh di bawah 158 cm

3. Hitunglah :

a. 14025.0 vbilat

b. 7995.0 vbilat

c. P(T<2.365) bila v = 7

d. P(-1.356<T<2.179) bila v = 12

e. P(T>-2.567) bila v = 17

f. P( )01.0005.0 tTt

g. P( )( 025.0tT

4. Diberikan sebuah contoh acak berukuran 24 yang ditarik dari suatu populasi normal,

tentukan k bila

a. P(-2.069<T<k) = 0.965

b. P(k<T<2.807) = 0.095

c. P(-k<T<k) = 0.9

5. Sebuah perusahaan menyatakan bahwa rokok yang diproduksinya mempunyai

kandungan nikotin rata-rata sebesra 1.83 mg perbatang. Bila diambil contoh acak 8

batang rokok jenis tersebut, dengan kandungan nikotin 2.0, 1.7, 2.1, 1.9, 2.2, 2.1, 2.0,

dan 1.6 mg, apakah Anda setuju dengan pernyataan perusahaan tersebut ?

Page 62: 73485202-Metode-Statistika.pdf

59

8 PENDUGAAN PARAMETER

8.1 Penduga Paramater

Dalam Statistika dikenal adanya istilah parameter dan statistik. Parameter adalah nilai

penciri dari suatu data populasi, diantaranya nilai tengah populasi (), ragam populasi (2),

proporsi populasi (P) dan lain-lain. Sedangkan statistik adalah nilai penciri dari suatu data

contoh, diantaranya nilai tengah contoh ( x ), ragam populasi (s2), proporsi populasi (p) dan

lain-lain.

Untuk memperoleh gambaran yang baik mengenai populasi, maka statistik yang

dipakai untuk menduga parameter haruslah merupakan penduga yang baik, yaitu penduga

yang mempunyai tiga ciri :

a. merupakan penduga tak bias dari , yaitu E( ) = , artinya harapan penduga , sama

dengan .

b. merupakan penduga yang efisien, artinya bila ada lebih dari satu penduga, maka penduga

yang efisien adalah penduga yang mempunyai variansi paling kecil

c. merupakan penduga yang konsisten, artinya bila sampel yang diambil makin besar, maka

nilai akan semakin mendekati nilai .

Sebuah nilai bagi suatu statistik disebut suatu nilai dugaan bagi parameter

populasi . Misalnya nilai x bagi statistik X , yang dihitung dari suatu contoh berukuran n,

merupakan nilai dugaan bagi parameter populasi . Begitu pulan

xp ˆ merupakan suatu nilai

dugaan bagi proporsi sebenarnya p dalam suatu percobaan binom.

Ada dua jenis penduga parameter yaitu:

a. Penduga titik

Bila nilai parameter dari populasi hanya diduga dengan memakai satu nilai statistik

dari sampel yang diambil dari populasi tersebut, maka statistik disebut pendugaan

titik.

Contoh :

a. x merupakan penduga titik bagi parameter populasi .

b.2S merupakan penduga titik bagi

2

c.n

xp ˆ merupakan penduga titik bagi proporsi sebenarnya p

Page 63: 73485202-Metode-Statistika.pdf

60

b. Pendugaan selang

Suatu dugaan selang bagi parameter populasi adalah suatu selang yang berbentuk

21ˆˆ , dengan 21

ˆˆ dan bergantung pada nilai statistik untuk suatu contoh

tertentu dan juga pada sebaran penarikan contoh bagi .

Bila P( 21ˆˆ ) = 1 - , untuk 0<<1, maka kita mempunyai peluang 1- untuk

memperoleh suatu contoh acak yang menghasilkan suatu selang yang mengandung . Selang

21ˆˆ , yang dihitung dari contoh yang terpilih, disebut selang kepercayaan (1-

)100%, nilai 1-, disebut koefisien kepercayaan atau derajat kepercayaan , dan kedua

titik ujungnya, 21ˆˆ dan , masing-masing disebut batas kepercayaan sebelah atas dan

sebelah bawah.

8.2 Pendugaan Nilai tengah

Bila x adalah nilai tengah contoh acak berukuran n yang diambil dari suatu populasi

dengan ragam2 diketahui, maka selang kepercayaan (1-)100%, bagi adalah

nzx

nzx

2/2/ ,

sedangkan 2/z adalah nilai z yang luas daerah di sebelah kanan di bawah kurva normal baku

adalah /2.

Galat baku pendugaan , bila x digunakan untuk menduga , kita percaya (1-)100%,

bahwa galatnya tidak melebihin

z

2/ . Ukuran Contoh bagi pendugaan , bila x digunakan

untuk menduga , kita boleh percaya (1-)100%, bahwa galatnya tidak melebihi suatu niali

tertentu e bila ukuran contohnya diambil sebesar n =

2

2/

e

z

Bila x dan s adalah nilaitengah dan simpangan baku contoh acak berukuran n<30, yang

diambil dari suatu populasi berbentuk genta dengan ragam2 tidak diketahui, maka selang

kepercayaan (1-)100%, bagi adalah

n

stx

n

stx 2/2/ ,

sedangkan 2/t adalah nilai t dengan v = n – 1 derajat bebas yang di sebelah kanannya

terdapat daerah seluas /2.

Page 64: 73485202-Metode-Statistika.pdf

61

Contoh 8.1

Dari data contoh berukuran 15 diperoleh nilai tengah contoh dan ragam contoh sebagaiberikut:

x = 10.366s2 = 1.946

Penduga bagi parameter nilai tengah populasi adalah sebagai berikut:

.....15/395.1/

366.10

2

nss

x

x

Sedangkan penduga selang untuk nilai tengah populasi dengan tingkat kepercayaan 95 %adalah:

x – t(0.025;db=14) s/n x + t(0.025;db=14) s/n10.366 – 2.145 x 1.395/15 10.366 + 2.145x 1.395/1510.366 – 0.773 10.366 + 0.7739.593 11.139

8.3 Pendugaan Beda Dua Nilai Tengah Populasi

Bila 1x dan 2x masing-masing adalah nilaitengah contoh acak bebas berukuran n1 dan

n2 yang diambil dari populasi dengan ragam22

21 dan yang diketahui, maka selang

kepercayaan (1-)100%, bagi 21 adalah :

2

22

1

21

2/21 )(nn

zxx

< 21 <

2

22

1

21

2/21 )(nn

zxx

,

sedangkan dalam hal ini 2/z adalah nilai peubah normal baku z yang luas daerah di sebelah

kanannya sebesar /2.

Bila 1x dan 2x masing-masing adalah nilaitengah contoh acak bebas berukuran kecil n1

dan n2 yang diambil dari dua populasi yang hampir normal dengan ragam sama22

21 yang

tidak diketahui nilainya, maka selang kepercayaan (1-)100%, bagi 21 adalah :

21

2/21

11)(

nnstxx p < 21 <

21

2/21

11)(

nnstxx p ,

sedangkan dalam hal ini sp adalah nilai dugaan gabungan bagi simpangan baku populasi, dan

2/t adalah nilai t dengan v = n1+n2-2 derajat bebas yang luas daerah di sebelah kanannya

sebesar /2.

Page 65: 73485202-Metode-Statistika.pdf

62

2

)1()1(

21

222

2112

nn

snsns p

Contoh 8.2

Dua buah perusahaan yang saling bersaing dalam industri kertas karton saling mengklaim bahwa

produknya yang lebih baik, dalam artian lebih kuat menahan beban. Untuk mengetahui produk

mana yang sebenarnya lebih baik, dilakukan pengambilan data masing-masing sebanyak 10

lembar, dan diukur berapa beban yang mampu ditanggung tanpa merusak karton. Datanya

adalah :

Perusahaan A 30 35 50 45 60 25 45 45 50 40

Perusahaan B 50 60 55 40 65 60 65 65 50 55

a. Hitunglah rataan dan ragam dari kedua data perusahaan tersebut.

Jawab

66.94

10(9)

(565)-32525)(10

)1(5,56

10

556050

106.9410(9)

(425)-19025)(10

)1(5,42

10

403530

222

2222

222

1211

nn

xxnsx

nn

xxnsx

i

i

b. Buatlah selang kepercayaan 90% bagi selisih rataan perusahaan B dengan perusahaan A,

dengan mengasumsikan ragam kedua populasi sama.

Jawab

23,2177,6

)17,4(734,114)17,4(734,114

10/110/132,9)5,425,56(10/110/132,9)5,425,56(

)/1()/1()()/1()/1()(

12

12

)18;05,0(12)18;05,0(

12),2

(121212),2

(12

tt

nnstxxnnstxx pdbpdb

catatan : karena ragam sama, maka :

1) db = n1 + n2 – 2

2) ragam gabungan : 86.9418

)94,66(9)94,106(9

2

)1()1(

21

222

2112

nn

snsns p

Bila 1x dan21s , dan 2x dan

22s masing-masing adalah nilaitengah dan ragam contoh

acak bebas berukuran kecil n1 dan n2 yang diambil dari dua populasi yang mendekati normal

dengan ragam tidak sama22

21 yang tidak diketahui nilainya, maka selang kepercayaan (1-

)100%, bagi 21 adalah :

Page 66: 73485202-Metode-Statistika.pdf

63

2

22

1

21

2/21 )(n

s

n

stxx < 21 <

2

22

1

21

2/21 )(n

s

n

stxx ,

sedangkan dalam hal ini 2/t adalah nilai t dengan derajat bebas

)]1/()/[()]1/()/[(

)//(

22

2221

21

21

22

221

21

nnsnns

nsnsv

yang luas daerah di sebelah kanannya sebesar /2.

Contoh 8.3

Jika pada contoh 8.2 ingin diduga selang kepercayaan 90% bagi selisih rataan perusahaan B

dengan perusahaan A, dengan mengasumsikan ragam kedua populasi berbeda, maka dugaan

selangnya adalah:

26,2174,6

)17,4(74,114)17,4(74,114

10/94,10610/94,66)5,425,56(10/94,10610/94,66)5,425,56(

)/()/()()/()/()(

12

12

)17;05,0(12)17;05,0(

1212

22),

2(12121

212

22),

2(12

tt

nsnstxxnsnstxxdbdb

ingat : karena ragam tidak sama, maka :

1710,179/)10/8.18(9/)10/10.34(

)10/8.1810/10.34(

)1/()/()1/()/(

)//(2222

222

22

2221

21

21

22

221

21

nnsnns

nsnsdb

8.4 Pendugaan Proporsi

Bila p adalah proporsi keberhasilan dalam suatu contoh acak berukuran n, dan q =1-

p , maka selang kepercayaan (1-)100%, bagi parameter binom p adalah :

n

qpzp

ˆˆˆ

2/ <p<n

qpzp

ˆˆˆ

2/ ,

sedangkan dalam hal ini 2/z adalah nilai peubah normal baku z yang luas daerah di sebelah

kanannya sebesar /2.

Bila p digunakan sebagai nilai dugaan titik bagi p, maka kita dapat percaya (1-)100%,

bahwa galatnya tidak lebih besar darin

qpz

ˆˆ2/

Page 67: 73485202-Metode-Statistika.pdf

64

Bila p digunakan untuk menduga p, maka kita dapat percaya (1-)100%, bahwa

galatnya tidak melebihi suatu besaran tertentu e bila ukuran contohnya diambil sebesar

2

22/

ˆˆ

e

qpzn

Contoh 8.4

Suatu perusahaan mempunyai 1250 karyawan. Pihak manajemen ingin mengetahui besarnya

proporsi yang merasa kurang puas dengan jaminan sosial yang mereka terima. Untuk maksud itu

diambil sampel sebanyak 100 orang dan dari hasil wawancara ternyata ada 10 orang yang

menyatakan kurang puas dengan jaminan sosial yang diterimanya.

a. Bila manajer perusahaan itu dalam memperkirakan menggunakan interval kepercayaan

99%, maka dugalah interval proporsi karyawan di perusahaan tersebut yang kurang puas

dengan jaminan sosial yang mereka terima.

Jawab :

1,0100/10/ˆ nxp

18,002,0

)03,0(565,21,0)03,0(565,21,0

100/)9,0(1,01,0100/)9,0(1,01,0

/)ˆ1(ˆˆ/)ˆ1(ˆˆ

005,0005,0

22

p

p

zpz

nppzppnppzp

b. Berapa banyak sampel yang harus diambil agar kita bisa percaya 99% bahwa proporsi dalam

sampel paling jauh berjarak 0.03 dari proporsi populasinya.

182856,1827)03,0(4

565,2

4 2

2

2

22/

g

zn

8.5 Pendugaan Beda Dua Proporsi

Bila 1p dan 2p masing-masing adalah proporsi keberhasilan dalam suatu contoh acak

berukuran n1 dan n2, serta 1q =1- 1p dan 2q =1- 2p , maka selang kepercayaan (1-)100%, bagi

selisih antara dua parameter binom p1 dan p2 adalah :

2

22

1

112/21

ˆˆˆˆ)ˆˆ(

n

qp

n

qpzpp <p1-p2<

2

22

1

112/21

ˆˆˆˆ)ˆˆ(

n

qp

n

qpzpp

sedangkan dalam hal ini 2/z adalah nilai peubah normal baku z yang luas daerah di sebelah

kanannya sebesar /2.

Page 68: 73485202-Metode-Statistika.pdf

65

8.6 Latihan Soal

1. Jelaskan kriteria-kriteria penduga yang baik ?

2. Diketahui suatu populasi mahasiswa berukuran 500 orang. Dari populasi tersebut diambil

sampel acak sebanyak 100 orang, kemudian diukur berat badannya. Ternyata rata-rata

berat badan mahasiswa adalah 60 kg dengan simpangan baku 10 kg.

a. buatlah interval kepercayaan 90%

b. berapa interval kepercayaannya agar rata-rata populasi terletak antara 58<<62

c. berapa sampel yang diperlukan agar kita percaya 90% bahwa rata-rata sampel berjarak

paling banyak 5 kg dari rat-rata sebenarnya ?

3. Untuk menduga dinamika migrasi penduduk dalam penerapan otonomi daerah, sebuah

konsultan mensurvei daerah BOTABEK (Bogor, Tangerang, Bekasi) dan menemukan 12% dari

sampel acak sebanyak 2300 keluarga akan keluar dari BOTABEK ke daerah asal. Jika

perkiraan populasi keluarga di BOTABEK sebanyak 7.800.000 keluarga, bentuklah dugaan

interval kepercayaan 95% atas jumlah keluarga yang akan keluar dari BOTABEK ke daerah

asal

4. Pada tahap pemasaran perumahan baru, sebuah developer akan memperoleh imagenya

melalui perbaikan sarana umum yang ada di perumahan yang lama (seperti perbaikan jalan,

taman, dst). Dari sampel 50 yang diambil secara acak sebelum ada perbaikan sarana umu

diketahui ada 10 responden yang mempunyai image kurang baik terhadap developer

tersebut. Setelah dilakukan perbaikan sarana umum, ternyata masih terdapat 7 dari 48

responden yang mempunyai image kurang baik terhadap developer. Dengan tingkat

kepercayaan 95%, buatlah pendugaan proporsi untuk image developer sebelum dan setelah

perbaikan sarana umum. Dari pendugaan tersebut, apakah bisa dikatakan ada peningkatan

image bagi developer

5. Suatu perusahaan mempunyai 1250karyawan. Pihak manajemen ingin mengetahui besarnya

proporsi yang merasa kurang puas dengan jaminan social yang mereka terima. Untuk

maksud itu diambil sampel sebanyak 100 orang dan dari hasil wawancara ternyata ada 10

orang yang menyatakan kurang puas dengan jaminan social yang diterimanya.

a. Bila manajer perusahaan itu dalam memperkirakan menggunakan interval kepercayaan

99%, maka berapa proporsi seluruh karyawan di perusahaan tersebut yang kurang puas

dengan jaminan social yang mereka terima

b. Berapa banyak sampel yang harus diambil agar kita bisa percaya 99% bahwa proporsi

dalam sampel paling jauh berjarak 0.03 dari proporsi populasinya.

6. Suatu perusahaan rokok menghasilkan dua jenis rokok, yaitu filter dan kretek. Pimpinan

perusahaan itu mengatakan bahwa penjualan rokok filter lebih besar 8% daripada rokok

kretek. Dari sampel diperoleh bahwa ternyata 42 diantara 200 perokok lebih menyukai

Page 69: 73485202-Metode-Statistika.pdf

66

filter dan 18 di antara 150 perokok lebih menyukai kretek. Buatlah interval kepercayaan

95% untuk perbedaan persentase penjualan dua jenis rokok tersebut. Simpulkan apakah

selisih sebesar 8% yang dinyatakan pimpinan perusahaan tersebut bisa diterima ?

7. Suatu sampel acak sebanyak 8 batang rokok merk tertentu mempunyai rata-rata kadar

nikotin 3.5 mg dan simpangan baku 1 mg. Buatlah interval kepercayaan 99% untuk rata-rata

nikotin yang sesungguhnya rokok merk itu, bilamana diasumsikan kadar nikotin tersebut

menyebar normal

8. Dari sampel acak 12 mahasiswi suatu perguruan tinggi, diperoleh bahawa rata-rata uang

saku bulanannya adalah Rp 500.000,00 denag simpangan baku Rp 50.000,00. Bila

diasumsikan uang saku menyebar normal, buatlah selang kepercayaan 90% untuk rata-rata

uang saku mahasiswi tersebut.

9. Data berikut menunjukkan masa putar (dalam puluhan menit) film yang diproduksi dua

perusahaan

Perusahaan A 11 9 10 7 15 12 8 10 13 14

Perusahaan B 10 9 12 9 8 7 9 6 8 15

Buatlah interval kepercayaan 95% untuk beda rata-rata masa putar film yang diprodukasi

oleh dua perusahaan tersebut, jika di asumsikan masa putar film mempunyai sebaran

normal dengan ragam tidak sama.

Page 70: 73485202-Metode-Statistika.pdf

67

9 PENGUJIAN HIPOTESIS

9.1 Hipotesis Statistik

Sering permasalahan yang kita hadapi tidak hanya menyangkut pendugaan parameter

suatu populasi, tetapi juga menyangkut cara pengambilan keputusan berdasarkan data yaitu

pengujian hipotesis.

Hipotesis merupakan suatu asumsi atau anggapan yang bisa benar atau bisa salah

mengenai suatu hal dan dibuat untuk menjelaskan suatu hal tersebut sehingga memerlukan

pengecekan lebih lanjut. Bila hipotesis yang dibuat itu secara khusus berkaitan dengan

parameter populasi, maka hipotesis itu disebut hipotesis statistik. Jadi hipotesis statistik

adalah suatu asumsi atau anggapan atau pernyataan atau dugaan mengenai satu atau lebih

populasi.

Langkah-langkah atau prosedur yang dilakukan dengan tujuan untuk memutuskan

apakah kita menerima atau menolak hipotesis mengenai parameter populasi disebut pengujian

hipotesis. Jadi pada pengujian hipotesis kita ingin mengetahui atau menguji apakah parameter

satu populasi, yaitu sama dengan nilai tertentu yaitu 0 atau tidak. Kalau kita mempunyai

dua populasi masing-masing dengan parameter 1 dan 2, kita ingin menguji apakah 1 = 2, dan

sebagainya.

Untuk suatu hipotesis yang dibuat, hanya dua kemungkinan yang akan kita putuskan,

yaitu kita akan menolak hipotesis atau kita akan menerima hipotesis, setelah kita manghitung

statistik dari sampel. Menolak hipotesis artinya kita menyimpulkan bahwa hipotesis tidak

benar, sedangkan menerima hipotesis artinya tidak cukup informasi/bukti dari sampel untuk

menyimpulkan bahwa hipotesis harus kita tolak. Artinya walaupun hipotesis itu kita terima,

tidak berarti bahwa hipotesis itu benar. Sehingga dalam membuat rumusan pengujian hipotesis,

hendaknya selalu membuat pernyataan hipotesis yang diharapkan akan diputuskan untuk

ditolak. Hipotesis yang dirumuskan dengan harapan untuk ditolak disebut hipotesis nol yang

ditulis H0. Penolakan hipotesis nol akan menjurus pada penerimaan hipotesis alternatif atau

hipotesis tandingan yang ditulis H1 atau Ha .

Contoh 9.1

1. Pengujian hipotesis bahwa suatu jenis obat baru lebih efektif untuk menurunkan berat

badan. Maka rumusan hipotesisnya adalah :

H0 : obat baru = obat lama

H1 : obat baru lebih baik dari obat lama

2. Pengujian hipotesis bahwa teknologi baru dapat meningkatkan kualitas buah-buahan.

H0 : teknologi baru = teknologi lama

H1 : teknologi baru teknologi lama

Page 71: 73485202-Metode-Statistika.pdf

68

3. Seorang dokter menyatakan bahwa, lebih dari 60% pasien yang menderita sakit paru-

paru di suatu rumah sakit adalah karena merokok.

H0 : p = 0.6

H1 : p 0.6

9.2 Pengujian Hipotesis

Dalam membuat rumusan pengujian hipotesis, hendaknya kita selalu membuat

pernyataan hipotesis yang diharapkan akan diputuskan untuk ditolak. Hipotesis yang

dirumuskan dengan harapan akan ditolak biasanya disebut sebagai hipotesis nol/awal, yang

dilambangkan dengan 0H . Ini menyatakan bahwa setiap hipotesis yang ingin diuji dinyatakan

dengan H0. Penolakan 0H mengakibatkan penerimaan suatu hipotesis alternatif atau hipotesis

tandingan yang dilambangkan dengan 1H . Suatu H0 mengenai suatu parameter populasi akan

selalu dinyatakan sedemikian rupa sehingga parameter tersebut nilainya tertentu (satu nilai),

sedangkan H1 memungkinkan beberapa nilai.

Ada beberapa dasar yang dapat digunakan untuk merumuskan hipotesis, antara lain (1)

berdasarkan pengetahuan yang diperoleh dari teori, (2) berdasarkan hasil penelitian

terdahulu, (3) berdasarkan pengalaman, atau (4) berdasarkan ketajaman berpikir.

Seperti telah dijelaskan sebelumnya bahwa kebenaran atau ketidakbenaran suatu

hipotesis tidak pernah diketahui secara pasti. Dengan adanya faktor ketidakpastian ini

mengakibatkan timbulnya suatu resiko/kesalahan yang harus ditanggung oleh pembuat

keputusan itu sendiri. Dalam pengujian hipotesis dikenal dua jenis kesalahan, yaitu kesalahan

jenis I (galat I) dan kesalahan jenis II (galat II). Galat I adalah kesalahan akibat menolak

hipotesis nol, padahal hipotesis nol benar. Sedangkan galat II adalah kesalahan akibat

menerima hipotesis nol padahal hipotesis nol tersebut salah.

Peluang melakukan galat I disebut taraf nyata uji dilambangkan dengan , sedangkan

peluang melakukan galat II dilambangkan dengan .

Hubungan antara hipotesis nol, keputusan, jenis kesalahan, dan peluang melakukan

jenis kesalahan secara ringkas disajikan pada tabel berikut.

Tabel Jenis kesalahan dalam menolak dan menerima hipotesis nol

KeputusanKeadaan yang sesungguhnya

Hipotesis nol (H0) benar Hipotesis nol (H0) salah

Menolak H0 Galat I, = P(Galat I) Keputusan tepat, K=1-

Menerima H0 Keputusan tepat, 1 - Galat II, =P(Galat II)

Page 72: 73485202-Metode-Statistika.pdf

69

Oleh karena menyatakan peluang menolak H0 yang benar, maka kita mengharapkan

nilai sekecil mungkin. Sebab tidaklah pantas sesuatu yang sesungguhnya benar kita tolak.

Demikian juga dengan yang menyatakan peluang menerima H0 yang salah, kita mengharapkan

nilainya juga sekecil mungkin, karena tidak pantas juga sesuatu yang salah kita terima. Namun

dalam kenyataannya memperkecil atau membuat dan sekecil mungkin secara sekaligus

tidaklah mungkin, karena ternyata ada hubungan antara dengan , yaitu memperkecil nilai

akan mengakibatkan membesarnya nilai , demikian juga sebaliknya. Usaha untuk memperkecil

nilai dan dapat dilakukan dengan memperbesar ukuran contoh.

Dalam praktek pengujian hipotesis, nilai yang sering digunakan adalah 0,05 dan 0,01.

Jika yang digunakan adalah 0,05, dapat diartikan bahwa kira-kira sebanyak 5 dari setiap 100

kasus bahwa kita akan menolak Ho yang benar. Dengan kata lain, ada keyakinan 95% bahwa kita

telah mebuat keputusan atau kesimpulan yang benar.

Untuk setiap pengujian dengan memakai nilai tertentu, kita dapat menghitung nilai

. Ternyata bahwa nilai ini tergantung pada nilai parameter populasi, yaitu , sehingga

dapat dinyatakan sebagai suatu fungsi, yaitu (), yang disebut fungsi ciri operasi (CO). Nilai K

= 1 - disebut kuasa uji. Kuasa uji adalah peluang menolak Ho bilai suatu tandingan tertentu

benar. Jika K() = 1 - (), maka K() disebut fungsi kuasa.

Beberapa sifat penting dalam pengujian hipotesis :

- Galat I dan galat II saling berhubungan. Menurunnya peluang yang satu akan menaikkan

peluang yang lain.

- Ukuran wilayah kritik, yang berarti juga peluang melakukan galat jenis I, selalu dapat

diperkecil dengan mengubah nilai kritiknya.

- Peningkatan ukuran contoh n akan memperkecil dan secara bersama-sama.

- Bila hipotesis nolnya salah, nilai akan sangat besar bila nilai parameternya dekat

dengan nilai yang dihipotesiskan. Semakin besar jarak antara nilai yang sesungguhnya

dengan nilai yang dihipotesiskan, maka semakin kecil nilai .

Contoh 9.2

Suatu jenis deterjen baru diduga dapat mencuci bersih 70% dari bercak pada pakaian. Untuk

menguji dugaan ini, deterjen ini digunakan pada 12 bercak yang dipilih secara acak. Bila

kurang dari 11 bercak yang hilang maka dugaan kemampuan deterjen tersebut dalam mencuci

70% dari bercak pakaian diterima.

a. hitunglah galat I dengan menganggap bahwa p = 0,7

b. hitunglah galat II jika ternyata p = 0,9

JawabHipotesis : Ho : p = 0,7 vs H1 : p > 0,7

Page 73: 73485202-Metode-Statistika.pdf

70

X = banyaknya bercak pakaian yang berhasil dicuci

Nilai kritis : 11

085.0915.01)7.0,12;(1)7.0,12;(

)7,0|11()(.10

0

12

11

xx

xbxb

pXPIgalatPa

341.0)9.0,12;()9,0|11()(.10

0

x

xbpXPIIgalatPb

Contoh 9.3

Suatu contoh acak 400 pemilih di suatu kota ditanya apakah mereka mendukung kenaikan 4%

tarip listrik untuk penerangan jalan yang amat diperlukan. Bila lebih dari 220 tapi kurang dari

260 pemilih yang mendukung kenaikan tarip maka disimpulkan bahwa 60% pemilih mendukung.

a. cari peluang melakukan galat I bila 60% pemilih yang mendukung kenaikan tarif.

b. Berapa peluang melakukan galat II dalam prosedur pengujian ini bila sesungguhnya hanya

48% dari pemilih yang mendukung kenaikan tarif listrik ?

JawabHipotesis : Ho : p = 0,6 vs H1 : p 0,6

Nilai kritis : 220 < X < 260

Karena n besar, maka untuk menghitung galat I dan galat II digunakan hampiran normal.

a. menghitung

= np = 400(0.6) = 240

= (npq) = {400(0.6)(0.4)} = 9.80

nilai kritis menjadi : 220.5 < X < 259.5

0366.0)0183.0(2)09.2(2)09.2()09.2(

)80.9

2405.260()

80.9

2405.219(

)240|5.260()240|5.219(

)6.0|260()6.0|220()(

ZPZPZP

XP

XP

XPXP

pXPpXPIgalatP

b. menghitung

= np = 400(0.48) = 192

= (npq) = {400(0.48)(0.52)} = 9.99

003.0997.01)75.2()86.6(

)86.675.2()99.9

1925.260

99.9

1925.219(

)192|5.2595.220()48.0|260220()(

ZPZP

ZPX

P

XPpXPIIgalatP

Page 74: 73485202-Metode-Statistika.pdf

71

9.3 Uji Satu Arah Dan Dua Arah

Suatu uji hipotesis statistik yang alternatifnya bersifat satu-arah, seperti

1. ooH : dan 01 : H atau 2. ooH : dan oH :1

disebut uji satu-arah. Wilayah kritik bagi bagi hipotesis alternatif > 0 terletak seluruhnya di

ekor kanan sebaran tersebut, sedangkan wilayah kritik bagi hipotesis alternatif < 0 terletak

seluruhnya di ekor kiri. Dalam pengertian ini, tanda ketaksamaan menunjuk ke arah wilayah

kritiknya.

Uji hipotesis statistik yang alternatifnya bersifat dua-arah, seperti

ooH :

oH :1

disebut uji dua arah, karena wilayah kritiknya dipisah menjadi dua bagian yang ditempatkan di

masing-masing ekor sebaran statistik ujinya. Hipotesis alternatif 0 menyatakan bahwa <0 atau > 0.

Hipotesis nol, H0, akan selalu dituliskan dengan tanda kesamaan sehingga

menspesifikasi suatu nilai tunggal. Dengan cara demikian, peluang melakukan galat I dapat

dikendalikan. Apakah kita harus menggunakan uji satu-arah atau dua-arah, bergantung pada

kesimpulan yang akan ditarik bila H0 ditolak. Sebagai contoh, sebuah peusahaan rokok

menyatakan bahwa kadar nikotin rata-rata rokok yang diproduksinya tidak melebihi 2,5

miligram. Pernyataan dari perusahaan tersebut dapat ditolak jika rata-rata () lebih besar dari

2,5 miligram dan dapat diterima jika lebih kecil atau sama dengan 2,5 miligram. Dengan

demikian kita akan menguji

H0 : = 2,5

H1 : > 2,5

Meskipun kita menuliskan hipotesis nol-nya dengan tanda sama dengan, namun itu harus

dipahami sebagai mencakup semua nilai yang tidak dicakup oleh hipotesis alternatifnya.

Akibatnya, menerima H0 tidak boleh diimplikasikan bahwa tepat sama dengan 2,5 miligram,

namun harus diartikan bahwa kita tidak mempunyai bukti yang cukup untuk mendukung H1.

Beberapa langkah yang perlu diperhatikan dalam pengujian hipotesis:

1. Tuliskan hipotesis yang akan diuji

Ada dua jenis hipotesis:

a. Hipotesis sederhana

Hipotesis nol dan hipotesis alternatif sudah ditentukan pada nilai tertentu

H0 : = 0 vs H1 : = 1

H0 : 2 = 02 vs H0 : 2 = 1

2

H0 : P = P0 vs H0 : P = P1

Page 75: 73485202-Metode-Statistika.pdf

72

b. Hipotesis majemuk

Hipotesis nol dan hipotesis alternatif dinyatakan dalam interval nilai tertentu

b.1. Hipotesis satu arahH0 : 0 vs H1 : < 0

H0 : 0 vs H1 : > 0

b.2. Hipotesis dua arahH0 : = 0 vs H1 : 0

2. Deskripsikan data sampel yang diperoleh (hitung rataan, ragam, standard error dll)

3. Hitung statistik ujinya

Statistik uji yang digunakan sangat tergantung pada sebaran statistik dari penduga

parameter yang diuji. Misalnya

H0: = 0 maka x maka statistik ujinya bisa t-student atau normal baku (z)

ns

xth

/

0 ataun

xzh

/

0

4. Tentukan batas kritis atau daerah penolakan H0

Daerah penolakan H0 sangat tergantung dari bentuk hipotesis alternatif (H1). Misalnya,

H1: < 0 Tolak H0 jika th < -t(; db)(tabel)H1: > 0 Tolak H0 jika th > t(; db)(tabel)H1: 0 Tolak H0 jika |th | > t(/2; db)(tabel)

5. Tarik kesimpulan

9.4 Uji Rataan Populasi

Berikut ini adalah pengujian rataan populasi untuk satu populasi

No Bentuk hipotesis Statistik uji Daerah kritis(Daerah penolakan H0)

1 H0 : = 0 vsH1: 0

a. Contoh kecil & ragam poptidak diketahui

ns

xth

/

0

b. Contoh besar atau ragampop diketahui

n

xzh

/

0

|th | > t(/2; db=n-1)(tabel)

|zh | > z(/2)(tabel)

Page 76: 73485202-Metode-Statistika.pdf

73

2 H0 : 0 vsH1 : < 0

Sda th < -t(; db=n-1)(tabel)

zh < -z()(tabel)

3 H0 : 0 vsH1 : > 0

Sda th > t(; db=n-1)(tabel)

zh > z()(tabel)

Contoh 9.4

Pemerintah berencana untuk melaksanakan sebuah program peningkatan mutu siswa. Dari

sebuah sekolah diketahui bahwa sebelum dilaksanakan program tersebut, rata-rata nilainya

adalah 7,1. Untuk melaksanakan program tersebut, sebanyak 40 siswa secara acak dipilih dari

sekolah tersebut. Data baru yang diperoleh memiliki rata-rata 7,3 dengan simpangan baku

0,15. Berhasilkah program tersebut (gunakan alpha 5%) ?

JawabKarena yang ingin diketahui apakah ada peningkatan mutu pendidikan setelah diadakan

program tersebut, maka :

- hipotesisnya : H0 : = 7.1 vs H1 : > 7.1.

- titik kritis : Z0,05 = 1,645 (digunakan uji Z karena n relatif besar , n = 40)

- Stat. Uji : 43,840/15,0

3,71,7

x

ohitung

s

XZ

- Karena Zhitung > 1,645 maka tolak H0, artinya ada peningkatan rata-rata nilai setelah

diadakan program peningkatan mutu siswa tersebut sehingga dapat dikatakan bahwa

program tersebut berhasil dilaksanakan.

Contoh 9.5

Batasan yang ditentukan oleh pemerintah terhadap emisi gas CO kendaraan bermotor adalah 50

ppm. Sebuah perusahaan baru yang sedang mengajukan ijin pemasaran mobil, diperiksa oleh

petugas pemerintah untuk menentukan apakah layak perusahan tersebut diberikan ijin.

Sebanyak 20 mobil diambil secara acak dan diuji emisi CO-nya. Dari data yang didapatkan,

rata-ratanya adalah 55 dan ragamnya 4.2. dengan menggunakan taraf nyata 5%, layakkan

perusahaan tersebut mendapat ijin ?

Jawab- Hipotesis H0 : = 50 vs H1 : > 50

- titik kritis : t(0,05;19) = 1,729

- Stat. Uji : 91,1020/05,2

5055

xs

Xt

- Karena thitung > 1,729 maka tolak H0, artinya emisi gas CO kendaraan bermotor yang

akan dipasarkan oleh perusahaan tersebut melebihi batasan yang ditentukan oleh

pemerintah sehingga perusahaan tersebut tidak layak untuk memperoleh ijin untuk

memasarkan mobilnya.

Page 77: 73485202-Metode-Statistika.pdf

74

Contoh 9.6

Seorang pelamar untuk jabatan salesmen menyatakan bahwa dia sanggup melakukan penjualan

minimal 7 unit barang sehari. Untuk membuktikan hal itu, manajer personalia memberikan

waktu selama 12 hari. Hasil penjualan selama tes tersebut adalah sebagai berikut : 4, 5, 8, 3,

6, 4, 4, 8, 7, 3, 4, 5. Ujilah apakah pernyataan orang tersebut didukung oleh data (gunakan

alpha 10%).

JawabUntuk menguji pernyataan salesman bahwa dia sanggup menjual minimal 7 unit barang

sehari , maka : Hipotesis H0 : >= 7 vs H1 : < 7

- titik kritis 10% : t(0,10;11) = 1,363, gunakan titik kritis –1,363

- 08,512

5...54

n

xx

i;

174,311

)08,5(12)5...54(

1

)( 222222

2

n

xnxs

i

- Stat. Uji : 73,312/78,1

708,50

xs

xt

- Karena thitung < -1,363 maka tolak H0, artinya rata-rata penjualan barang oleh salesmen

tersebut tidak lebih dari 7 unit barang per hari tetapi kurang dari 7 unit.

Untuk menguji perbedaan dua nilai tengah populasi dapat dibedakan menjadi dua kasus

yaitu kasus saling bebas dan kasus berpasangan.

Berikut ini uji ipotesis untuk dua contoh saling bebas.

No Bentukhipotesis

Statistik uji Daerah kritis(Daerah penolakan H0)

1 H0 : 1-2 = 0

vs

H1: 1-2 0

a. Contoh kecil & ragam pop tidakdiketahui

)(

021

21

)(

xx

hs

xxt

dimana:

22

21

2

22

1

21

22

21

21

;

;11

21

n

s

n

s

nns

s

g

xx

b. Contoh besar atau ragam popdiketahui

)(

021

21

)(

xx

h

xxz

|th | > t(/2; db)(tabel)

22

21

22

21

;

;221

efektifdb

nndb

|zh | > z(/2)(tabel)

Page 78: 73485202-Metode-Statistika.pdf

75

2 H0 : 1-2 0

vsH1 : 1-2 < 0

Sda th < -t(; db)(tabel)

zh < -z()(tabel)

3 H0 : 1-2 0

vsH1 : 1-2 > 0

Sda th > t(; db)(tabel)

zh > z()(tabel)

Sedangkan berikut ini adalah uji hipotesis untuk dua contoh yang berpasangan

No Bentuk hipotesis Statistik uji Daerah kritis(Daerah penolakan H0)

1 H0 : D = 0 vsH1: D 0

c. Contoh kecil & ragam poptidak diketahui

ns

dth

/

0

d. Contoh besar atau ragampop diketahui

n

dzh

/

0

|th | > t(/2; db=n-1)(tabel)

|zh | > z(/2)(tabel)

2 H0 : D 0 vsH1 : D < 0

Sda th < -t(; db=n-1)(tabel)

zh < -z()(tabel)

3 H0 : D 0 vsH1 : D > 0

Sda th > t(; db=n-1)(tabel)

zh > z()(tabel)

Kedua kasus tersebut dibedakan oleh metode pengambilan contohnya. Dua contoh dikatakan

saling bebas jika pemilihan unit-unit contoh pertama tidak tergantung pada bagaimana unit-

unit contoh kedua dipilih dan sebaliknya. Sedangkan dua contoh dikatakan berpasangan jika

pengambilan unit-unit contoh pertama memperhatikan bagaimana unit-unit contoh kedua

dipilih. Keterkaitan kedua contoh pada kasus berpasangan ditentukan oleh suatu peubah

kontrol (control variable) misal lokasi, kemiringan lahan, tingkat pendidikan, kondisi sosial

ekonomi dan lain-lain.

Contoh 9.7

Dua jenis program manajemen pemasaran diterapkan pada sebuah perusahaan retail untuk

mengkaji program mana yang lebih efisien meningkatkan penjualan mingguan. Kedua program

tersebut dievaluasi dengan cara mencatat penjualan selama 9 minggu. Program pertama

mampu memberikan rata-rata nilai penjualan mingguan sebesar 230 juta dengan simpangan

baku 10 juta, sedangkan program kedua rata-ratanya 210 juta dengan simpangan baku 9 juta.

Page 79: 73485202-Metode-Statistika.pdf

76

Jika diasumsikan kedua kondisi sama, ujilah apakah kedua program memberikan hasil yang

berbeda ? (gunakan 5%)

JawabUntuk mengkaji program mana yang lebih efisien,

Hipotesisnya : H0 : 1 - 2 = 0 vs H1 : 1 - 2 0

- titik kritis untuk = 5% : t(0,025;16) = 2,120 (ingat : kondisi sama ragam sama,

sehingga db = n1+n2-2)

- ragam gabungan : 5,9016

)81(8)100(8

2

)1()1(

21

222

2112

nn

snsns p

- Stat. Uji : 46,49/19/151,9

0210230

)/1()/1(

)(

2

021

1

nns

dxxt

p

- Karena |thitung| > 2,120 maka tolak H0, artinya ada perbedaan dalam tingkat efesiensi

peningkatan penjualan mingguan antara program pertama dan yang kedua, di mana

program yang lebih efisien adalah program yang pertama.

Contoh 9.8

Seorang mahasiswa Budidaya Pertanian ingin membandingkan produksi dari dua varietas kacang

tanah. Kemudian kedua varietas kacang tanah tersebut ditanam pada delapan lokasi yang

berbeda tetapi setiap varietas ada pada setiap lokasi. Data produksi (ton perhektar) kedua

varietas tersebut diperoleh sebagai berikut :

Varietas\lokasi 1 2 3 4 5 6 7 8

Var 1 6.25 5.30 7.10 6.45 6.00 4.83 5.40 6.80

Var 2 5.50 5.80 6.00 7.50 6.25 4.85 5.00 6.50

ujilah apakah kedua varietas memberikan hasil yang berbeda, jika berbeda mana yangmenurut anda lebih baik? (gunakan 5%)

JawabKasus di atas termasuk kasus pengamatan berpasangan, sehingga perlu dicari beda dari

varietas 1 dan varietas 2, yaitudi : 0.75, -0.5, 1.1, -1.05, -0.25, -0.02, 0.4, 0.3

- Hipotesis H0 : d = 0 vs H1 : d 0

- titik kritis : t(0,025;7) = 2,365

- nilai statistik :

694.0482.07

)091.0(84379.3

1

)(

091.08

3.0...)5.0(75.0

2222

di

d

i

sn

dnds

n

dd

- Stat. Uji : 371.08/694.0

0091.0

/

ns

dt

d

d

- Karena thitung < 2,365 maka terima H0, artinya belum cukup bukti untuk menyimpulkan

bahwa kedua varietas kacang tanah tersebut memberikan hasil produksi yang berbeda.

Page 80: 73485202-Metode-Statistika.pdf

77

9.5 Latihan Soal

1. Jelaskan istilah berikut :

a. hipotesis b. hipotesis statistik c. pengujian hipotesis statistik

d. hipotesis nol e. hipotesis alternatif f. kesalahan jenis I

g. kesalahan jenis II h. taraf signikansi i. uji satu arah

j. uji dua arah k. niali kritis l. nilai kritis

m. satistik uji n. statistik hitung

2. Suatu perusahaan memproduksi lampu listrik yang umurnay mendekati sebaran normal

dengan nilai rata-rata 80 jam dan simpangan baku 40 jam. Dengan menggunakan sampel

acak sebanyak 30 lampu ternyata rata-rata umur lampu hanya 775 jam. Ujilah hipotesis

bahwa = 800 dan lawan alternatifnya 800 jam, denagn memakai taraf signifansi =

0.01

3. Seorang pimpinan perusahaan ingin meningkatkan kualitas sumber daya karyawannya di

bidang produksi. Dia berharap setelah mereka mengikuti kursus, cacat produksi bisa

berkurang 10%. Pada suatu saat tertentu setelah para karyawan mengikuti kursus diketahui

bahwa dari sampel sebanyak 20 produk yang diambilsecara acak ternyata terdapat 3 produk

yang cacat. Dengan menganggap distribusi menyebar normal, apakah harapan pimpinan itu

terbukti dalam sampel tersebut. Gunakan = 10%

4. Suatu perusahaan garmen ingin mengembangkan produksi kemeja. Pimpinan perusahaan

menyatakan bahwa bila paling sedikit sebanyak 30% yang berminat membeli kemeja

tersebut, maka perusahaan akan memperluas usahanya. Untuk itu diadakan penelitian yang

melibatkan 200 responden dan ternyata terdapat 70 responden yang tertarik membeli

kemeja tersebut. Dengan taraf = 1%, ujilah pernyataan pimpinan tersebut, apaakh ia

akan memperluas usahanya atau tidak, dengan asumsi populasi menyebar normal.

5. Sebuah sampel yang terdiri atas 100 kendaraan bermotor masing-masing telah dipilih dari

populasi kendaraan bermotor yang ada di Bekasi dan Bandung. Di Bandung ditemukan

sebanyak 72 kendaraan yang telah melunasi pajak kendaraan, sedangkan di Bekasi hanya 66

kendaraan saja yang telah melunasi pajak kendaraan. Ujilah perbedaan proporsi kendaraan

yang telah melunasi pajak di dua kota tersebut dengan memakai = 1%

Page 81: 73485202-Metode-Statistika.pdf

78

10 ANALISIS REGRESI DAN KORELASI

Dalam penelitian ada kalanya dilakukan pengamatan terhadap lebih dari satu ciri

terhadap tiap-tiap anggota contoh. Hubungan antara ciri-ciri yang diamati itu sering menarik

perhatian, sehingga timbullah masalah korelasi dan regresi.

Pada masalah korelasi dibicarakan keeratan hubungan antara dua ciri atau lebih,

sedangkan pada masalah regresi kita menduga bentuk hubungan antara ciri-ciri tersebut.

10.1 Regresi Linear Sederhana

Dalam kehidupan sehari-hari seringkali kita ingin melihat hubungan antar peubah.

Umumnya suatu peubah bersifat mempengaruhi peubah lainnya, peubah pertama ini disebut

peubah bebas sedangkan peubah yang kedua disebut peubah tak bebas. Secara kuantitatif

hubungan antara peubah bebas dengan peubah tak bebas dapat dimodelkan dalam suatu

persamaan matematik, sehingga kita dapat menduga nilai suatu peubah tak bebas bila nilai

peubah bebas diketahui. Persamaan matematik yang menggambarkan hubungan antara peubah

bebas dengan peubah tak bebas sering disebut persamaan regresi.

Regresi linear sederhana adalah persamaan regresi yang menggambarkan hubungan

antara satu peubah bebas (x) dan satu peubah tak bebas (y), di mana hubungan keduanya dapat

digambarkan sebagai suatu garis lurus. Sehingga hubungan kedua peubah tersebut dapat

dituiskan dalam bentuk persamaan :

Yi = + Xi ……………(1)

dengan :

Yi = peubah tak bebas

Xi = peubah bebas

= intersep / perpotongan dengan sumbu tegak

= kemiringan garis / gradien

Dalam praktek, seringkali kita tidak dapat mengamati seluruh anggota populasi,

sehingga hanya mengamati n buah contoh acak dan diperoleh pengamatan berukuran n serta

dapat dilambangkan dengan {(xi, yi), I = 1, 2, …, n}.

Persamaan yang kita peroleh adalah dugaan dari persamaan (1) dan dapat dituliskan :

ii bXaY ˆ ……..(2)

dengan a adalah penduga bagi dan b adalah penduga bagi .

Page 82: 73485202-Metode-Statistika.pdf

79

Untuk peubah bebas xi, nilai pengamatan yi tidak akan selalu tepat berada pada garis

persamaan (1) untuk garis regresi populasi atau pada persamaan (2) untuk garis regresi contoh.

Dengan demikian akan terdapat simpangan sebesar i untuk populasi atau ei untuk contoh,

sehingga diperoleh persamaan :

Yi = + Xi + i (persamaan regresi populasi) ……..(3)

Yi = a + bXi + ei (persamaan regresi contoh) ….…(4)

Untuk melihat pola hubungan antara X dan Y pertama-tama kita plotkan nilai

pengamatan (xi, yi) pada bidang kuadran dua. Jika hasil plot menunjukkan pola titik-titik yang

menyerupai garis lurus, maka penggunaan regresi linear sederhana untuk melihat pola

hubungan antara kedua peubah tersebut sudah tepat.

10.2 Pendugaan Koefisien Regresi

Untuk menduga parameter dan terdapat bermacam-macam metode yang dapat

digunakan, salah satu diantaranya adalah metode kuadrat terkecil (MKT). Prinsip dasar dari

MKT adalah meminimumkan jumlah kuadrat galat (JKG) antara data aktual (data yang

diperoleh dari hasil pengamatan) dengan data dugaan. Secara matematik dapat dijabarkan

sebagai berikut :

Yi = + Xi + i dan ii bXaY ˆ

Sehingga diperoleh dugaan galat sebesar :

iiii YYe ˆˆ dan misalkan

n

iieq

1

2

maka untuk mendapatkan penduga kuadrat terkecil dari parameter regresi adalah dengan

meminimumkan nilai q, nilai q ini disebut juga JKG. Dengan menggunakan bantuan pelajaran

kalkulus maka nilai dugaan parameter regresi dapat diperoleh sebagai berikut :

2

11

2

1 11

1

2

1

))((

n

ii

n

ii

n

i

n

ii

n

iiii

n

ii

n

iii

xxn

yxyxn

xx

yyxx

b dan xbya

besaran nilai a dan b dapat diinterpretasikan sebagai berikut : pada saat x bernilai nol maka

besarny nilai dugaan y adalah sebesar a, sedangkan nilai b menunjukkan besarnya perubahan

nilai y jika terjadi perubahan pada nilai x satu-satuan.

Page 83: 73485202-Metode-Statistika.pdf

80

10.3 Pengujian Hipotesis Bagi Koefisien Regresi

Seperti halnya dalam pendugaan nilai tengah, maka penilaian tentang tingkat

keyakinan terhadap hasil dugaan b memerlukan informasi tentang ragam dari b, atau lebih

tepatnya adalah informasi tentang pola sebaran b. Untuk dapat mengetahui informasi ini, kita

terlebih dahulu membuat beberapa asumsi mengenai model regresi.

Berdasarkan persamaan (3), beberapa asumsi yang harus dipenuhi yaitu i adalah bebas

terhadap sesamanya dan menyebar normal dengan nilai tengah nol dan ragam 2 [i (0, 2)].

Berdasarkan model (3) di atas, dengan konstanta dan sebagai parameter regresi dan xi

bukan sebuah peubah acak, maka yi adalah suatu peubah acak yang menyebar normal dengan

E(yi) = + xi dan Var(yi) = 2 untuk semua i.

Nilai a dan b merupakan dugaan bagi parameter dan . Dengan pengambilan contoh

acak berulangkali dapat diperoleh nilai dugaan yang berbeda bagi dan . Nilai-nilai dugan

tersebut dapat dipandang sebagai nilai-nilai peubah acak A dan B. nilai-nilai A dan B tersebut

tergantung pada keragaman nilai peubah acak Y1, Y2, …, Yn.

Penduga koefisien b adalah kombinasi linear dari peubah acak yi, yaitu berupa

n

inn

n

iiiiin

ii

n

iii

ywywywywyyw

xx

yyxx

b1

22111

1

2

1 )(

))((

dengan

;

)(

1

2

n

ii

ii

xx

xxw dan karena ,0

1

n

iiw maka 0

1

ywn

ii

dengan demikian b adalah peubah acak dengan nilai harapan

i

n

iii

n

ii

n

iii

n

ii

n

iiii

n

ii xwxwwxwyEwywEbE

111111

)()()()(

karena nilai 01

n

iiw maka 0

11

xwwxn

ii

n

ii

sehingga 1)(1111

xxwxwxwxw i

n

ii

n

iii

n

iii

n

ii

jadi b merupakan penduga tak bias bagi karena E(b) = .

Page 84: 73485202-Metode-Statistika.pdf

81

Ragam dari b adalah

n

ii

n

ii

n

iin

ii

n

iii

n

iii

xxxx

xx

wyVarwywVarbVar

1

2

2

2

1

2

1

2

2

1

22

1

2

1 )()(

)(

)()()(

selanjutnya untuk nilai dugaan xbya kita peroleh

xxbExyExbyEaE )()()()( dan

n

ii

n

ii xx

x

nxx

x

nbVarxyVarxbyVaraVar

1

2

22

1

2

2222

)(

)(1

)(

)()()()()()(

karena Y1, Y2, …, Yn bebas dan menyebar normal, maka A dan b juga menyebar normal dengan

nilai tengah dan ragam seperti di atas.

Karena ragam dari A dan B mengandung parameter 2 yang umumnya nilainya tidak

diketahui, maka perlu dilakukan pendugaan untuk nilai tersebut. Parameter 2 merupakan

ragam galat pada model yang menggambarkan keragaman acak dari keragaman galat percobaan

di sekitar garis regresi. Penduga tak bias bagi 2 adalah s2, yaitu

2222

2

1

2

2

n

JbJ

n

bJJ

n

e

n

JKGs

xxyyxyyy

n

ii

dengan :

n

xn

ii

n

iixx

n

ii

xxxJ

2

1

1

2

1

2)(

;n

yn

ii

n

iiyy

n

ii

yyyJ

2

1

1

2

1

2)(

n

yxn

iii

n

iiixy

n

ii

n

ii

yxyyxxJ

11

11

))((

Untuk menguji hipotesis apakah intersep bernilai tertentu (miaslnya k) dapat diuji

dengan menggunakan statistik uji t, di mana hipotesisnya dapat dituliskan sebagai berikut :

H0 : = k lawan H1 : k

Statistik ujinya dapat dirumuskan sebagai berikut

Page 85: 73485202-Metode-Statistika.pdf

82

a

hitungs

ka

aVar

kat

)(

nilai statistik uji ini mengikuti sebaran t-student dengan derajat bebas n-2. Jika |t-hitung| >

t(/2, db=n-2) atau jika peluang nyata lebih kecil dari nilai taraf nyata yang ditetapkan maka

hipotesis nol ditolak.

Selang kepercayaan (1 - )100% bagi parameter adalah :

a - t/2, (n-2) sa a + t/2, (n-2) sa

dari selang kepercayaan ini dapat kita lihat kisaran nilai intersep yang dapat diyakini dengan

tingkat keyakinan sebesar (1 - )100%.

Untuk melihat apakah peubah X berpengaruh terhadap peubah Y juga dapat diuji

dengan menggunakan uji t-student. Misalkan ingin diuji apakah perubahan setiap X satu-satuan

akan mengakibatkan Y akan berubah sebesar k satuan, naka hipotesis dari pertanyaan ini dapat

dituliskan sebagai berikut :

H0 : = k

H1 : k

Statistik ujinya dapat dirumuskan sebagai berikut

b

hitungs

kb

bVar

kbt

)(

nilai statistik uji ini mengikuti sebaran t-student dengan derajat bebas n-2. Jika |t-hitung| >

t(/2, db=n-2) atau jika peluang nyata lebih kecil dari nilai taraf nyata yang ditetapkan maka

hipotesis nol ditolak.

Selang kepercayaan (1 - )100% bagi parameter adalah :

b - t/2, (n-2) sb b + t/2, (n-2) sb

10.4 Peramalan / Pendugaan Bagi Y

Dalam analisis regresi peubah X bersifat tetap. Untuk suatu contoh acak yang

berukuran n pada nilai x yang sama kita mungkin mendapatkan nilai y yang bervariasi. Dengan

kata lain nilai yi dalam pasangan (xi, yi) merupakan nilai suatu peubah acak Y dengan nilai

tengah y dan ragam y2.

Page 86: 73485202-Metode-Statistika.pdf

83

Persamaan Yi = a + bXi dapat digunakan untuk menduga y dari beberapa nilai y pada

nilai x tertentu dan dapat pula digunakan untuk menduga nilai tunggal y0 bila x = x0. Bila y0 = a

+ bx0 maka y0 akan menyebar normal dengan nilai tengah y0 sama dengan y pada x = x0 dan

2

2

02ˆ

)1(

)(10

x

ysn

xx

n, dengan

n

iix xx

ns

1

22 )(1

1

Penduga bagi2ˆ0y adalah

2ˆ0ys . Untuk memperoleh nilai dugaan ini 2 diduga dengan s2.

Adapun selang kepercayaan (1 - )100% bagi y untuk x = x0 adalah :

2ˆ)2(,2/0

2ˆ)2(,2/0 00

ˆˆynyyn stysty

Untuk mendapatkan selang kepercayaan bagi sembarang nilai tunggal y0 dari peubah Y0, maka

kita perlu menduga ragam selisih antara nilai 0y yang diperoleh dari garis regresi bila

pengambilan contohnya dilakukan berulang-ulang pada x=x0 dengan y0 yang sesungguhnya.

Kita dapat memandang 00ˆ yy sebagai nilai peubah acak 00

ˆ YY , yang sebaran penarikan

contohnya menyebar normal dengan nilai tengah dan ragam sebagai berikut :

0)ˆ( 00ˆ 00

YYEyy

dan 2

2

202

ˆ )1(

)(11

00

x

yy sn

xx

n

Penduga bagi2ˆ 00 yy adalah

2ˆ 00 yys . Agar nilai dugaan ragam ini diperoleh, maka 2 diduga

dengan ragam contoh (s2).

Selang kepercayaan (1-)100% bagi nilai tunggal y0 bila x=x0 adalah

2ˆ)2(,2/00

2ˆ)2(,2/0 0000

ˆˆyynyyn styysty

10.5 Kesesuaian Model

Ada beberapa petunjuk yang dapat digunakan untuk melihat kesesuaian dari model

yang diperoleh, diantaranya :

1. koefisien determinasi (R2) yaitu suatu ukuran yang digunakan untuk melihat

kemampuan model dalam menerangkan keragaman nilai peubah Y. Kisaran nilai R2

mulai dari 0 sampai 100%. Semakin besar nilai R2 berarti model semakin mampu

menerangkan perilaku peubah Y. Sebagai contoh, ingin diketahui pola hubungan antara

biaya iklan yang dikeluarkan oleh suatu perusahaan dengan banyaknya produknya yang

Page 87: 73485202-Metode-Statistika.pdf

84

terjual, diperoleh nilai R2 sebesar 80%, ini berarti bahwa model regresi yang kita

peroleh menunjukkan bahwa 80% keragaman dari produk yang terjual sudah dapat

diterangkan oleh faktor biaya iklan yang dikeluarkan, sedangkan 20% lainnya keragaman

dari produk yang terjual dipengaruhi oleh faktor lain. Adapun rumus untuk menghitung

R2 adalah

2

222 1

y

x

s

sb

JKT

JKGR

2. Kuadrat tengah galat (KTG). Semakin kecil nilai KTG maka model regresi yang diperoleh

akan lebih baik dalam menggambarkan pola hubunagn antara peubah bebas dan peubah

tak bebas. Namun penggunaan KTG sering kali menemui masalah yaitu seberapa besar

nilai KTG agar model dikategorikan sebagai model yang baik. Permasalahan ini timbul

karena mengingat KTG tidak memiliki batasan yang jelas. Tetapi jika terdapat

beberapa model yang dibangun, maka penggunaan KTG sebagai alat untuk memilih

model terbaik akan cukup efektif.

3. membuat plot antara nilai sisaan, ei, dengan xi atau dengan iy . Perilaku ei yang

dianggap layak akan terlihat apabila nilai-nilai tersebut membentuk suatu pita yang

mendatar di sekitar garis e = 0. Jika tebaran nilai-nilainya berbentuk corong dapat

memberi petunjuk adanya keheterogenan ragam dan jika tebaran nilainya melengkung

menunjukkan kekurangtepatan dari model regresinya. Berdasarkan plot sisaan kita

juga dapat mendeteksi kemungkinan adanya pencilan dengan memeriksa apakah ada

nilai/titik yang memencil atau jauh dari nilai-nilai sisaan yang lain.

10.6 Korelasi

Ukuran korelasi linear antara dua peubah yang paling banyak digunakan adalah

koefisien korelasi contoh (r). Koefisien korelasi ini menggambarkan tingkat keeratan hubungan

linear antara dua peubah atau lebih. Besaran dari r tidak menggambarkan hubungan sebab

akibat antar dua peubah atau lebih tetapi semata-mata menggambarkan keterkaitan linear

antar peubah. Nilai dari r berkisar antara –1 sampai 1 (-1 r 1). Nilai r yang mendekati 1 atau

–1 menunjukkan semakin erat hubungan linear antara kedua peubah tersebut. Sedangkan nilai r

yang mendekati atau sama dengan nol menggambarkan tidak ada hubungan linear antara kedua

peubah tersebut, tetapi mungkin saja mempunyai hubungan yang tidak linear.

Koefisien korelasi antara peubah X dan Y dapat dirumuskan sebagai berikut :

y

x

yx

xy

yyxx

xy

s

sb

ss

s

JJ

Jr

22

Page 88: 73485202-Metode-Statistika.pdf

85

dengan )1/(),1/(),1/( 22 nJsnJsnJs yyyxxxxyxy

Koefisien korelasi contoh, r, merupakan sebuah nilai yang dihitung dari n pengamatan

contoh. Contoh acak berukuran n yang lain tetapi diambil dari populasi yang sama biasanya

akan menghasilkan nilai r yang berbeda. Dengan demikian kita dapat memandang r sebagai

suatu nilai dugaan bagi koefisien korelasi linear populasi, . Bila r dekat dengan nol, kita

cenderung menyimpulkan = 0. Tetapi jika nilai r mendekati –1 atau 1 disarankan agar kita

menyimpulkan 0. Masalahnya sekarang adalah bagaimana mendapatkan suatu uji yang akan

mengatakan kepada kita kapan suatu nilai r berada cukup jauh dari suatu nilai tertentu 0,

agar kita mempunyai cukup alasan untuk menolak hipotesis nol bahwa = 0 dan menerima

alternatifnya. Hipotesis alternatifnya, H1, biasanya salah satu diantara < 0, > 0, atau

0.

Uji terhadap hipotesis nol = 0 didasarkan pada besaran

r

r

1

1ln

2

1

yang merupakan suatu nilai peubah acak yang menyebar menghapiri normal dengan nilai

tengah (0,5)ln[(1+)/(1-)] dan ragam 1/(n-3). Jadi statistik ujinya adalah menghitung

)1)(1(

)1)(1(ln

2

3

1

1ln

2

1

1

1ln

2

1

2

3

0

0

0

0

r

rn

r

rnZ hitung

jika taraf nyata yang digunakan sebesar , maka keputusan akan menolak H0 jika:

a. Zhitung < Z, untuk H1 : < 0

b. Zhitung > Z, untuk H1 : > 0

c. |Zhitung| > Z/2, untuk H1 : 0

Secara intuisi, koefisien korelasi dapat ditafsirkan dalam dua cara, yaitu:

1. sebagai arah hubungan antara dua ukuran yang berarti mereka cenderung untuk

meningkat atau menurun bersama-sama (berhubungan secara positif), yang satu

meningkat yang lain menurun (berhubungan secara negatif), atau pergerakan mereka

terpisah (tidak berkorelasi).

2. sebagai suatu kekuatan asosiasi yang berarti bahwa jika nilai absolut korelasi bergerak

menjauhi nol maka dua ukuran berasosiasi semakin kuat.

Page 89: 73485202-Metode-Statistika.pdf

86

Contoh

Sebuah penelitian dilakukan oleh seorang pengusaha untuk menentukan hubungan antara biaya

pemasangan iklan per minggu dan hasil penjualan produknya (dalam jutaan rupiah). Data yang

diperoleh adalah sebagai berikut :

Biaya iklan 6 2 1 2 1 7 6 3 5 4 2 8 4 3 5

Penjualan 57 40 33 37 34 58 54 43 49 49 38 62 47 45 51

a. Tentukan persamaan garis regresinya

b. Benarkah pernyataan pengusaha mengatakan bahwa dengan peningkatan biaya/

iklan per juta akan meningkatkan penjualan sebesar 5 juta rupiah ?

c. Dugalah besarnya penjualan mingguan bila pengeluaran untuk biaya iklan

sebesar 4,5 juta !

d. Buatlah selang kepercayaan 95% bagi penjualan mingguan rata-rata jika biaya

iklannya sebesar 2,5 juta !

e. Buatlah selang kepercayaan 90% bagi nilai dugaan penjualan mingguan bila

biaya iklan yang dikeluarkan sebesar 3 juta.

f. Bagaimana kesesuaian model regresi yang anda peroleh ?

g. Hitunglah koefisien korelasinya.

Jawab:

No.Biaya

iklan (x)Penjualan

(y)x2 y2 xy

16 57

36 3249 342

22 40

4 1600 80

31 33

1 1089 33

42 37

4 1369 74

51 34

1 1156 34

67 58

49 3364 406

76 54

36 2916 324

83 43

9 1849 129

95 49

25 2401 245

104 49

16 2401 196

112 38

4 1444 76

128 62

64 3844 496

134 47

16 2209 188

143 45

9 2025 135

155 51

25 2601 255

59 697 299 33517 3013

Page 90: 73485202-Metode-Statistika.pdf

87

a.

06,41004

4072

)59()299(15

)697(59)3013(1522

11

2

1 11

n

ii

n

ii

n

i

n

ii

n

iiii

xxn

yxyxn

b

50,3015

5906,4

15

697

n

xb

n

yxbya

ii

Interpretasi : Jika tidak ada biaya yang dikeluarkan untuk iklan, maka rata-rata hasil penjualan

produk perminggu mencapai 30,5 juta rupiah. Jika biaya untuk iklan mengalami kenaikan satu juta, maka hasil penjualan akan

mengalami perubahan sebesar 4,06 juta rupiah.

b. pengujianHipotesis :H0 : = 5 vs H1 : ≠ 5Nilai = 5%, t(0,025,13) = 2,160

bb

hitungs

b

s

bt

50

dimana

n

ii

b

xx

s

1

2

2

)(

;2

ˆ

2

22

n

JbJs

xxyy dengan n

yn

iiyy

n

ii

yJ

2

1

1

2

dan n

xn

iixx

n

ii

xJ

2

1

1

2

04,213

)93,66()06,4(73,1129

93,6615

)59(29973,1129

15

)697(33517

22

22

s

JJ xxyy

Sehingga 18,093,66

04,2bs

Dengan demikian

22,518,0

506,4

hitungt

karena |thitung| > 2,160 maka tolak H0, artinya tidak benar pernyataan pengusaha yang

mengatakan bahwa dengan peningkatan biaya/ iklan per juta akan meningkatkan penjualan

sebesar 5 juta rupiah.

c.Penjualan = 30.5 + 4.06 Biaya iklan

= 30.5 + 4.06(4.5)

= 48.77

Page 91: 73485202-Metode-Statistika.pdf

88

d. alpha 5%untuk x = 2.5, maka y = 30.5 + 4.06(2.5) = 40.65

2ˆ)2(,2/0

2ˆ)2(,2/0 00

ˆˆynyyn stysty

dengan 20.004.293.66

)93.35.2(

15

1)(1 22

202

ˆ0

s

J

xx

ns

xx

y

SK 5% :40.65 -2.16(0.2) ≤ y ≤ 40.65 + 2.16(0.2)40.22 ≤ y ≤ 41.08

e. alpha 10%untuk x = 3, maka y = 30.5 + 4.06(3) = 42.68

2ˆ)2(,2/00

2ˆ)2(,2/0 0000

ˆˆyynyyn styysty

dengan 20.204.293.66

)93.33(

15

11

)(11

22

202

ˆ 00

ssxx

yy J

xx

n

SK 10% :42.68 -1.771(0.2) ≤ y0 ≤ 42.68 + 1.771(0.2)42.33 ≤ y ≤ 43.03

f. Kesesuaian modeluji apakah biaya iklan berpengaruh nyata

Keakuratan model :

%66,97%10073,1129

)93,66()06,4(1

22

2

222 x

J

Jb

s

sb

JKT

JKGR

yy

xx

y

x

g. Koefisien Korelasi

99,0977,02 Rr

Dengan menggunakan tabel sidik ragam alpha=5%:

Sumberkeragaman

Derajatbebas

Jumlah kuadrat(JK)

Kuadrat tengah(KT)

F-Hitung F-Tabel

Regresi 1 JKR=b2Jxx KTR=JKR/1 KTR/KTG F(1,n-2)

Galat n-2 JKG=JKT-JKR KTG=JKG/(n-2)Total n-1 JKT=Jyy

Sumberkeragaman

Derajatbebas

Jumlah kuadrat(JK)

Kuadrat tengah(KT)

F-Hitung F-Tabel

Regresi 1 1103.25 1103.25 540,81 F0,05(1,13)= 4,67Galat 13 26,48 2,04Total 14 1129,73

Page 92: 73485202-Metode-Statistika.pdf

89

10.7 Latihan Soal

Berikut ini disajikan data mengenai laju pertumbuhan sektor ekonomi dan sektor industri

(dalam %) dari tahun 1994 sampai dengan tahun 2003.

Tahun

1994 1995 1996 1997 1998 1999 2000 2001 2002 2003

Laju pertumbuhansektor ekonomi

2 4 7 3 6 5 6 8 7 7

Laju pertumbuhansektor industri

1 2 12 5 9 11 12 14 13 10

a. Menurut Anda, manakah yang tepat sebagai variabel X dan variabel Y ? Jelaskan alasannya !

b. Buatlah plot dari data di atas ! Bagaimana pola penyebarannya (linear atau tidak) ?

c. Dugalah persamaan regresi linear sederhana y = a + bx. Interpretasikan model dugaan yang

Anda peroleh.

d. Ujilah pada taraf nyata 5% apakah laju pertumbuhan sektor industri berpengaruh positif

terhadap laju pertumbuhan sektor ekonomi ?

e. Dugalah nilai koefisien korelasi antara kedua variabel tersebut !

f. Apakah antara kedua variabel tersebut mempunyai hubungan yang positif ? uji pada taraf

nyata 1%.

g. Hitunglah koefisien determinannya! Apakah model regresi yang Anda peroleh pada point

(c ) cukup akurat ? Jelaskan !

Page 93: 73485202-Metode-Statistika.pdf

90

DAFTAR PUSTAKA