veriyi dönüştürme, belirleme limiti

35
Veriyi Veriyi Dönüştürme, Dönüştürme, Belirleme Limiti Belirleme Limiti

Upload: rebekah-spence

Post on 01-Jan-2016

40 views

Category:

Documents


11 download

DESCRIPTION

Veriyi Dönüştürme, Belirleme Limiti. Veri Dönüştürme. Verinin orijinal birimi yerine aşağıdaki dönüşümler kullanılarak verinin daha kolay incelenmesi sağlanır. Log(Y) Karekök(y) 1/y Ya da y’nin diğer bir fonksiyonu Örneğin pH için –log([H + ]) kullanılır. Niçin? - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Veriyi Dönüştürme, Belirleme Limiti

Veriyi Dönüştürme, Veriyi Dönüştürme, Belirleme Limiti Belirleme Limiti

Page 2: Veriyi Dönüştürme, Belirleme Limiti

Veri DönüştürmeVeri Dönüştürme

Verinin orijinal birimi yerine aşağıdaki Verinin orijinal birimi yerine aşağıdaki dönüşümler kullanılarak verinin daha kolay dönüşümler kullanılarak verinin daha kolay incelenmesi sağlanır. incelenmesi sağlanır. – Log(Y)Log(Y)– Karekök(y)Karekök(y)– 1/y1/y– Ya da y’nin diğer bir fonksiyonuYa da y’nin diğer bir fonksiyonu

Örneğin pH için –log([HÖrneğin pH için –log([H++]) kullanılır. Niçin?]) kullanılır. Niçin? Bakterilerle ilgili araştırmalarda ise bakteri Bakterilerle ilgili araştırmalarda ise bakteri

sayısı N yerine logN kullanılır. Neden?sayısı N yerine logN kullanılır. Neden?

Page 3: Veriyi Dönüştürme, Belirleme Limiti

Neden Dönüşümler Kullanılıyor?Neden Dönüşümler Kullanılıyor?

1. İki değişkeni arasında düz doğrusal 1. İki değişkeni arasında düz doğrusal bir ilişki elde etmek için (Daha basit bir ilişki elde etmek için (Daha basit model kullanmak üzere)model kullanmak üzere)

t

MPN

10000

1000

100

10

1200

1000

800

600

400

100

0

t

Page 4: Veriyi Dönüştürme, Belirleme Limiti

Neden Dönüşümler Kullanılıyor?Neden Dönüşümler Kullanılıyor? 2.Orijinal verinin değişken varyansa 2.Orijinal verinin değişken varyansa

sahip olması. Regresyon kullanarak sahip olması. Regresyon kullanarak veriye eğilimi çizgisi uydururken bu veriye eğilimi çizgisi uydururken bu varyans değişikliği sorun yaratır. varyans değişikliği sorun yaratır.

y = veri değeri-model değerDoğruya en uzaktaki noktaların güçlü bir etkisi olur, çünkü regresyon bu mesafeyi en aza indirmek ister. Sonuçta doğrunun oluşmasında hassasiyetle ölçülmüş 1. noktadaki veri, t=3’te ölçülmüş veriden daha az etkili olur. Oysaki her ver noktasının eşit ağırlıkta olması tercih edilir. Yandaki örnekte log dönüşümü her veri noktası için değişken olmayan bir varyans(değişke) sağlar.

t

x

1 2 3

Page 5: Veriyi Dönüştürme, Belirleme Limiti

tt

logxx

Dönüştürme ile her veri doğrunun yerini belirlenmesinde hemen hemen eşit bir etkiye sahip olur. Logaritmik dönüşüm bu eşit ağırlığı sağlamak için kullanılır.

Page 6: Veriyi Dönüştürme, Belirleme Limiti

Önemli HususlarÖnemli Hususlar

Bazen dönüşüm iyi bir durumu kötü Bazen dönüşüm iyi bir durumu kötü bir duruma dönüştürebilir. Orijinal bir duruma dönüştürebilir. Orijinal verideki sabit varyans dönüşüm verideki sabit varyans dönüşüm sonrası değişken bir hale gelebilir. Bu sonrası değişken bir hale gelebilir. Bu durumda veriniz lineer hale gelmiş durumda veriniz lineer hale gelmiş olabilir ancak dönüşüm yararlı olmaz. olabilir ancak dönüşüm yararlı olmaz.

YY1/y dönüşümü özellikle varyansı 1/y dönüşümü özellikle varyansı kötü etkiler. Kullanılmadan önce kötü etkiler. Kullanılmadan önce mutlaka kontrol edilmelidir. mutlaka kontrol edilmelidir.

Page 7: Veriyi Dönüştürme, Belirleme Limiti

Önemli HususlarÖnemli Hususlar

Bazen ölçümler yedekli yapılmaz. Bazen ölçümler yedekli yapılmaz. Sadece tek ölçüm yapılır. Bu Sadece tek ölçüm yapılır. Bu durumda varyansın dönüşümden durumda varyansın dönüşümden nasıl etkilendiği bilinemez. Bu nasıl etkilendiği bilinemez. Bu nedenle her zaman tekrar ölçümler nedenle her zaman tekrar ölçümler yapmak iyi bir deney stratejisi için yapmak iyi bir deney stratejisi için kaçınılmazdır. kaçınılmazdır.

Page 8: Veriyi Dönüştürme, Belirleme Limiti

Varyans Sabitleme DönüşümleriVaryans Sabitleme Dönüşümleri

Yapılan deneyde ölçülen Yapılan deneyde ölçülen parametrenin değerleri aralığında parametrenin değerleri aralığında varyansın değişken olması: varyansın değişken olması:

1.1. Ölçümlerin seyreltme ya da çoklu Ölçümlerin seyreltme ya da çoklu hataları artırıcı aşamalardan hataları artırıcı aşamalardan oluşması (Ekstraksiyon)oluşması (Ekstraksiyon)

2.2. Log ölçekte okuyan bir alet Log ölçekte okuyan bir alet kullanmakkullanmak

3.3. Biyolojik sayımlarBiyolojik sayımlar

Page 9: Veriyi Dönüştürme, Belirleme Limiti

Tablo 7.1Tablo 7.1

DurumDurum y yerine kullanılan y yerine kullanılan NotNot

yy22 yy3/23/2y (y (22>y)>y)

yy1/21/2

1/y1/y

1/√y1/√y

Log(y) , log(y+c)Log(y) , log(y+c)

√√y (√y +c)y (√y +c)Bazı y>0 Bazı y>0

22>y>y arcsin√p arcsin√p p = oran p = oran ya da ya da yüzdeyüzde

Page 10: Veriyi Dönüştürme, Belirleme Limiti

Karekök ve logaritmik dönüşümlerde Karekök ve logaritmik dönüşümlerde büyük değerler küçüklere oranla büyük değerler küçüklere oranla daha az önemli hale gelir. daha az önemli hale gelir.

0, 1, 4 (4’ün önemi baskın)0, 1, 4 (4’ün önemi baskın) √√y dönüşümü ile 0,1,2’ye dönüşür. y dönüşümü ile 0,1,2’ye dönüşür.

Son terimin baskın rolü azalır. Son terimin baskın rolü azalır.

Page 11: Veriyi Dönüştürme, Belirleme Limiti

ÖrnekÖrnek

5 istasyondan toplanan (Tablo 7.2) 5 istasyondan toplanan (Tablo 7.2) plankton eş ölçüm numunelerinin plankton eş ölçüm numunelerinin ortalamaları ve varyansları tablo ortalamaları ve varyansları tablo B’de verilmiştir. Varyansın sabit B’de verilmiştir. Varyansın sabit olmadığı gözlemlenmiştir. Ortalama olmadığı gözlemlenmiştir. Ortalama değeri (y) arttıkça varyans (sdeğeri (y) arttıkça varyans (s22) ) orantılı olarak artmaktadır. Bu veri orantılı olarak artmaktadır. Bu veri için uygun dönüşüm hangisidir?için uygun dönüşüm hangisidir?

Page 12: Veriyi Dönüştürme, Belirleme Limiti

Örnek,ÇözümÖrnek,Çözüm

Yandaki şekilden Yandaki şekilden görüldüğü gibi görüldüğü gibi yy1/21/2olduğundan olduğundan Tablo 7.1’e göre Tablo 7.1’e göre karekök dönüşümü karekök dönüşümü uygundur. c = 0.5 uygundur. c = 0.5

y = Karekök(y+0.5)y = Karekök(y+0.5)

TABLO BTABLO B İstasyonİstasyon 11 22 33 44 55

Orijinal VeriOrijinal Veri yy

ss22

yy0.50.5

ss

0.850.85

0.770.77

0.920.92

0.880.88

2.052.05

1.841.84

1.431.43

1.361.36

3.903.90

3.673.67

1.971.97

1.921.92

4.604.60

4.784.78

2.142.14

2.192.19

9.259.25

7.577.57

3.043.04

2.752.75

y = 0.9036x + 0.098

R2 = 0.9826

0.00

0.50

1.00

1.50

2.00

2.50

3.00

0.00 1.00 2.00 3.00 4.00

y^0.5

s

Page 13: Veriyi Dönüştürme, Belirleme Limiti

Örnek,ÇözümÖrnek,Çözüm

Tablo 7.1’e göre karekök dönüşümünün Tablo 7.1’e göre karekök dönüşümünün uygun olduğunu gösterir. c = 0.5 y = uygun olduğunu gösterir. c = 0.5 y = Karekök(y+0.5)Karekök(y+0.5)

TABLO BTABLO B İstasyonİstasyon 11 22 33 44 55

Orijinal VeriOrijinal Veri yy

ss22yy

0.850.85

0.770.772.052.05

1.841.843.903.90

3.673.674.604.60

4.784.789.259.25

7.577.57

Dönüştürülmüş Dönüştürülmüş VeriVeri

xx

ss22xx

1.101.10

0.140.141.541.54

0.190.192.052.05

0.210.212.212.21

0.240.243.093.09

0.200.20

Page 14: Veriyi Dönüştürme, Belirleme Limiti

Güvenilirlik Aralığı ve DönüşümlerGüvenilirlik Aralığı ve Dönüşümler Örnek: 5 gözlemden oluşan bir örneklemin [95, 20, Örnek: 5 gözlemden oluşan bir örneklemin [95, 20,

74, 195, 71] ortalaması 91, varyansı 4140’dır. Hangi 74, 195, 71] ortalaması 91, varyansı 4140’dır. Hangi dönüşüm kullanılmalıdır?dönüşüm kullanılmalıdır?

Çözüm: sÇözüm: s22>y. Log dönüş uygulanabilir. x = logy, >y. Log dönüş uygulanabilir. x = logy, [1.977 1.301,1.869,2.290, 1.851]. [1.977 1.301,1.869,2.290, 1.851]. xxortort=1.86,s=1.86,s22

xx=0.128=0.128 v=5-1 =4,v=5-1 =4, =0.05/2 = 0.025 =0.05/2 = 0.025 t(4,0.025) = 2.776t(4,0.025) = 2.776 %95 lik güvenilirlik aralığı=%95 lik güvenilirlik aralığı=

5/1278.0776.285786.1/2 nstx x

1.41405< x<2.301

x’i orijinal ölçeğine dönüştürerek y’nin geometrik ortalamasını elde ederiz. yg = antilog(1.85756) = 72.09

25.94< y<200.29 (asimetrik)

Page 15: Veriyi Dönüştürme, Belirleme Limiti

ÖrnekÖrnek

Nasıl sunmalı? Nasıl sunmalı? Dönüştürülmüş birimde standart hata Dönüştürülmüş birimde standart hata

ve güvenilirlik aralığını, artı orijinal ve güvenilirlik aralığını, artı orijinal birimdeki artimetik ve geometrik birimdeki artimetik ve geometrik ortalamayı. Böylece okuyucu sonucun ortalamayı. Böylece okuyucu sonucun hem istatistiksel önemini hem de hem istatistiksel önemini hem de orijinal birimdeki uygulamaya yönelik orijinal birimdeki uygulamaya yönelik önemini değerlendirebilir. önemini değerlendirebilir.

1.41405< x<2.301

25.94< y<200.29 (asimetrik)

Page 16: Veriyi Dönüştürme, Belirleme Limiti

Box-Cox Kuvvet DönüşümleriBox-Cox Kuvvet Dönüşümleri Box ve Cox (1964) Box ve Cox (1964)

tarafından geliştirilmiş, tarafından geliştirilmiş, hem varyansı sabitleyen hem varyansı sabitleyen hem de normallik şartını hem de normallik şartını sağlayan dönüşümlerdir. sağlayan dönüşümlerdir.

Dönüştürülmüş YDönüştürülmüş Yii

orijinal değişken yorijinal değişken yii’den ’den yandaki eşitliğe göre yandaki eşitliğe göre oluşturulur.oluşturulur.

Bu yöntem tüm Bu yöntem tüm istatistiksel modeller ve istatistiksel modeller ve her çeşit dönüşüm için her çeşit dönüşüm için kullanılabilir. kullanılabilir.

1)(

1)(

)ln(

1

g

ii

g

ii

y

yY

y

yY

N

y

g

N

ii

y 1

)ln(

exp

≠ 0

= 0

yygg : geometrik ortalama : geometrik ortalama

Page 17: Veriyi Dönüştürme, Belirleme Limiti

Box-Cox Kuvvet DönüşümleriBox-Cox Kuvvet Dönüşümleri

= 0 logaritmik dönüşüm= 0 logaritmik dönüşüm = -1 ters dönüşüm= -1 ters dönüşüm = 1/2 karekök dönüşüm= 1/2 karekök dönüşüm = 1 dönüşüm yok= 1 dönüşüm yok

1)(

1)(

)ln(

1

g

ii

g

ii

y

yY

y

yY ≠ 0

= 0

Page 18: Veriyi Dönüştürme, Belirleme Limiti

Örnek 7.5Örnek 7.5

Kitaptaki örnek 7.5’i inceleyin. Kitaptaki örnek 7.5’i inceleyin. Şekil 7.4’ü siz de oluşturun. Şekil 7.4’ü siz de oluşturun.

Page 19: Veriyi Dönüştürme, Belirleme Limiti

Belirleme LimitiBelirleme Limiti Verilen bir numunede özel bir ölçüm yöntemi Verilen bir numunede özel bir ölçüm yöntemi

kullanarak güvenilirlikle belirlenebilen bir kullanarak güvenilirlikle belirlenebilen bir maddenin en küçük miktarı ya da maddenin en küçük miktarı ya da konsantrasyonu.konsantrasyonu.

Ancak kimyasal bir kavramdan çok istatistiksel bir Ancak kimyasal bir kavramdan çok istatistiksel bir kavram. Hassas bir istatistiksel tanımını kavram. Hassas bir istatistiksel tanımını yapmadan bilimsel olarak savunulması mümkün yapmadan bilimsel olarak savunulması mümkün bir bulunma sınırı tanımlanamaz. Bu tip bir bir bulunma sınırı tanımlanamaz. Bu tip bir dayanağı olmadan bir şeyin olup olmadığı ya da dayanağı olmadan bir şeyin olup olmadığı ya da ölçümlerin güvenilirliğinden söz edilemez. Belli ölçümlerin güvenilirliğinden söz edilemez. Belli başlı kurallar bu ölçüm hatasının belirlenmesinde başlı kurallar bu ölçüm hatasının belirlenmesinde yardımcı olmalıdır. yardımcı olmalıdır.

Page 20: Veriyi Dönüştürme, Belirleme Limiti

Belirleme SınırıBelirleme Sınırı

Aletin belirleme sınırı IDL sinyal ile gürültü Aletin belirleme sınırı IDL sinyal ile gürültü arasındaki farkı verir. Eğer ölçüm yöntemi arasındaki farkı verir. Eğer ölçüm yöntemi bir cihazla tek adımlık bir ölçümden bir cihazla tek adımlık bir ölçümden oluşuyorsa sinyalin gürültüye oranı oluşuyorsa sinyalin gürültüye oranı belirleme sınırının metodu ile ilgilidir. belirleme sınırının metodu ile ilgilidir.

Alet hatalarını ve uygulanan tüm Alet hatalarını ve uygulanan tüm prosedürleri içine alan belirleme sınırı prosedürleri içine alan belirleme sınırı metodun belirleme sınırı (MDL) olarak metodun belirleme sınırı (MDL) olarak bilinir. bilinir.

Page 21: Veriyi Dönüştürme, Belirleme Limiti

MDLMDL

x SeyreltmeÖzütlemeKurutma

CİHAZ---

Ölçüm Sonucu

Numune

Metotun Belirleme Sınırı

Cihazın Belirleme Sınırı

Page 22: Veriyi Dönüştürme, Belirleme Limiti

EPA’nın YöntemiEPA’nın Yöntemi Bir maddenin ölçülebilecek ve %99 güvenilirlikle Bir maddenin ölçülebilecek ve %99 güvenilirlikle

rapor edilebilecek en düşük konsantrasyon değerirapor edilebilecek en düşük konsantrasyon değeri Numune Sayısı: Aynı konsantrasyonda 7 numune Numune Sayısı: Aynı konsantrasyonda 7 numune

(minimum)(minimum)

n

i xxn

s1

22 )(1

1

DL=tv,=0.01s

n=7 t6,0.01=3.143 (Excel’de =tters(0.02;6)

DL=3.143s

Page 23: Veriyi Dönüştürme, Belirleme Limiti

EPA YöntemiEPA Yöntemi

Ancak bu metot konsantrasyonun büyüklüğü ile değişiklik gösterebilir. Bunu kontrol etmek üzere daha farklı bir konsantrasyonda 7 yeni kopya örnek alınır. Eğer s1

2 ve s22

arasında F istatistiğine göre anlamlı bir fark yoksa

681.2

12

266

66

01.0,12

2222

21

22

212 212121

t

sssssss b

MBL = 2.681sb

F istatistiğine göre iki değişke arasında fark olup olmadığını anlamak için her iki örnekleme ait değişkelerin oranının, F kritik değerinden ( = 0,05 için) küçük olup olmadığına bakılır. Excel’de =fters(0,05;v1;v2)

Page 24: Veriyi Dönüştürme, Belirleme Limiti

ÖrnekÖrnekSıfırSıfır 1.25 1.25 g/lg/l 2.50 2.50 g/lg/l 5.0 5.0 g/lg/l 10.0 10.0 g/lg/l

2.52.5 2.82.8 4.54.5 3.93.9 12.212.2

3.03.0 2.72.7 3.73.7 5.05.0 13.813.8

2.22.2 3,43,4 3.83.8 5.45.4 9.99.9

2.22.2 2.42.4 4.44.4 4.94.9 9.59.5

3.13.1 3.03.0 5.45.4 6.26.2 8.98.9

3.73.7 3.93.9

4.64.6 4.14.1

3.13.1 3.73.7

3.63.6 3.03.0

3.13.1 4.54.5

4.34.3 4.84.8

4.04.0 3.33.3

1.71.7 4.74.7

2.22.2 4.44.4

Bir laboratuardan farklı Bir laboratuardan farklı konsantrasyondaki kurşun konsantrasyondaki kurşun ölçümleri tabloda ölçümleri tabloda verilmiştir. Metodun verilmiştir. Metodun belirleme sınırını bulun. belirleme sınırını bulun.

Page 25: Veriyi Dönüştürme, Belirleme Limiti

ÖrnekÖrnek Verilen verilerden EPA Verilen verilerden EPA

yöntemine göre yöntemine göre metodun belirleme metodun belirleme sınırını bulmak için en az sınırını bulmak için en az 7 ölçüm olan 1.25 ve 2.5 7 ölçüm olan 1.25 ve 2.5 g/l’lik ölçümler seçilir. g/l’lik ölçümler seçilir.

Farklı Farklı konsantrasyonlarda konsantrasyonlarda değişkenindeğişkenin

1.25 1.25 g/lg/l

2.52.5g/g/ll

yy¯̄ 3.073.07 4.164.16

ss22 0.5480.548 0.4070.407

ss 0.7460.746 0.6380.638

nn 2020 1414

k

k

FF

F

ssF

47,2

35,1407,0

548,0/ 22

21 Buna göre iki varyans

değeri arasında anlamlı bir fark yok.

Page 26: Veriyi Dönüştürme, Belirleme Limiti

ÖrnekÖrnek1.25 1.25 g/lg/l 2.52.5g/lg/l

yy¯̄ 3.073.07 4.164.16

ss22 0.5480.548 0.4070.407

ss 0.7460.746 0.6380.638

nn 2020 1414

45.2

/701.0

491.01319

)407.0(13)548.0(19

01.0,32

2

t

lgs

s

b

b

MBL = 2.45sb

MBL =1.72 g/l

Page 27: Veriyi Dönüştürme, Belirleme Limiti

Alternatif MetotAlternatif Metot

Pallesen’in yöntemi (1985), ABD’de Pallesen’in yöntemi (1985), ABD’de güvenilirliği onaylanmış laboratuarlar için güvenilirliği onaylanmış laboratuarlar için resmi olarak kabul görmüş bir yöntem resmi olarak kabul görmüş bir yöntem olmamakla beraber, ölçümlerdeki olmamakla beraber, ölçümlerdeki değişkenin kaynaklarını göstermesi değişkenin kaynaklarını göstermesi bakımından önemlidir. bakımından önemlidir.

Pallesen’in belirleme limit tanımı: Pallesen’in belirleme limit tanımı: – Kör numune ölçümlerinde bulunan rassal

arka plan gürültüsünün üzerinde güvenilirlikle belirlenebilen en küçük değer.

Page 28: Veriyi Dönüştürme, Belirleme Limiti

Pallesen MetoduPallesen Metodu Pallesen’in yönteminde ölçümden Pallesen’in yönteminde ölçümden

kaynaklanan değişke ile arkaplan kaynaklanan değişke ile arkaplan gürültüsünden kaynaklanan değişke ayrı gürültüsünden kaynaklanan değişke ayrı ayrı ele alınırayrı ele alınır

yi=η + ei=η + ai + bi ai rassal ölçüm hatası bi arkaplan gürültü seviyesi ei toplam rassal hata = ai + bi Her iki hatanın da rassal ve ortalaması 0

olan normal bir dağılım gösterdiği varsayılır.

Page 29: Veriyi Dönüştürme, Belirleme Limiti

Pallesen MetoduPallesen Metodu Arka plan gürültüsü (bArka plan gürültüsü (bii) kör ) kör

numunelerde bile numunelerde bile vardır ve sabit bir değişkeye sabittir. Ölçüm hatası (ai) ise ölçülen sinyalin (η) büyüklüğüyle orantılıdır.

σa = κη Herhangi bir ölçümün toplam hata

değişkesi bu durumda:

Page 30: Veriyi Dönüştürme, Belirleme Limiti

Pallesen MetoduPallesen Metodu

2’ (y2) ye karşılık e2 (se

2) çizildiğinde doğrunun kesim noktası sb

2’yi eğimi de ’yı verir.

Page 31: Veriyi Dönüştürme, Belirleme Limiti

Belirleme limiti bu durumda y’nin 0 olmadığı hipotezinin belli bir güvenilirlikle reddedilemeyeceği en küçük değerdir.

Eğer y > MDL ise η = 0 olması pek mümkün değildir ve buradan ölçülmek istenen analit miktarının belirlenebildiği sonucu çıkar.

Ancak eğer y < MDL ise analitin belirlenebildiğini söyleyemeyiz. y’nin , içinde analit bulunmadığı durumda, ortalaması 0 ve bir varyans ile normal dağılım gösterdiği varsayılırsa MDL arka plan gürültüsünün katı şeklinde ifade edilebilir:

MDL = zσb

Page 32: Veriyi Dönüştürme, Belirleme Limiti

z = 3.00 ( = 0.0013) kullanılırsa, y > MDL gözlemlenirse bu η ‘nin

%99,87 güvenilirlik seviyesinde 0 olmadığı anlamına gelir.

Page 33: Veriyi Dönüştürme, Belirleme Limiti

Buna göre Buna göre

lgxsMDL

ss

b

bb

/6.152.033

13.0016.0

52.0267.02

2

MDLEPA = 1.7 g/l

MDLPallesen = 1.6 g/l

Page 34: Veriyi Dönüştürme, Belirleme Limiti

SoruSoru

EPA yöntemi ile Pallesen’in yöntemi EPA yöntemi ile Pallesen’in yöntemi arasındaki farklar nelerdir?arasındaki farklar nelerdir?

Page 35: Veriyi Dönüştürme, Belirleme Limiti

FarklarFarklar