stat* - elte

37
Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl

Upload: others

Post on 21-Feb-2022

13 views

Category:

Documents


0 download

TRANSCRIPT

Sta

tiszt

ika

Elıadások letölthetık a

http://w

ww.cs.elte.hu/~

arato/stat*.pdf

címrıl

Kon

fiden

cia

inte

rval

lum

�Def.: 1-α

megbízhatóságú konfidencia

intervallum: Olyan intervallum, mely

legalább 1-α

valószínőséggel tartalm

azza a

keresett param

étert.

12

((

)(

))1

,P

TT

ϑϑ

αϑ

<<

≥−

∀∈

Θξ

ξ

Kon

fiden

cia

inte

rval

lum

nor

mál

is

elos

zlás

vár

ható

ért

ékér

e (is

mer

t sz

órás

ese

tén)

2

1

11

22

1 1

,...

,~

(,

),is

mer

t,(

)

1,

1,

1

ny

Nm

uy

Pu

mu

nn

Pm

un

Pm

un

αα

α α

ξξ

σσ

σσ

ξξ

α

σξ

α

σξ

α

−−

− −

Φ=

−<

<+

=−

>−

=−

<+

=−

Kon

fiden

cia

inte

rval

lum

nor

mál

is

elos

zlás

vár

ható

ért

ékér

e (is

mer

etle

n sz

órás

ese

tén)

�Ha a szórás nem

ism

ert, becsüljük

�Tétel (biz. nélkül): norm

ális eloszlású

minta esetén a m

intaátlag és a

tapasztalati szórás független

�n-1 szabadságfokú t (Student) eloszlás:

()

01

2

01

22

2

12

,,

,...,

~(0

,1),

gg

etle

nek

~..

./(

1)

n

n

n

XX

XX

N

Xt

XX

Xn

++

+−

Kon

fiden

cia

inte

rval

lum

nor

mál

is

elos

zlás

vár

ható

ért

ékér

e (is

mer

etle

n sz

órás

ese

tén)

(fo

lyt.)

()

()

()

()

22

22

11

12

11,

1,1

1,1

22

1,1

1,1

,...,

~(

,),

...

/(

1)

~

()

1,

1,

1

nn

n

nn

y

nn

n n

Nm

n

nm

t

Pt

ty

Pt

mt

nn

Pm

tn

Pm

tn

αα

α α

ξξ

σσ

ξξ

ξξ

ξ σ

σσ

ξξ

α

σξ

α

σξ

α

−−

−−

−−

−−

−−

=−

++

−−

− <=

−<

<+

=−

>−

=−

<+

=−

ɶ

ɶ

ɶɶ

ɶ ɶ

Pél

da (

keny

ér. f

olyt

.)

�Tegyük fel most, hogy nem

ism

erjük

Gyorskenyér Kft kenyereinek szórását. Az

átlag 990 g volt.

�Ismert 10 szórásnál 991,6 g volt a 95%-

os megbízhatóságú felsı konfidencia

határ.

�Amennyiben a korrigált tapasztalati

szórás is 10, akkor ez a határ csak kis

mértékben változik (991,8 g).

�Azonban 50-es korrigált tapasztalati

szórásnál ez az érték 999 g-ra változik.

ués

teg

yütth

atók

öss

zeha

sonl

ítása

15%

1,64

((1

,64)

95%

)u

−=

Φ=

1,1

5%

nt−

1,65

1000

1,66

100

1,68

50

1,73

20

1,83

10

2,13

5

2,35

4

2,92

3

6,31

2

n

Mindenhol azt olvasni, hogy a napi/heti/havibad

beat nem

„számít”,

sokkal fontosabb a hosszútáv, amikor a matem

atikai esély érvényesül.

Jelenlegi eredményeink mennyire reálisak? Mikor ésszerőbb inkább

felhagyni a pókerrel? Mikor lehetünk optimisták? Mekkora játékszám

szükséges ennek m

egállapítására?

Most bem

utatok egy idevágó táblázatot, amely 95% pontossággal

megadja a jelenlegi játékszámod és nyerési %

-odalapján, hogy a jelen

eredményeid m

ennyire lehetnek valósak. (Pl. Ha 60%-os vagy 100 játék

után, akkor a valós nyerési százalékod igen nagy (95%-os)

valószínőséggel 50,4-69,6% között van.) Igaz, csak három -50-55-

60 %

-os-mutatóval dolgozik, de attól még igencsak hasznos a jövıbeni

tervek m

egalapozottságához.

http://w

ww.pokerakadem

ia.com

/poker_blogok/hideyoshi/mi_szam

it_hosszutavnak_a_hu_sng_ban/

A táblázat helyességét

nem

ellenıriztem

! /AM/

After polling 1000 eligible voters, the Star-Tribune

New

spaper reported that 55% of Americans would

vote for James Bean and 45% for John F Daniels

+/-

3%.

Hip

otéz

isvi

zsgá

lat

�H0nullhipotézis(jelezni akarjuk, ha nem

igaz)

�H1ellenhipotézis

�Gyakran param

éterekkel fogalmazzuk

meg:

00

11

01

: :

H H

ϑ ϑ

∈Θ

∈Θ

ΘΘ

Pél

dák

�Igaz-e, hogy 0,5 valószínőséggel születik

fiúgyerm

ek?

�H0: 0,5 valószínőséggel születik

fiúgyerm

ek�H1: nem

0,5 valószínőséggel születik

fiúgyerm

ek

0 1

:0,5

:0,5

Hp

Hp

= ≠

Pél

dák

(fol

yt.)

�Mi lehet egy vezetı által okozott károk

számának eloszlása?

�H0: a kárszám Poissoneloszlású

�H1: a kárszám nem

Poissoneloszlású

148006

01

15

31

211

1966

16267

129524

Veze-

tık

száma

Össze-

sen

>7

76

54

32

10

Kár-

szám

Ki t

anul

jobb

an?

2,1

2,7

2,1

Átla

g

9711

86Ö

ssze

sen

102

85

112

94

132

113

121

112

514

471

Öss

zese

nNı

Fér

fiJe

gy

2009. január 5-ei vizsga

H0: A nık jobban tanulnak

Lehe

tség

es h

ibák

�Elsıfajú hiba: H

0igaz, de elutasítjuk

�Másodfajú hiba: H

0ham

is, de

elfogadjuk

�Döntésünknek a m

egfigyelésektıl

kell függnie.

�Mintateret 2 részre osztjuk:

elfogadási és elutasítási

tartományra.

Lehe

tség

es h

ibák

�Elsıfajú hiba: H0igaz, de elutasítjuk

�Másodfajú hiba: H0ham

is, de elfogadjuk

Hel

yes

dönt

ésE

lsıfa

júhi

baE

luta

sítju

ka

nullh

ipot

ézis

t

Más

odfa

júhi

baH

elye

sdö

ntés

Elfo

gadj

uka

nullh

ipot

ézis

tD

önté

s:

A n

ullh

ipot

ézis

ham

isA

nul

lhip

otéz

isig

az

Akt

uális

hely

zet

Ala

pfog

alm

ak

�Emlékeztetı: X

mintatér: a m

inta lehetséges

értékeinek halmaza.

�X

= X

eU X

k

�Xk: azon lehetséges értékek halmaza, amelyek

megfigyelése esetén elutasítjuk a nullhipotézist.

�Gyakran statisztika segítségével határozzuk meg:

1,

()

0,

k k

T∈

=

xX

xx

X

Elsıfa

jú h

iba

való

színősé

ge

()

()

0

0 a

pró

ba

terj

edel

me,

ha

min

den

-r

a

X

a p

rób

a sz

ignif

ikan

cias

zin

tje

(más

kép

p:

a p

róba

pon

tos

terj

edel

me)

,

sup

X

k

k

P

P

ϑ

ϑϑα

ϑ

α

α

α∈

Θ

∈Θ

∈≤

∈=

ξ

ξ

Pél

da (

egye

tlen

meg

figye

lés)

H0: a megfigyelés N(4,1) eloszlású

Pél

da (

sörö

k m

egkü

lönb

özte

tése

)

�Ki tudják-e választani a különbözı sört?

�24 emberen kísérleteztek.

01

11

:,

:3

3H

pH

p=

>

Az

elos

zlás

H0

eset

én

Krit

ikus

tart

omán

y m

egvá

lasz

tása

Más

odfa

jú h

iba

való

színősé

ge

()

1X

,e

P ϑϑ

∈∈

Θξ

Pél

da (

sörö

s)

�p=0.5 esetén a

másodfajú hiba

valószínősége

Erı

függ

vény

()

()

1

A p

róba

erıfü

ggvén

ye

()=

X1-

X,

ke

PP

ϑϑ

βϑ

ϑ∈

=∈

∈Θ

ξξ

U-p

róba

2

1

00

10

10

10

0

0

01,.

..,

~(

,),

ism

eret

len

, is

mer

t.

: :(k

étold

ali

elle

nh

ipoté

zis)

':(e

gyold

ali

elle

nh

ipoté

zis)

'':(e

gyo

ldal

i el

lenh

ipo

tézi

s)

~(0

,1)

~,1

nN

mm

Hm

m

Hm

m

Hm

m

Hm

m

mU

n

HU

N

mm

HU

Nn

ξξ

σσ

ξ

σ

σ

= ≠ < >

−= ⇒

()

()

()

()

()

()

()

()

()

00

0

12

11

12

22

12

0

11

11

22

22

pró

ba

(két

old

ali

elle

nhip

oté

zis)

()

X: X

1

11

11

.2

2

()

X

11

1

y

k

mk

m

mk

m

mm

m

U

uy

xm

nu

PP

Uu

uu

mP

PU

u

mm

mP

uU

uP

un

nu

P

α

αα

α

α

αα

αα

σ

αα

α

β

ξ

σσ

−−

−−

−−

Φ=

=≥

∈=

≥=

−Φ

−=

=−

−+

−−

=

=∈

=≥

=

−−

−−

<<

=−

−<

+<

=

−−x

ξ

ξ

00

11

22

00

01

12

2

11,

n

mm

mm

mu

nn

un

mm

mm

un

un

mm

αα

αα

ξ

σσ

σ

σσ

−−

→∞

−−

−−

−−

<<

−=

−−

−Φ

−+

Φ−

Vél

etle

níte

ttpr

óba

�Eddig adott m

egfigyelés esetén

egyértelmő volt a döntésünk:

1,

()

0,

k k

T∈

=

xX

xx

X

Véletlenítettpróba esetén sorsolhatunk

is:

1,

ha

()

()

, ha

()

0,

ha

()

Tc

Tc

Tc

γ

>

Ψ=

=

<

x

xx x

Elsıfa

jú h

iba

való

színősé

ge

véle

tlení

tett

prób

a es

etén

()

()

()

()

()

0

0

0

-ra

az e

lsı

fajú

hib

a val

ósz

ínő

sége:

()

()

()

a p

rób

a te

rjed

elm

e, h

a m

inden

-r

a

()

a p

rób

a sz

ign

ifik

anci

aszi

ntj

e

(más

kép

p:

a pró

ba

pon

tos

terj

edel

me)

,

sup

()

PT

cP

Tc

E

E

E

ϑϑ

ϑ

ϑ

ϑϑϑ

γψ

αϑ

ψα

α

ψα

∈Θ∈

Θ

>+

==

∈Θ

=

ξξ

ξ

ξ

ξ

Lege

rıse

bb p

róba

egy

szerő h

ipot

ézis

es

etéb

en

()

()

()

()

()

00

0

11

01

01

Eg

ysz

erő

és

:1

.

a le

gerı

sebb

-t

erje

del

mő p

róba,

ha:

()

()

()

,

továb

min

den

más

-t

erje

del

' p

róbár

a, a

nn

ak

más

odfa

jú h

ibav

aló

színő

sége

nag

yobb

:

1(

)1

'()

.

HH

PT

cP

Tc

E

EE

ϑϑ

ϑ

ϑϑ

ψα γ

ψα

αψ

ψψ

Θ=

Θ=

>+

==

−≤

ξξ

ξ

ξξ

A le

gerı

sebb

pró

ba

�A legegyszerőbb eset: H

0és H

1is egyszerő

(egyelemő). A

valószínőséghányados

(vh.) próba:

�Állítás (Neyman-Pearson

lemma): a vh. próba

legerısebb a saját

terjedelmével. Minden

0<α

<1-hez létezik ilyen

terjedelmővh. próba.

Minden legerısebb próba

ilyen alakú.

1 0 1 0 1 0

()

1(

)

()

()

()

()

0(

)

Lc

L LT

cL L

cL

γ>

=

=

<

x x xx

x x x

Pró

bák

a no

rmál

is e

losz

lás

várh

ató

érté

kére

: t p

róba

.

�H0: m=m

0, H1m

≠m

0. Ha nem

ism

ert a szórás (t-

próba):

�ahol

�Kritikus tartomány: |t|>t 1-α/2,n-1.(H

0esetén a

próbastatisztika n-1 szabadságfokú, t-eloszlású.)

�Ha egyoldali az ellenhipotézis, akkor a kritikus

tartomány t>t 1-α, n-1 (m>m

0), illetve t<-t

1-α, n-1

alakú(m

<m

0). Ezekis legerısebb próbák!

σ̂0

mX

nt

−= (

))1

/(ˆ

1

2

−−

=∑ =

nX

Xn i

Meg

jegy

zése

k

�A kétoldali esetre kapott próba nem

a legerısebb (ilyenkor nincs is

ilyen).

�Ha a minta elemszám

a nagy, a t-

próba helyett az u-próbais

használható (ekkor még a norm

ális

eloszlásúságra sincs szükség a

centrális határeloszlás tétel miatt).

Két

olda

li pr

óbák

és

konf

iden

cia

inte

rval

lum

ok

�A norm

ális eloszlásnál a várható értékre

vonatkozó α

terjedelmőpróbánál láttuk,

hogy a H0: m=m

0hipotézist a H

1: m

≠m

0hipotézissel szemben pontosan akkkor

fogadjuk el, ha m

0benne van az 1-

αmegbízhatóságúkonfidencia

intervallumban.

Két

min

tás

eset

: pár

osíto

tt m

egfig

yelé

sek

�Példa: Van-e különbség Budapest és

Cegléd napi átlaghımérséklete között?

H0: m

1=m

2a nullhipotézis.

�Ha ugyanazon napokról van

megfigyelésünk mindkét helyen: nem

függetlenek a m

inták. Ekkor a párok

tagjai közötti különbséget vizsgálva, az

elızı egym

intás esetre vezethetı vissza a

feladat. H0*: m=0 , H

1*:m

≠0 az új

hipotézisek .

Két

min

tás

eset

: füg

getle

nm

intá

k

∑∑

−+

+

−+

=−

+2

22

)(

)(

)2

(

YY

XX

YX

mn

mn

nm

t

ii

mnHa ism

ert a szórás: (Xn elemő, σ1szórású,

Ym elemő, σ2szórású), alkalmazható a kétm

intás u-próba

mn

YX

u/

/2

2

2

σ+−

=

Kritikus tartomány: m

int az egym

intás esetben

Ha ism

eretlenek, de azonosak a szórások: