stat* - elte
TRANSCRIPT
Kon
fiden
cia
inte
rval
lum
�Def.: 1-α
megbízhatóságú konfidencia
intervallum: Olyan intervallum, mely
legalább 1-α
valószínőséggel tartalm
azza a
keresett param
étert.
12
((
)(
))1
,P
TT
ϑϑ
αϑ
<<
≥−
∀∈
Θξ
ξ
Kon
fiden
cia
inte
rval
lum
nor
mál
is
elos
zlás
vár
ható
ért
ékér
e (is
mer
t sz
órás
ese
tén)
2
1
11
22
1 1
,...
,~
(,
),is
mer
t,(
)
1,
1,
1
ny
Nm
uy
Pu
mu
nn
Pm
un
Pm
un
αα
α α
ξξ
σσ
σσ
ξξ
α
σξ
α
σξ
α
−−
− −
Φ=
⇒
−<
<+
=−
>−
=−
<+
=−
Kon
fiden
cia
inte
rval
lum
nor
mál
is
elos
zlás
vár
ható
ért
ékér
e (is
mer
etle
n sz
órás
ese
tén)
�Ha a szórás nem
ism
ert, becsüljük
�Tétel (biz. nélkül): norm
ális eloszlású
minta esetén a m
intaátlag és a
tapasztalati szórás független
�n-1 szabadságfokú t (Student) eloszlás:
()
01
2
01
22
2
12
,,
,...,
~(0
,1),
fü
gg
etle
nek
~..
./(
1)
n
n
n
XX
XX
N
Xt
XX
Xn
−
++
+−
Kon
fiden
cia
inte
rval
lum
nor
mál
is
elos
zlás
vár
ható
ért
ékér
e (is
mer
etle
n sz
órás
ese
tén)
(fo
lyt.)
()
()
()
()
22
22
11
12
11,
1,1
1,1
22
1,1
1,1
,...,
~(
,),
...
/(
1)
~
()
1,
1,
1
nn
n
nn
y
nn
n n
Nm
n
nm
t
Pt
ty
Pt
mt
nn
Pm
tn
Pm
tn
αα
α α
ξξ
σσ
ξξ
ξξ
ξ σ
σσ
ξξ
α
σξ
α
σξ
α
−
−−
−−
−−
−−
−−
=−
++
−−
⇒
− <=
−<
<+
=−
>−
=−
<+
=−
ɶ
ɶ
ɶɶ
ɶ ɶ
Pél
da (
keny
ér. f
olyt
.)
�Tegyük fel most, hogy nem
ism
erjük
Gyorskenyér Kft kenyereinek szórását. Az
átlag 990 g volt.
�Ismert 10 szórásnál 991,6 g volt a 95%-
os megbízhatóságú felsı konfidencia
határ.
�Amennyiben a korrigált tapasztalati
szórás is 10, akkor ez a határ csak kis
mértékben változik (991,8 g).
�Azonban 50-es korrigált tapasztalati
szórásnál ez az érték 999 g-ra változik.
ués
teg
yütth
atók
öss
zeha
sonl
ítása
15%
1,64
((1
,64)
95%
)u
−=
Φ=
1,1
5%
nt−
−
1,65
1000
1,66
100
1,68
50
1,73
20
1,83
10
2,13
5
2,35
4
2,92
3
6,31
2
n
Mindenhol azt olvasni, hogy a napi/heti/havibad
beat nem
„számít”,
sokkal fontosabb a hosszútáv, amikor a matem
atikai esély érvényesül.
Jelenlegi eredményeink mennyire reálisak? Mikor ésszerőbb inkább
felhagyni a pókerrel? Mikor lehetünk optimisták? Mekkora játékszám
szükséges ennek m
egállapítására?
Most bem
utatok egy idevágó táblázatot, amely 95% pontossággal
megadja a jelenlegi játékszámod és nyerési %
-odalapján, hogy a jelen
eredményeid m
ennyire lehetnek valósak. (Pl. Ha 60%-os vagy 100 játék
után, akkor a valós nyerési százalékod igen nagy (95%-os)
valószínőséggel 50,4-69,6% között van.) Igaz, csak három -50-55-
60 %
-os-mutatóval dolgozik, de attól még igencsak hasznos a jövıbeni
tervek m
egalapozottságához.
http://w
ww.pokerakadem
ia.com
/poker_blogok/hideyoshi/mi_szam
it_hosszutavnak_a_hu_sng_ban/
A táblázat helyességét
nem
ellenıriztem
! /AM/
After polling 1000 eligible voters, the Star-Tribune
New
spaper reported that 55% of Americans would
vote for James Bean and 45% for John F Daniels
+/-
3%.
Hip
otéz
isvi
zsgá
lat
�H0nullhipotézis(jelezni akarjuk, ha nem
igaz)
�H1ellenhipotézis
�Gyakran param
éterekkel fogalmazzuk
meg:
00
11
01
: :
H H
ϑ ϑ
∈Θ
∈Θ
ΘΘ
=Θ
∪
Pél
dák
�Igaz-e, hogy 0,5 valószínőséggel születik
fiúgyerm
ek?
�H0: 0,5 valószínőséggel születik
fiúgyerm
ek�H1: nem
0,5 valószínőséggel születik
fiúgyerm
ek
0 1
:0,5
:0,5
Hp
Hp
= ≠
Pél
dák
(fol
yt.)
�Mi lehet egy vezetı által okozott károk
számának eloszlása?
�H0: a kárszám Poissoneloszlású
�H1: a kárszám nem
Poissoneloszlású
148006
01
15
31
211
1966
16267
129524
Veze-
tık
száma
Össze-
sen
>7
76
54
32
10
Kár-
szám
Ki t
anul
jobb
an?
2,1
2,7
2,1
Átla
g
9711
86Ö
ssze
sen
102
85
112
94
132
113
121
112
514
471
Öss
zese
nNı
Fér
fiJe
gy
2009. január 5-ei vizsga
H0: A nık jobban tanulnak
Lehe
tség
es h
ibák
�Elsıfajú hiba: H
0igaz, de elutasítjuk
�Másodfajú hiba: H
0ham
is, de
elfogadjuk
�Döntésünknek a m
egfigyelésektıl
kell függnie.
�Mintateret 2 részre osztjuk:
elfogadási és elutasítási
tartományra.
Lehe
tség
es h
ibák
�Elsıfajú hiba: H0igaz, de elutasítjuk
�Másodfajú hiba: H0ham
is, de elfogadjuk
Hel
yes
dönt
ésE
lsıfa
júhi
baE
luta
sítju
ka
nullh
ipot
ézis
t
Más
odfa
júhi
baH
elye
sdö
ntés
Elfo
gadj
uka
nullh
ipot
ézis
tD
önté
s:
A n
ullh
ipot
ézis
ham
isA
nul
lhip
otéz
isig
az
Akt
uális
hely
zet
Ala
pfog
alm
ak
�Emlékeztetı: X
mintatér: a m
inta lehetséges
értékeinek halmaza.
�X
= X
eU X
k
�Xk: azon lehetséges értékek halmaza, amelyek
megfigyelése esetén elutasítjuk a nullhipotézist.
�Gyakran statisztika segítségével határozzuk meg:
1,
()
0,
k k
T∈
=
∉
xX
xx
X
Elsıfa
jú h
iba
való
színősé
ge
()
()
0
0 a
pró
ba
terj
edel
me,
ha
min
den
-r
a
X
a p
rób
a sz
ignif
ikan
cias
zin
tje
(más
kép
p:
a p
róba
pon
tos
terj
edel
me)
,
sup
X
k
k
P
P
ϑ
ϑϑα
ϑ
α
α
α∈
Θ
∈Θ
∈≤
∈=
ξ
ξ
Pél
da (
sörö
k m
egkü
lönb
özte
tése
)
�Ki tudják-e választani a különbözı sört?
�24 emberen kísérleteztek.
01
11
:,
:3
3H
pH
p=
>
U-p
róba
2
1
00
10
10
10
0
0
01,.
..,
~(
,),
ism
eret
len
, is
mer
t.
: :(k
étold
ali
elle
nh
ipoté
zis)
':(e
gyold
ali
elle
nh
ipoté
zis)
'':(e
gyo
ldal
i el
lenh
ipo
tézi
s)
~(0
,1)
~,1
nN
mm
Hm
m
Hm
m
Hm
m
Hm
m
mU
n
HU
N
mm
HU
Nn
ξξ
σσ
ξ
σ
σ
= ≠ < >
−= ⇒
−
⇒
()
()
()
()
()
()
()
()
()
00
0
12
11
12
22
12
0
11
11
22
22
pró
ba
(két
old
ali
elle
nhip
oté
zis)
()
X: X
1
11
11
.2
2
()
X
11
1
y
k
mk
m
mk
m
mm
m
U
uy
xm
nu
PP
Uu
uu
mP
PU
u
mm
mP
uU
uP
un
nu
P
α
αα
α
α
αα
αα
σ
αα
α
β
ξ
σσ
−
−−
−
−
−−
−−
−
Φ=
−
=≥
⇒
∈=
≥=
−Φ
+Φ
−=
=−
−+
−−
=
=∈
=≥
=
−−
−−
<<
=−
−<
+<
=
−−x
ξ
ξ
00
11
22
00
01
12
2
11,
n
mm
mm
mu
nn
un
mm
mm
un
un
mm
αα
αα
ξ
σσ
σ
σσ
−−
→∞
−−
−−
−−
<<
−=
−−
−Φ
−+
Φ−
−
→
≠
Vél
etle
níte
ttpr
óba
�Eddig adott m
egfigyelés esetén
egyértelmő volt a döntésünk:
1,
()
0,
k k
T∈
=
∉
xX
xx
X
Véletlenítettpróba esetén sorsolhatunk
is:
1,
ha
()
()
, ha
()
0,
ha
()
Tc
Tc
Tc
γ
>
Ψ=
=
<
x
xx x
Elsıfa
jú h
iba
való
színősé
ge
véle
tlení
tett
prób
a es
etén
()
()
()
()
()
0
0
0
-ra
az e
lsı
fajú
hib
a val
ósz
ínő
sége:
()
()
()
a p
rób
a te
rjed
elm
e, h
a m
inden
-r
a
()
a p
rób
a sz
ign
ifik
anci
aszi
ntj
e
(más
kép
p:
a pró
ba
pon
tos
terj
edel
me)
,
sup
()
PT
cP
Tc
E
E
E
ϑϑ
ϑ
ϑ
ϑϑϑ
γψ
αϑ
ψα
α
ψα
∈Θ∈
Θ
>+
==
∈Θ
≤
=
ξξ
ξ
ξ
ξ
Lege
rıse
bb p
róba
egy
szerő h
ipot
ézis
es
etéb
en
()
()
()
()
()
00
0
11
01
01
Eg
ysz
erő
és
:1
.
a le
gerı
sebb
-t
erje
del
mő p
róba,
ha:
()
()
()
,
továb
bá
min
den
más
-t
erje
del
mő
' p
róbár
a, a
nn
ak
más
odfa
jú h
ibav
aló
színő
sége
nag
yobb
:
1(
)1
'()
.
HH
PT
cP
Tc
E
EE
ϑϑ
ϑ
ϑϑ
ψα γ
ψα
αψ
ψψ
Θ=
Θ=
>+
==
≤
−≤
−
ξξ
ξ
ξξ
A le
gerı
sebb
pró
ba
�A legegyszerőbb eset: H
0és H
1is egyszerő
(egyelemő). A
valószínőséghányados
(vh.) próba:
�Állítás (Neyman-Pearson
lemma): a vh. próba
legerısebb a saját
terjedelmével. Minden
0<α
<1-hez létezik ilyen
terjedelmővh. próba.
Minden legerısebb próba
ilyen alakú.
1 0 1 0 1 0
()
1(
)
()
()
()
()
0(
)
Lc
L LT
cL L
cL
γ>
=
=
<
x x xx
x x x
Pró
bák
a no
rmál
is e
losz
lás
várh
ató
érté
kére
: t p
róba
.
�H0: m=m
0, H1m
≠m
0. Ha nem
ism
ert a szórás (t-
próba):
�ahol
�Kritikus tartomány: |t|>t 1-α/2,n-1.(H
0esetén a
próbastatisztika n-1 szabadságfokú, t-eloszlású.)
�Ha egyoldali az ellenhipotézis, akkor a kritikus
tartomány t>t 1-α, n-1 (m>m
0), illetve t<-t
1-α, n-1
alakú(m
<m
0). Ezekis legerısebb próbák!
σ̂0
mX
nt
−= (
))1
/(ˆ
1
2
−−
=∑ =
nX
Xn i
iσ
Meg
jegy
zése
k
�A kétoldali esetre kapott próba nem
a legerısebb (ilyenkor nincs is
ilyen).
�Ha a minta elemszám
a nagy, a t-
próba helyett az u-próbais
használható (ekkor még a norm
ális
eloszlásúságra sincs szükség a
centrális határeloszlás tétel miatt).
Két
olda
li pr
óbák
és
konf
iden
cia
inte
rval
lum
ok
�A norm
ális eloszlásnál a várható értékre
vonatkozó α
terjedelmőpróbánál láttuk,
hogy a H0: m=m
0hipotézist a H
1: m
≠m
0hipotézissel szemben pontosan akkkor
fogadjuk el, ha m
0benne van az 1-
αmegbízhatóságúkonfidencia
intervallumban.
Két
min
tás
eset
: pár
osíto
tt m
egfig
yelé
sek
�Példa: Van-e különbség Budapest és
Cegléd napi átlaghımérséklete között?
H0: m
1=m
2a nullhipotézis.
�Ha ugyanazon napokról van
megfigyelésünk mindkét helyen: nem
függetlenek a m
inták. Ekkor a párok
tagjai közötti különbséget vizsgálva, az
elızı egym
intás esetre vezethetı vissza a
feladat. H0*: m=0 , H
1*:m
≠0 az új
hipotézisek .
Két
min
tás
eset
: füg
getle
nm
intá
k
∑∑
−+
−
−
+
−+
=−
+2
22
)(
)(
)2
(
YY
XX
YX
mn
mn
nm
t
ii
mnHa ism
ert a szórás: (Xn elemő, σ1szórású,
Ym elemő, σ2szórású), alkalmazható a kétm
intás u-próba
mn
YX
u/
/2
2
2
1σ
σ+−
=
Kritikus tartomány: m
int az egym
intás esetben
Ha ism
eretlenek, de azonosak a szórások: