seminar1 econometrie spataru
DESCRIPTION
-TRANSCRIPT
1
Seminar 1 – ECONOMETRIE – SPĂTARU
Elemente Recapitulative de ProbabilităŃi şi Statistică Matematică Variabile aleatoare.
Variabila aleatoare este o mărime care poate lua orice valoare, necunoscută aprioric, depinzând de
rezultatul efectuării unui anumit experiment, rezultat care este imposibil de precizat. Variabila
aleatoare este o funcŃie reală definită pe mulŃimea Ω , a evenimentelor elementare asociate
experimentului considerat. Orice funcŃie X, definită pe Ω şi care ia valori în mulŃimea numerelor reale
ℝ, se numeşte variabilă aleatoare. Variabila aleatoare oferă informaŃii privind valoarea numerică a mărimii măsurate şi informaŃii privind
frecvenŃa de apariŃie a unei valori numerice într-un şir de valori.
Variabilele aleatoare pot fi discrete sau continue.
Variabila aleatoare discretă are un număr finit de valori sau o mulŃime cel mult numărabilă de valori.
RepartiŃia sau distribuțțțția de probabilitate a unei variabile aleatoare discrete se scrie sub forma unui
tablou în care prima linie conŃine toate valorile posibile ale variabilei ( ix , ,...2,1=i ), iar a doua linie
conŃine probabilităŃile de apariŃie ale acestor valori ( ii pxXP == )( , ,...2,1=i ).
LL
LL
i
i
ppp
xxxX
21
21: sau
i
i
p
xX : , unde Ii∈
Probabilitatile care apar pe a doua linie sunt numere reale care satisfac două conditii:
1) 0≥ip pentru fiecare valoare ix
2) 121 =++++ LL ippp
Valoarea medie a unei variabile aleatoare discrete este:
∑==∈Ii
ii pxXE )(µ
ProprietăŃile mediei:......
Dispersia (VarianŃa) şi abaterea standard a unei variabile aleatoare discrete sunt:
== )()( XVarXD ∑ −=∑ =−=∈∈ Ii
iiIi
ii pxxXPXEx 222 )()()]([ µσ
∑ −==∈Ii
ii px 22 )( µσσ
ProprietăŃile dispersiei:......
Variabila aleatoare continuă are un număr infinit de valori
-FuncŃia densitate de probabilitate. )(xf ..
-FuncŃia de repartiŃie. =<= )()( xXPxF ....
Variabile aleatoare bidimensionale ),( YX .
- CovarianŃa dintre X şi Y măsoară intensitatea legăturii dintre cele două variabile aleatoare.
O covarianŃă pozitivă indică o relaŃie pozitivă, iar o covarianŃă negativă indică o relaŃie negativă. O
covarianŃă egală cu 0 arată că cele două variabile sunt independente.
- Coeficientul de corelaŃie dintre X şi Y....
2
DistribuŃii de probabilitate teoretice importante 1) DistribuŃia Normală, cu parametrii µ şi 2σ ( ),(~ 2σµNX )
Spunem că o v.a. are o distribuŃie normală de parametrii µ şi σ şi notăm prin ),(~ 2σµNX , dacă
are funcŃia densitate de probabilitate (pdf) de forma 2
2
1
2
1)(
−−
= σµ
πσ
x
exf , 0,, >∈∈ σµ RRx .
DistribuŃia normală este utilizată atunci când o caracteristică este supusă unui număr mare de influenŃe
întîmplătoare, de slabă intensitate şi independente unele de altele. DistribuŃia normală este cea mai
cunoscută distribuŃie continuă folosită în statistică, pentru că:
-Numeroase variabile continue, folosite în afaceri, au distribuŃii care sunt asemănătoare distribuŃiei
normale.
- DistribuŃia normală poate fi utilizată pentru a aproxima diferite distribuŃii de probabilitate discrete.
- DistribuŃia normală oferă bazele pentru inferenŃa statistică clasică, datorită relaŃiei sale cu teorema
limită centrală.
Portretul lui Carl Friedrich Gauss (1777-1855) şi celebra curbă, pe bancnota germană de 10 mărci.
FuncŃia densitate de probabilitate a distribuŃiei normale cu media µ şi abaterea standard σ are
următoarele proprietăŃi:
- Este simetrică faŃă de dreapta µ=x . Datorită simetriei, modul, mediana şi media distribuŃiei
normale sunt egale. Valoarea medie este cea mai probabilă valoare a unei variabile cu distribuŃie
normală. Cele mai multe valori ale acestei variabile sunt în mijlocul distribuŃiei. Media poate lua orice
valoare: negativă, pozitivă sau zero.
- Este unimodală: derivata lui )(xf este pozitivă pentru µ<x , negativă pentru µ>x şi zero numai
dacă µ=x
- Punctele σµ −=x şi σµ +=x sunt puncte de inflexiune (unde derivata de ordinul doi este 0)
- Domeniul valorilor sale este de la ∞− la ∞+ , astfel încât fiecare interval de numere reale are o
probabilitate diferită de zero. Curba normală se extinde, fără a atinge axaOx, în ambele direcŃii, de la
∞− la ∞+ .
O variabilă aleatoare normală poate lua orice valoare pe dreapta reală, astfel încât 1)( =∞<<−∞ XP
- Aria totală de sub curba care reprezintă )(xf trebuie să fie egală cu 1.
3
Media variabilei este µ=)(XE iar varianŃa (dispersia) eate 2)()( σ== XVarXD . Media determină
poziŃia distribuŃiei în raport cu axa Ox, iar dispersia arată gradul de aplatizare a conturului reprezentării
grafice.
DistribuŃia normală cu media 0 şi abaterea medie pătratică 1 este un caz particular al distribuŃiei
normale şi se numeşte distribuŃia normală standard, notată N(0,1), distribuŃia normală normată sau
distribuŃia normală redusă.
2
2
2
1)(
z
ezf−
=π
Toate distribuŃiile normale pot fi reduse la distribuŃia normală standard folosind transformarea
σµ−
=X
Z , unde ),(~ 2σµNX şi )1,0(~ NZ .
CombinaŃiile liniare ale variabilelor normal distribuite sunt normal distribuite.
Regula empirică#1 şi distribuŃia normală (Regula 68-95-99,7 pentru distribuŃiile normale) Regula empirică afirmă că, pentru o distribuŃie normală:
68,2% din observaŃii se vor afla între σµ − şi σµ + , adică în interiorul unei abateri standard de la
medie.
95,4% din observaŃii se vor afla între σµ 2− şi σµ 2+ , adică în interiorul a două abateri standard de
la medie.
Aproape 99.7% din observaŃii se vor afla între σµ 3− şi σµ 3+ , adică în interiorul a trei abateri
standard de la medie.
≈≤≤−=+≤≤− )11()( ZPXP σµσµ 0,682
≈<<−=+<<− )22()22( ZPXP σµσµ 0,954
≈<<−=+<<− )33()33( ZPXP σµσµ 0,997
4
Aria de sub fiecare secŃiune a curbei normale poate fi văzută în următoarea diagramă:
Teorema Limită Centrală constituie baza teoretică pentru larga aplicabilitate a distribuŃiei normale.
Regula empirică #2 Aria totală de sub curba de distribuŃie normală este egală cu 1:
90% din arie este între ± 1.645 abateri standard de la medie
95% din arie este între ± 1.960 abateri standard de la medie
99% din arie este între ± 2.575 abateri standard de la medie
Teorema Limită Centrală: Dacă dintr-o populaŃie se extrag, în mod aleator, eşantioane de volum n,
pentru valori mari ale lui n, mediile eşantioanelor sunt repartizate aproximativ normal.
1) Dacă ),(~ 2σµNX , atunci )/,(~ 2 nNX σµ
2) Dacă X este distribuită aproximativ normal, atunci media eşantioanelor va fi distribuită normal chiar
şi pentru valori mici ale lui n.
Rezultă că variabila
)1,0(~/
)(N
n
XXEXZ
X σ
µσ
−=
−= când ∞→n .
Calculul probabilităŃilor:
Aria din stânga lui 0,0 este 0,5.
5
Aria din stânga lui +1,6 este egală cu 1/2 plus aria de la 0,0 la +1,6.
Aria din stânga lui -1,6 este egală aria din dreapta lui +1,6
Aria din dreapta lui +1,6 este egală cu 1 minus aria de la stanga lui +1,6
2) DistribuŃia Hi-pătrat cu n grade de libertate - 2
nχ
Este obŃinută direct din variabile aleatoare cu distribuŃie normală standard.
Teoremă: Fie )1,0(~ NZ i , ni ,1= . Atunci v.a. 22 ~ niZX χ∑=
n – corespunde numărului de termeni din sumă.
O v. a. cu distribuŃie Hi-pătrat este totdeauna nenegativă şi graficul lui )(xf nu este simetric.
Forma sa grafică, asimetrică spre dreapta, depinde numai de numărul gradelor de libertate.
DistribuŃia Hi-pătrat se foloseşte pentru că apar frecvent situaŃii în care intervin sume de pătrate de v.a.
independente una de alta, urmând fiecare o distribuŃie normală.
Există tabele care dau funcŃia de repartiŃie Hi-pătrat.
6
Teoremă: Variabila 2
2)1(
σsn
U−
= are o distribuŃie 2χ cu (n-1) grade de libertate.
1
)(1
2
2
−
−=∑ =
n
xxs
n
i i sau
1
)(1
2
2
−
−=∑ =
n
xxs
n
i i este dispersia de selecŃie modificată
3) DistribuŃia Student nSt ~ (sau notat ntt ~ )
Este folosită în statistica clasică şi analiza de regresie
ObŃinem o v.a. cu distribuŃie Student dintr-o variabilă normală standard şi una Hi-pătrat. Teoremă: Fie
)1,0(~ NZ şi 2~ nX χ v.a. independente.
Atunci v.a.
n
X
Zt = are o distribuŃie Student cu n grade de libertate (df=n).
Densitatea de repartiŃie are o formă similară cu cea a distribuŃiei normale standard şi converge spre
distribuŃia normală standard pe măsură ce numărul gradelor de libertate creşte.
La distribuŃia Student se ajunge în cazul sondajelor de volum mic, în sensul că în relaŃia
σ)(XEX
Z−
= înlocuim abaterea medie pătratică σ cu estimaŃia sa ( s ) din eşantionul de date, iar
variabila standardizată care rezultă este s
XEXt
)(−= .
DistribuŃia Student este indicată în situaŃia în care dispersia în populaŃia studiată nu este cunoscută şi
este înlocuită cu estimaŃia acesteia.
7
Ne referim la distribuŃia Student în cazul:
- stabilirii intervalelor de încredere pentru estimaŃii
- verificării semnificaŃiei estimaŃiilor obŃinute pentru parametrii funcŃiei de regresie (testul t).
Teoremă: Variabila ns
Xt
/
µ−= are o distribuŃie Student cu (n-1) grade de libertate.
4) DistribuŃia F (Fisher-Snedecor)
Se foloseşte în testarea ipotezelor în analiza de regresie multifactorială.
Teoremă: Fie două v.a. independente: 2
1 1~ nX χ şi 2
2 2~ nX χ . Atunci, v.a.
)/(
)/(
22
11
nX
nXF = are o distribuŃie F cu ),( 21 nn grade de libertate.
Notăm 21 ,~ nnFF
Ordinea gradelor de libertate este critică
1n este asociat cu variabila de la numărător
2n este asociat cu variabila de la numitor.
- DistribuŃia F este asimetrică la dreapta.
- Pătratul unei v.a. nt are o distribuŃie nF ,1 . Simbolic, nn Ft ,1
2 =