seminar1 econometrie spataru

1

Seminar 1 – ECONOMETRIE – SPĂTARU

Elemente Recapitulative de ProbabilităŃi şi Statistică Matematică Variabile aleatoare.

Variabila aleatoare este o mărime care poate lua orice valoare, necunoscută aprioric, depinzând de

rezultatul efectuării unui anumit experiment, rezultat care este imposibil de precizat. Variabila

aleatoare este o funcŃie reală definită pe mulŃimea Ω , a evenimentelor elementare asociate

experimentului considerat. Orice funcŃie X, definită pe Ω şi care ia valori în mulŃimea numerelor reale

ℝ, se numeşte variabilă aleatoare. Variabila aleatoare oferă informaŃii privind valoarea numerică a mărimii măsurate şi informaŃii privind

frecvenŃa de apariŃie a unei valori numerice într-un şir de valori.

Variabilele aleatoare pot fi discrete sau continue.

Variabila aleatoare discretă are un număr finit de valori sau o mulŃime cel mult numărabilă de valori.

RepartiŃia sau distribuțțțția de probabilitate a unei variabile aleatoare discrete se scrie sub forma unui

tablou în care prima linie conŃine toate valorile posibile ale variabilei ( ix , ,...2,1=i ), iar a doua linie

conŃine probabilităŃile de apariŃie ale acestor valori ( ii pxXP == )( , ,...2,1=i ).

LL

LL

i

i

ppp

xxxX

21

21: sau

i

i

p

xX : , unde Ii∈

Probabilitatile care apar pe a doua linie sunt numere reale care satisfac două conditii:

1) 0≥ip pentru fiecare valoare ix

2) 121 =++++ LL ippp

Valoarea medie a unei variabile aleatoare discrete este:

∑==∈Ii

ii pxXE )(µ

ProprietăŃile mediei:......

Dispersia (VarianŃa) şi abaterea standard a unei variabile aleatoare discrete sunt:

== )()( XVarXD ∑ −=∑ =−=∈∈ Ii

iiIi

ii pxxXPXEx 222 )()()]([ µσ

∑ −==∈Ii

ii px 22 )( µσσ

ProprietăŃile dispersiei:......

Variabila aleatoare continuă are un număr infinit de valori

-FuncŃia densitate de probabilitate. )(xf ..

-FuncŃia de repartiŃie. =<= )()( xXPxF ....

Variabile aleatoare bidimensionale ),( YX .

- CovarianŃa dintre X şi Y măsoară intensitatea legăturii dintre cele două variabile aleatoare.

O covarianŃă pozitivă indică o relaŃie pozitivă, iar o covarianŃă negativă indică o relaŃie negativă. O

covarianŃă egală cu 0 arată că cele două variabile sunt independente.

- Coeficientul de corelaŃie dintre X şi Y....

2

DistribuŃii de probabilitate teoretice importante 1) DistribuŃia Normală, cu parametrii µ şi 2σ ( ),(~ 2σµNX )

Spunem că o v.a. are o distribuŃie normală de parametrii µ şi σ şi notăm prin ),(~ 2σµNX , dacă

are funcŃia densitate de probabilitate (pdf) de forma 2

2

1

2

1)(

−−

= σµ

πσ

x

exf , 0,, >∈∈ σµ RRx .

DistribuŃia normală este utilizată atunci când o caracteristică este supusă unui număr mare de influenŃe

întîmplătoare, de slabă intensitate şi independente unele de altele. DistribuŃia normală este cea mai

cunoscută distribuŃie continuă folosită în statistică, pentru că:

-Numeroase variabile continue, folosite în afaceri, au distribuŃii care sunt asemănătoare distribuŃiei

normale.

- DistribuŃia normală poate fi utilizată pentru a aproxima diferite distribuŃii de probabilitate discrete.

- DistribuŃia normală oferă bazele pentru inferenŃa statistică clasică, datorită relaŃiei sale cu teorema

limită centrală.

Portretul lui Carl Friedrich Gauss (1777-1855) şi celebra curbă, pe bancnota germană de 10 mărci.

FuncŃia densitate de probabilitate a distribuŃiei normale cu media µ şi abaterea standard σ are

următoarele proprietăŃi:

- Este simetrică faŃă de dreapta µ=x . Datorită simetriei, modul, mediana şi media distribuŃiei

normale sunt egale. Valoarea medie este cea mai probabilă valoare a unei variabile cu distribuŃie

normală. Cele mai multe valori ale acestei variabile sunt în mijlocul distribuŃiei. Media poate lua orice

valoare: negativă, pozitivă sau zero.

- Este unimodală: derivata lui )(xf este pozitivă pentru µ<x , negativă pentru µ>x şi zero numai

dacă µ=x

- Punctele σµ −=x şi σµ +=x sunt puncte de inflexiune (unde derivata de ordinul doi este 0)

- Domeniul valorilor sale este de la ∞− la ∞+ , astfel încât fiecare interval de numere reale are o

probabilitate diferită de zero. Curba normală se extinde, fără a atinge axaOx, în ambele direcŃii, de la

∞− la ∞+ .

O variabilă aleatoare normală poate lua orice valoare pe dreapta reală, astfel încât 1)( =∞<<−∞ XP

- Aria totală de sub curba care reprezintă )(xf trebuie să fie egală cu 1.

3

Media variabilei este µ=)(XE iar varianŃa (dispersia) eate 2)()( σ== XVarXD . Media determină

poziŃia distribuŃiei în raport cu axa Ox, iar dispersia arată gradul de aplatizare a conturului reprezentării

grafice.

DistribuŃia normală cu media 0 şi abaterea medie pătratică 1 este un caz particular al distribuŃiei

normale şi se numeşte distribuŃia normală standard, notată N(0,1), distribuŃia normală normată sau

distribuŃia normală redusă.

2

2

2

1)(

z

ezf−

=π

Toate distribuŃiile normale pot fi reduse la distribuŃia normală standard folosind transformarea

σµ−

=X

Z , unde ),(~ 2σµNX şi )1,0(~ NZ .

CombinaŃiile liniare ale variabilelor normal distribuite sunt normal distribuite.

Regula empirică#1 şi distribuŃia normală (Regula 68-95-99,7 pentru distribuŃiile normale) Regula empirică afirmă că, pentru o distribuŃie normală:

68,2% din observaŃii se vor afla între σµ − şi σµ + , adică în interiorul unei abateri standard de la

medie.

95,4% din observaŃii se vor afla între σµ 2− şi σµ 2+ , adică în interiorul a două abateri standard de

la medie.

Aproape 99.7% din observaŃii se vor afla între σµ 3− şi σµ 3+ , adică în interiorul a trei abateri

standard de la medie.

≈≤≤−=+≤≤− )11()( ZPXP σµσµ 0,682

≈<<−=+<<− )22()22( ZPXP σµσµ 0,954

≈<<−=+<<− )33()33( ZPXP σµσµ 0,997

4

Aria de sub fiecare secŃiune a curbei normale poate fi văzută în următoarea diagramă:

Teorema Limită Centrală constituie baza teoretică pentru larga aplicabilitate a distribuŃiei normale.

Regula empirică #2 Aria totală de sub curba de distribuŃie normală este egală cu 1:

90% din arie este între ± 1.645 abateri standard de la medie



Teorema Limită Centrală: Dacă dintr-o populaŃie se extrag, în mod aleator, eşantioane de volum n,

pentru valori mari ale lui n, mediile eşantioanelor sunt repartizate aproximativ normal.

1) Dacă ),(~ 2σµNX , atunci )/,(~ 2 nNX σµ

2) Dacă X este distribuită aproximativ normal, atunci media eşantioanelor va fi distribuită normal chiar

şi pentru valori mici ale lui n.

Rezultă că variabila

)1,0(~/

)(N

n

XXEXZ

X σ

µσ

−=

−= când ∞→n .

Calculul probabilităŃilor:

Aria din stânga lui 0,0 este 0,5.

5

Aria din stânga lui +1,6 este egală cu 1/2 plus aria de la 0,0 la +1,6.

Aria din stânga lui -1,6 este egală aria din dreapta lui +1,6

Aria din dreapta lui +1,6 este egală cu 1 minus aria de la stanga lui +1,6

2) DistribuŃia Hi-pătrat cu n grade de libertate - 2

nχ

Este obŃinută direct din variabile aleatoare cu distribuŃie normală standard.

Teoremă: Fie )1,0(~ NZ i , ni ,1= . Atunci v.a. 22 ~ niZX χ∑=

n – corespunde numărului de termeni din sumă.

O v. a. cu distribuŃie Hi-pătrat este totdeauna nenegativă şi graficul lui )(xf nu este simetric.

Forma sa grafică, asimetrică spre dreapta, depinde numai de numărul gradelor de libertate.

DistribuŃia Hi-pătrat se foloseşte pentru că apar frecvent situaŃii în care intervin sume de pătrate de v.a.

independente una de alta, urmând fiecare o distribuŃie normală.

Există tabele care dau funcŃia de repartiŃie Hi-pătrat.

6

Teoremă: Variabila 2

2)1(

σsn

U−

= are o distribuŃie 2χ cu (n-1) grade de libertate.

1

)(1

2

2

−

−=∑ =

n

xxs

n

i i sau

1

)(1

2

2

−

−=∑ =

n

xxs

n

i i este dispersia de selecŃie modificată

3) DistribuŃia Student nSt ~ (sau notat ntt ~ )

Este folosită în statistica clasică şi analiza de regresie

ObŃinem o v.a. cu distribuŃie Student dintr-o variabilă normală standard şi una Hi-pătrat. Teoremă: Fie

)1,0(~ NZ şi 2~ nX χ v.a. independente.

Atunci v.a.

n

X

Zt = are o distribuŃie Student cu n grade de libertate (df=n).

Densitatea de repartiŃie are o formă similară cu cea a distribuŃiei normale standard şi converge spre

distribuŃia normală standard pe măsură ce numărul gradelor de libertate creşte.

La distribuŃia Student se ajunge în cazul sondajelor de volum mic, în sensul că în relaŃia

σ)(XEX

Z−

= înlocuim abaterea medie pătratică σ cu estimaŃia sa ( s ) din eşantionul de date, iar

variabila standardizată care rezultă este s

XEXt

)(−= .

DistribuŃia Student este indicată în situaŃia în care dispersia în populaŃia studiată nu este cunoscută şi

este înlocuită cu estimaŃia acesteia.

7

Ne referim la distribuŃia Student în cazul:

- stabilirii intervalelor de încredere pentru estimaŃii

- verificării semnificaŃiei estimaŃiilor obŃinute pentru parametrii funcŃiei de regresie (testul t).

Teoremă: Variabila ns

Xt

/

µ−= are o distribuŃie Student cu (n-1) grade de libertate.

4) DistribuŃia F (Fisher-Snedecor)

Se foloseşte în testarea ipotezelor în analiza de regresie multifactorială.

Teoremă: Fie două v.a. independente: 2

1 1~ nX χ şi 2

2 2~ nX χ . Atunci, v.a.

)/(

)/(

22

11

nX

nXF = are o distribuŃie F cu ),( 21 nn grade de libertate.

Notăm 21 ,~ nnFF

Ordinea gradelor de libertate este critică

1n este asociat cu variabila de la numărător

2n este asociat cu variabila de la numitor.

- DistribuŃia F este asimetrică la dreapta.

- Pătratul unei v.a. nt are o distribuŃie nF ,1 . Simbolic, nn Ft ,1

2 =

seminar1 econometrie spataru

Documents