proiectul de statistica mtc 2015 model nerezolvat (3)
DESCRIPTION
proiectTRANSCRIPT
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
Universitatea Creștină Dimitrie CantemirFacultatea Management Turistic și Comercial
TEMA POIECT
UTILIZAREA SONDAJULUI ÎN CARACTERIZAREA FENOMENELOR ECONOMICO-SOCIALE
Titular disciplină:Conf. univ. dr. Emilia Gogu
Numele şi prenumele
Bucuresti, 2015
Pag. 1 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
Proiectul de statistică “UTILIZAREA SONDAJULUI ÎN CARACTERIZAREA FENOMENELOR ECONOMICO-SOCIALE”
TEMA PROIECTULUI:
Un agent economic dispune de o reţea de unităţi economice cu profilul alimentaţie publică în care sunt angajaţi 500 de vânzători.
Pentru cei 500 de vânzători, consideraţi ca o colectivitate generală s-a întocmit o bază de sondaj (vezi Baza de Sondaj din Anexa Nr.1). Înscrierea în baza de sondaj a vânzătorilor s-a făcut în ordine alfabetică, ceea ce constituie un criteriu aleator şi li s-a dat un cod (nr. crt.)
Considerând cei 500 de vânzători ca formând o colectivitate statistică, se cere:1. să se extragă printr-un procedeu de sondaj un eşantion de 60 de unităţi şi să se
centralizeze nivelurile individuale ale fiecăreia din variabilele prezentate potrivit conţinutului lor;
2. să se grupeze datele înregistrate la punctul precedent folosind grupările simple pentru toate caracteristicile înregistrate pe intervale egale şi neegale (se vor folosi minim 8 grupe pentru intervale egale şi minim 3 grupe pentru intervale neegale) şi să se centralizeze datele condiţionate de grupările folosite. Să se reprezinte grafic seriile obţinute;
3. să se calculeze toate mărimile relative posibile;4. să se calculeze indicatorii tendinţei centrale, indicatorii variaţiei şi ai asimetriei pentru
variabilele înregistrate;5. să se aplice metoda corelaţiei şi regresiei pentru datele din eşantion. Să se măsoare
gradul de intensitate al corelaţiei. Pentru date negrupate se vor lua în calcul primele 10 unităţi din eşantion, la care se vor calcula şi coeficienţii de corelaţie a rangurilor.
NOTĂ: Proiectul se preda cu 10 zile înaintea sesiunii.
REZOLVARE:1. Din baza de sondaj (Anexa 1) să se extragă un eşantion format din 60 de vânzători1.
Pasul de eşantionare se obţine conform relaţiei:
k=Nn
în care: N - volumul colectivităţii generale n – volumul eşantionului
1 Se cere:1. să se stabilească proporţia de sondaj şi pasul de eşantionare2. folosind ca prima unitate de sondaj ultimele două numere a numărului matricol, să se
formeze eşantionul de 60 de unităţi.
Pag. 2 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
k=Nn
=50060
=8 ,33≈8
Astfel, la extragere s-a folosit procedeul selecţiei mecanice cu pas de numărare egal cu 8.
Pentru individualizarea proiectului, fiecare student va folosi ca primă unitate de eşantionare ultime două cifre a numărului matricol personal, de ex. 2703 atunci eşantionul extras va fi 3; 11; 19 etc. până se completează cele 60 de extrageri). S-au înregistrat datele privind sexul, vârsta (ani), zile lucrate, ore lucrate, Valoarea încasărilor lunare (lei ) şi salariul brut lunar (lei) din luna mai 2014 (vezi Tabelul 1).
Tabelul 1
Nr. crt SexVârsta(ani)
Zile lucrateOre
lucrate
Valoarea încasărilor
(lei)
Salariul brut lunar
(lei)A 1 2 3 4 5 6
1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.
Pag. 3 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
27.28.29.30.31.32.33.34.35.36.37.38.39.40.41.42.43.44.45.46.47.48.49.50.51.52.53.54.55.56.57.58.59.60.
Total
Interpretare: Cei 60 de vânzători extraşi din baza de sondaj ne oferă pentru început următoarele informaţii: au lucrat în total într-o lună ..... de zile – .... de ore; realizând o valoare a încasărilor de ......lei. Iar fondul de salariu în această lună pentru cei 60 de vânzători a fost ...... lei.
Pag. 4 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
2. Gruparea datelor înregistrate 2.1. Gruparea pe intervale de variaţie egale
Gruparea pe intervale egale implică următoarele etape:a) calculul amplitudinii absolute de variaţiei (A) care exprimă împrăştierea maximă a
valorilor serei.Ax
a = Xmax – Xmin
Observaţie: Dacă variaţia este foarte mică (în cazul nostru Axa 10) se va forma o
distribuţie pe variante (valabil în cazul caracteristicilor: vârsta; zile lucrate).b) stabilirea în parametrii într-un anumit număr de grupe (r) se poate stabili astfel:
dacă variaţia caracteristicii este relativ uniformă şi volumul de unităţi nu este suficient de mare numărul de grupe se poate fixa anterior (din cerinţele proiectului se vor folosi minimul 8 grupe pentru intervale egale);
iar dacă numărul grupelor nu este anterior cunoscut şi volumul unităţilor este suficient de mare se recomandă stabilirea grupelor conform relaţiei lui Sturgers,
r = 1+3,322log nunde: n - nr. caracteristicilor.
b) determinarea mărimii intervalului de grupare (h), se calculează ca raport între amplitudinea absolută a variaţiei şi numărul de grupe:
h=A A
X
r sau h=
xmax−xmin
1+3 , 222 log nNotă: Mărimea intervalului (h) se rotunjeşte la întreg în plus (ex.3,254)
Prima grupă se porneşte de la xmin adăugându-se succesiv mărimea intervalului de grupare (h) rezultat din calculul anterior. Valoarea din stânga intervalului va fi considerată ca limită inferioară, iar valoarea din dreapta ca limită superioară. Valorile care formează limitele intervalelor se înregistrează fie numai ca limită superioară fie ca limită inferioară pentru a evita înregistrări duble a caracteristicilor.
Analog se rezolvă pentru orice variabilă.2A. Gruparea pe intervale egale a vânzătorilor după vârstă
a) amplitudinea variaţiei Axa = Xmax – Xmin = .................
Astfel obţinem o distribuţie pe 9 variante (..................) Centralizarea valorilor după vârstă se obţine astfel: (vezi Tabelul 2)
Repartiţia vânzătorilor după vârstăTabelul 2
Vârsta(ani)
Nr. vânzători
Valori centralizate pentru:Zile
lucrateOre lucrate Valoarea
încasărilor (lei )Fondul de
salariu lunar (lei)
Pag. 5 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
TOTAL 60Reprezentarea grafică a repartiţiei vânzătorilor după vârstă se poate ilustra prin
poligonul frecvenţelor (Figura 1) şi curba cumulativă a frecvenţelor (Figura 2) pentru construirea căreia este necesar calculul în prealabil al frecvenţelor cumulate crescător şi descrescător determinate în Tabelul 4
Figura 1Tabelul 3
2B. Gruparea pe intervale egale a vânzătorilor după zile lucrateAmplitudinea variaţiei Ax
a = Xmax – Xmin = ....Obţinem o distribuţie formată din 8 variante (...)Repartiţia vânzătorilor după numărul zilelor lucrate
Tabelul 5
Zile lucrate
Nr. vânzători
Valori centralizate pentru:Ore lucrate Valoarea încasărilor
lunare (lei )Fondul de salariu
lunar (lei)
Pag. 6 din 21
19 20 21 22 23 24 25 26 27
0
2
4
6
8
10
12
14
3
5
6
9
13
10
8
4
2
Repartiţia vânzătorilor după vârstă
V â r s t a ( a n i )
Nr.
vân
zăto
ri
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
TOTAL
Centralizarea valorilor în funcţie de numărul zilelor lucrate se obţine ca şi în cazul grupării după vârsta vânzătorilor.
Reprezentarea grafică a repartiţiei vânzătorilor după zilele lucrate, se poate ilustra prin poligonul frecvenţelor (Figura 3) şi prin curba cumulativă a frecvenţelor (Figura 4) pentru construirea căreia este necesar calculul în prealabil al frecvenţelor cumulate crescător şi descrescător determinate în Tabelul 6.
Figura 3
2C. Gruparea pe intervale egale a vânzătorilor după ore lucratea) Amplitudinea variaţiei Ax
a = Xmax – Xmin =.............b) Nr de grupe r = 8
c) Mărimea intervalului h=
A AX
r=
Repartiţia vânzătorilor după numărul de ore lucrate Centralizarea valorilor după orele lucrate se obţine astfel (vezi Tabelul 7)
Tabelul 7
Grupe după nr. ore lucrate
Nr. vânzători
Valori centralizate pentru:Zile
lucrateValoarea încasărilor
lunare Fondul de salariu
lunar (lei)
Pag. 7 din 21
17 18 19 20 21 22 23 240
2
4
6
8
10
12
14
16
34
6 6
9
13
15
4
Repartitia vânzătorilor după zilele lucrate
zile
Nr.
vân
zăto
ri
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
TotalNota: Limita superioară inclusă în interval.
Reprezentarea grafică a repartiţiei vânzătorilor după numărul de ore lucrate, se poate ilustra prin histogramă, poligonul frecvenţelor (Figura7.5) şi prin curba cumulativă a frecvenţelor (Figura 6) pentru construirea căreia este necesar calculul în prealabil al frecvenţelor cumulate crescător şi descrescător determinate în Tabelul 9
Figura 5
2E. Gruparea pe intervale egale a vânzătorilor după salariul brut lunar
a) Amplitudinea variaţiei Axa = Xmax – Xmin =
b) Nr de grupe r = 8
c) Mărimea intervalului h=
A AX
r=
Centralizarea valorilor după salariul brut lunar se obţine la fel ca şi la orele lucrate.Repartiţia vânzătorilor în funcţie de salariul brut lunar (lei)
Tabelul 12
Pag. 8 din 21
Grupe ore
135-145
145-155
155-165
165-175
175-185
185-195
195-205
205-215
0
2
4
6
8
10
12
14
5
8
6
121312
22
135 145 155 165 175 185 195 205 215
Repartiţia vânzătorilor după numărul de ore lucrate
Nr.
vânz
ător
i
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
Grupe după salariul brut lunar
Nr. vânzători
Valori centralizate pentru:
Zile lucrate
Ore lucrateValoarea încasărilor
lunare (lei )
TotalNota: Limita superioară inclusă în interval.
0
2
4
6
8
10
12
14
2
65
11
13 13
7
3
Repartitia vânzătorilor după salariul brut lunar
lei
nr. v
ânză
tori
2200 2387 2574 2761 2948 3135 3322 3509 3696
Figura 9
Reprezentarea grafică a repartiţiei vânzătorilor după salariul brut lunar, se poate ilustra prin histogramă, poligonul frecvenţelor (Figura 9) şi curba cumulativă a frecvenţelor (Figura 10) pentru construirea căreia este necesar calculul în prealabil al frecvenţelor cumulate crescător şi descrescător, determinate în Tabelul 13.
2.2.Gruparea vânzătorilor pe intervale neegale
Gruparea pe intervale egale ne-a permis structurarea colectivităţii pe grupe cât mai omogene. De asemenea, după cum s-a observat gruparea statistică este cea mai
Pag. 9 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
semnificativă modalitate a sistematizării datelor după o caracteristica numerică sau nominativă.
Sistematizarea datelor printr-o grupare pe intervale egale răspunde în primul rând necesităţii de sistematizare şi omogenizare a datelor unei observaţii statistice de masă şi a caracterizării independente a fiecărei variabile din propria observare .
Pentru analiza structurii colectivităţii pe grupe tipice se foloseşte gruparea pe intervale neegale.
Gruparea pe intervale neegale presupune regruparea intervalelor egale. Un prim principiu al grupării pe intervale neegale este trecerea de la variaţia liniară
(interval de mărime constantă) la variaţia neuniformă a unor intervale de grupare din ce în ce mai mari. De exemplu, de la 8 grupe se poate trece la 5 grupe Analizând situaţia concretă se pot păstra primele 3 grupe, grupa a patra de obţine cumulând-o cu grupa a cincia, iar ultimele trei grupe se pot cupla. În cazul acesta se poate trece de la grupe pe variante la grupe pe intervale.
Un alt principiu de grupare are în vedere separarea unităţilor pe trei grupe: mici, mijlocii şi mari, se porneşte de la nivelul mediu al caracteristicii, care se calculează ca o medie aritmetică simplă sau ponderată pentru fiecare variabilă în parte:
x=∑i=1
n
x i
n sau
x=∑i=1
n
x i ni
∑i=1
n
ni
unde : xi - variabilan – numărul unităţilor înregistrate (în cazul nostru n=60 sau dacă nu avem datele iniţiale folosim media seriei în care, xi sunt valorile sau centrele de interval şi cu frecvenţele seriei)Algoritmul de stabilire a celor 3 grupe cu intervale neegale este următorul:
în grupa a II-a sunt cuprinse grupa care conţine nivelul mediu al variabilei şi intervalele învecinate cu acesta;
grupa I-a este formată limita inferioară a primului interval şi limita inferioară a intervalului II, iar
a III-a grupa intre limita superioară a intervalului II şi limita superioară a ultimului interval de grupare.
2.2.A. Gruparea pe intervale neegale a vânzătorilor după vârstăNivelul mediu
x=∑i=1
n
x i
n=
Tabelul 14Grupe după Nr. Valori centralizate pentru:
Pag. 10 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
vârstă (ani) vânz.Zile
lucrateOre
lucrateValoarea
încasărilor (lei )
Fondul de salariu
(lei)Calificativul
Total -
3. Calculul mărimilor relative de structurăDin cele 5 mărimi relative întâlnite în statistică, în proiectul de faţă se pot
determina trei: 3.1. Mărimile relative de structură se obţin ca raport între parte şi întreg. Forma cea
mai obişnuita de exprimare a mărimilor relative de structură este cea a procentelor care arată câte unităţii din indicatorul raportat revin la 100 unităţi ale indicatorului bază de raportare. Se pot calcula atât pe baza frecvenţelor absolute şi în acest caz au sens de
frecvenţe relative (ni¿
)
ni(%)¿ =
ni
∑i=1
k
ni
⋅100
cât şi pe baza valorilor centralizate privind : vârsta, zilele lucrate, orele lucrate, volumul desfacerilor şi salariul net, obţinându-se în acest caz ponderea sau greutatea specifică (
gi ) a unei valori (x i ) în totalul valorilor colectivităţii (∑i=1
n
x i):
gi(% )=xi
∑i=1
n
xi
⋅100
3.2. Mărimile relative de coordonare se obţin ca raport între două grupe sau între două colectivităţi ce coexistă în spaţiu.
Pentru o colectivitate împărţită în două grupe pentru care nivelul pe grupe al variabilei studiate este xA şi xB :
K A /B=x A
xB sau =
x B
x A
¿
Dacă sunt mai multe grupe, se alege una ca bază de comparaţie şi se raportează, pe rând, fiecare grupă la baza aleasă.
3.3. Mărimile relative de intensitate se obţin prin raportarea a doi indicatori cu conţinut diferit dar între care există o relaţie de interdependenţă.
la nivel parţial: x i=
y i
zi ; la nivelul ansamblului:
x=∑ yi
∑ zi
Pag. 11 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
3.A. Calculul mărimilor relative pe baza repartiţiei vânzătorilor după vârstă.Repartiţia timpului lucrat (în zile şi ore), a valorii desfacerii şi a fondului de salarii
şi a structurii acestora în funcţie de vârstăTabelul 21
Intervalul de variaţie al
vârstei
CalificativulMărimi relative de structură %
Frecvenţe relative
ni¿
gi
Zile lucr Ore lucr Val. desf Fond salariu
Total - 100 100 100 100 100
Interpretare: Cei mai tineri alcătuiesc 23,3% din totalul angajaţilor, lucrează 22,8% respectiv 22,9% din totalul zilelor şi orelor lucrate, realizează 23,7% din Valoarea încasărilor şi primesc 23% din fondul de salarii.
4. Caracterizarea statistică a repartiţiilor obţinuteCaracterizarea statistică în cazul dat se referă la determinarea:
a) Indicatorilor tendinţei centrale: Media aritmetică
x=∑i=1
k
x i ni
∑i=1
k
ni
Modul (modulul, dominanta)
Mo=x0+hΔ1
Δ1+Δ2 Mediana (Me)
Me=x0+h⋅
∑i=1
k
ni+1
2−∑
i=1
m−1
ni
nm
b) Indicatorii sintetici ai variaţiei şi ai asimetriei:
Abaterea medie liniară ( d ) :
Pag. 12 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
d=∑i=1
k
|x i− x| ni
∑i=1
k
ni
Dispersia σ2
σ 2=∑i=1
k
( x i− x )2 ni
∑i=1
k
ni
Abaterea medie pătratică σ
σ=√σ2
Coeficientul de variaţie (v):
v '= dx⋅100
respectiv v=σ
x⋅100
Coeficientul de asimetrie
Cas=
x−Moσ sau
Cas' =
3( x−Me )σ
3. A. Repartiţia vânzătorilor după vârstă
Tabelul 24
Vârsta(ani)
Nr, vânzători
xini
Frecvenţe cumulate crescător
(x i− x)2 ni
TOTAL 60
a) Calculul indicatorilor tendinţei centrale:
Pag. 13 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
Media aritmetică
x=∑i=1
k
x i ni
∑i=1
k
ni
=.
Modul (modulul, dominanta)Fiind o serie pe variante Modul este valoarea cu frecvenţa maximă
Mo=23 ani / vânz Mediana (Me)
locul medianei: U ( Me )=
∑i=1
k
ni+1
2=60+1
2=30 , 5
Variabila 23 ani este prima a cărei frecvenţă cumulată crescător este mai mare de 30,5Me=. .. . .. .. . .. .. . . ani /vânz
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
Dispersia σ2
σ 2=∑i=1
k
( x i− x )2 ni
∑i=1
k
ni
=
Abaterea medie pătratică σ
σ=√σ2= ani / vânz . Coeficientul de variaţie (v):
sau v=σ
x⋅100=
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie Coeficientul de asimetrie
Cas=
x−Moσ
=
sau Cas
' =3( x−Me )
σ=
Rezultă asimetrie negativă foarte moderată
Pag. 14 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
4.C. Repartiţia vânzătorilor după orele lucrateTabelul 26
Grupe după ore lucrate
Nr, Vânz,
Centrul intervalului
xi
xini
Frecvenţe cumulate crescător
(x i− x)2 ni
Total
a) Calculul indicatorilor tendinţei centrale: Media aritmetică
x=∑i=1
k
x i ni
∑i=1
k
ni
=.
Modul Locul Mo - intervalul cu frecvenţa maximă
Mo=x0+hΔ1
Δ1+Δ2
=ore/vânz .
Mediana (Me)
locul medianei: U ( Me )=
∑i=1
k
ni+1
2=60+1
2=30 , 5
deci intervalul (.....) este primul interval a cărei frecvenţă cumulată crescător este mai mare de 30,5
Me=x0+h⋅
∑i=1
k
ni+1
2−∑
i=1
m−1
ni
nm
=.
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
Dispersia σ2
Pag. 15 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
σ 2=∑i=1
k
( x i− x )2 ni
∑i=1
k
ni
=
Abaterea medie pătratică σ
σ=√σ2=. Coeficientul de variaţie (v):
v=σx⋅100=
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie Coeficientul de asimetrie
Cas=
x−Moσ
=
Cas
' =3( x−Me )
σ=
Rezultă asimetrie negativă moderată
4. E. Repartiţia vânzătorilor după salariu brut (lei) Tabelul 28
Grupe după salariul brut
lunar
Nr, vânz.
Centrul intervalului
xi
xini
Frecvenţe cumulate crescător
|x i− x|n i (x i− x)2 ni
Totala) Calculul indicatorilor tendinţei centrale:
Media aritmetică
x=∑i=1
k
x i ni
∑i=1
k
ni
= mii lei/ vânz .
Modul Locul Mo - intervalul cu frecvenţa maximă (2948-3135)
Pag. 16 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
Mo=x0+hΔ1
Δ1+ Δ2
Mo=mii lei/ vânz . Mediana (Me)
locul medianei: U ( Me )=
∑i=1
k
ni+1
2=60+1
2=30 , 5
prin urmare intervalul (.................) este primul interval a cărei frecvenţă cumulată crescător este mai mare de 30,5
Me=x0+h⋅
∑i=1
k
n i+1
2−∑
i=1
m−1
ni
nm
b) Calculul indicatorii sintetici ai variaţiei şi ai asimetriei
Dispersia σ2
σ 2=∑i=1
k
( x i− x )2 ni
∑i=1
k
ni
=
Abaterea medie pătratică σ
σ=√σ2=mii lei /vânz . Coeficientul de variaţie (v):
v=σx⋅100=%
v` şi v < 35% - seria este omogenă şi media este reprezentativă pentru serie Coeficientul de asimetrie
Cas=
x−Moσ
=
Cas
' =3( x−Me)
σ=
Rezultă asimetrie negativă moderatăPentru interpretarea rezultatelor se vor trece indicatorii obţinuţi într-un tabel sintetic.
5. Analiza corelaţiei dintre numărul de ore şi salariu brut lunar
5.1 Corelaţia liniară simplă (date negrupate)
Pag. 17 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
Se aplică pentru primele 10 unităţi din eşantion, privind numărul de ore lucrate (xi) şi salariul brut lunar (yi ) - lei. Seria se va ordona crescător după numărul de ore lucrate (xi) menţinându-se salariul brut lunar (yi) corespunzător.
Dintre metodele simple de cercetare a legaturilor statistice recurgem la :A) Metoda seriilor paralele interdependente (Tabelul 35);
Tabelul 35Nr. crt
Ore lucrate (xi)
Salariul brut lunar(lei) (yi)
1.2.3.4.5.6.7.8.9.10.
Concluzie: Valorile xi fiind ordonate crescător se poate observa că şi valorile yi cresc în cea mai mare parte, ceea ce sugerează o legătură directă.B) Metoda grafică este o altă cale de a stabili legătura dintre fenomene.Pentru a obţine graficul de corelaţie, denumit şi corelograma, valorile caracteristicii factoriale (xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii rezultative (yi) sau intervalele respective. Fiecare unitate observată a celor două caracteristici se reprezintă grafic printr-un punct.
Pag. 18 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
135 145 155 165 175 185 1950
500
1000
1500
2000
2500
3000
3500
f(x) = 19.8761047190262 x − 425.623645155912R² = 0.9679710464048
Corelaţia dintre salariul brut lunar şi orele lucrate
ore
lei
Figura 12
Graficul de asemenea confirmă o legătură directă de formă liniară.Metoda grafica este utilizată cu bune rezultate pentru alegerea funcţiei analitice
care se studiază (y = 19.876x - 425.62 în cazul regresiei şi corelaţiei)Metodele de studiere a legaturilor prezentate anterior au ca deficienţă principală
faptul că deşi permit constatarea legăturii şi caracterul ei, nu o pot măsura printr-un indicator sintetic. Acest inconvenient este înlăturat prin utilizarea metodei regresie.
Metoda regresiei constituie o metoda statistică analitică de cercetare a legăturii dintre variabile cu ajutorul unor funcţii denumite funcţii de regresie.
Notând cu Y variabile dependenta şi cu x1 , x2 ... xn variabilele independente obţinem ecuaţia de regresie y = f (x1 , x2 ... xn).
În cazul de fata am apelat la modelul de regresie unifactorială liniar considerând legătura dintre y şi x de tipul yxi = a +bxi. Parametri ecuaţiei în acest caz se determină prin rezolvarea următorului sistem de ecuaţii:
{na+b∑ x i=∑ y i¿ ¿¿¿Dacă se foloseşte metoda determinanţilor se obţine:
a=
| ∑ y i ∑ x i
∑ x i y i ∑ x i2|
|n ∑ xi
∑ x i ∑ x i2|
=∑ y i∑ xi
2−∑ x i y i∑ x i
n∑ x i2−(∑ x i )
2
Pag. 19 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
b=
|n ∑ y i
∑ x i ∑ x i y i
|
|n ∑ x i
∑ x i ∑ x i2|
=n∑ x i y i−∑ x i∑ y i
n∑ xi2−(∑ xi )
2
Datele necesare calculării celor doi parametri sunt prezentate în Tabelul 36a=b=Funcţia de regresie este: Yxi=i
Valorile funcţie de regresie se obţin înlocuind xi cu valorile empirice.Parametrul b=19,87 se interpretează astfel: creşterea numărului de ore cu o unitate, ar determinat o creştere a salariului net, în medie cu 19,87 lei.
Tabelul 37Nr ctr. xi yi x i
2 xiyi Yxi=1.2.3.4.5.6.7.8.9.10.
Total
a) Raportul de corelaţie liniară simplă se ca calcula cu formula:
R y /x=√1−∑ ( yi−Y x i
)2
∑ ( y i− y )2
Tabelul 38Nr. crt
xi yiYxi (yi - Yxi)2 (yi - y )2 y i
2
1.2.3.4.5.9.7.
Pag. 20 din 21
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale”
Nume prenume
8.9.10.
Unde: y=R y /x=
Se poate spune că legătură este strânsă (Ry/x=....) şi gradul de determinaţie R y /x2 =2¿ ¿
este de ......... sau de ................b) Metoda coeficientului de corelaţieIntensitatea legăturii se măsoară prin coeficientul de corelaţie (ry/x).
r y /x=n∑ x i y i−∑ x i∑ y i
√ [n∑ x i2−(∑ x i)
2 ]⋅[ n∑ y i2−(∑ y i )
2]=
¿Rezultă că legătura dintre aceste două variabile este directă (rz/x>0) şi puternică.
Există legătură liniară intensă deoarece ry/x=Ry/x.
Pag. 21 din 21