interpretarea datelor statistice prin parametrii de pozitie
DESCRIPTION
Interpretarea datelor statistice prin parametrii de pozitie. Proiect realizat de alexandru corici , traian plosca si alexandru lutic. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/1.jpg)
Interpretarea datelor statistice prin parametrii de pozitiePROIECT REALIZAT DE ALEXANDRU CORICI, TRAIAN PLOSCA SI ALEXANDRU LUTIC
![Page 2: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/2.jpg)
Analiza si interpretarea datelor statistice legate de un studiu statistic s-a realizat pana la acest moment cu ajutorul frecventelor si a graficelor statistice. Cu ajutorul acestor caracteristici se poate observa cu usurinta variabilitatea marimilor care se obtin ca rezultat al unor masuratori.Desi exista aceasta variabilitate se observa o tendinta a datelor statistice de a se grupa in jurul unei anumite valori(tendinta centrala).
Pentru o serie statistica este interesant de gasit acea marime care survine cel mai des, acea marime care este cea mai reprezentativa pentru toata seria.O astfel de marime se numeste indicator sau parametru de pozitie deoarece arata pozitia elementelor principale ale seriei in cadrul acesteia.
Reprezentativitatea unor astfel de marimi este data de gradul de concentrare a datelor statistice in jurul lor.
![Page 3: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/3.jpg)
Valoarea medie a unei serii statistice
Se numeste valorea medie sau media variabilei statistice X,media aritmetica a tuturor valorilor variabilei statistice calculata pentru toate unitatile populatiei statistice.
Valoarea medie x¯reprezinta media aritmetica ponderata a valorilor x1….xp ale variabilei statistice cu ponderile n1…np
N
nx
nnnnxnxnx
x
p
iii
p
pp
1
21
2211
..........
![Page 4: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/4.jpg)
Exemplu: Sa calculam media variabilei statistice a seriei statistice din
urmatorul tabel:
Avem:
Asadar, concentrarea notelor la teza se realizeaza in jurul numarului 7,86
Nota(xi) 4 5 6 7 8 9 10Frecventa absoluta(ni)
1 4 5 7 13 14 6
86,750393
6141375416*1014*913*87*74*64*51*4
x
![Page 5: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/5.jpg)
Daca variabila statistica X este cantitativa de tip continuu,atunci in locul valorilor xi din formula se vor lua mediile aritmetice ale extremitatilor claselor de valori(valorile centrale ale claselor de valori).
Exemplu: Sa consideram seria statistica data de urmatorul tabel:
Inaltime Numar de tineri
Frecventa absoluta cumulata crescatoare
Frecventa absoluta cumulata descrescatoare
[155,160) 5 5 63[160,165) 12 17 58[165,170) 15 32 46[170,175) 20 52 31[175,180) 8 60 11[180,185] 3 63 3
![Page 6: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/6.jpg)
Pentru calcularea valorii medii a variabilei cantitative de tip continuu,vom scrie mai intai seria statistica ,i=1.6 unde este valoarea centrala a clasei
Valoarea medie a variabilei statistice este:
Se obtine ca: Asadar,tendinta valorilor variabilei statistice este aceea de
grupare in jurul valorii 169,32. Diferenta reprezinta abatarea de la medie a valorii
.Suma abaterilor de la medie a valorilor variabilei este 0.
Xi* 157,5 162,5 167,5 172,5 177,5 182,5ni 5 12 15 20 8 3
),( *ii nx
*ix )[ 1, ii xx
635,10667
3820151253*5,1828*5,17720*5,17215*5,16712*5,1625*5,157
x
32,169x
xxi
ix
ix
![Page 7: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/7.jpg)
Mediana seriei statistice
Fie seria statistica , ,ordonata si N efectivul total al populatiei statistice.
Mediana undei serii statistice ordonate este valoarea Me care imparte sirul ordonat al valorilor variabilei in doua parti,fiecare parte continand acelasi numar de valori.
)( , ii nx pi ,1
1,1 kxx kk
![Page 8: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/8.jpg)
Exemplu: 1.Daca o caracteristica ia urmatoarele 11
valori asezate in ordine crescatoare:1,3,3,3,4,5,6,6,7,8,8 atunci Me=5, deoarece exista 5 valori mai mici decat 5, si 5 valori mai mari.
2.Fie sirul crescator de valori ale unei caracteristici numerice distincte:1,3,3,3,4,6,7,8,8,9.Sirul valorilor are 10 elemente.In acest caz se alege drept mediana a seriei numarul Me= . Uneori se ia ca mediana oricare din numerele 4 sau 6.
5264
![Page 9: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/9.jpg)
Mediana unei serii statistice cu variabila
cantitativa discreta se obtine astfel: -se aseaza cele N valori ale variabilei in
ordine crescatoare sau descrescatoare; -daca N este numar impar atunci ,
iar daca N este numar par(N=2k) atunci 21 NxMe
21
kk xxMe
![Page 10: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/10.jpg)
Observatie! Daca valorile variabilei sunt numeroase ,se recomanda determinarea
frecventelor absolute cumulate, apoi se cauta valoarea variabilei care corespunde unitatii statistice situata la mijlocul seriei,sau intervalul care cuprinde acea unitate statistica.
Efectivul notal al populatiei este 94.Pozitia centrala a sirului ordonat al valorilor variabilei este 94/2=47.Unitatea statistica situata pe pozitia 47 corespunde celei de-a treia secvente cumulate crescatoare.Asadar Me=7.
Nota la teza 5 6 7 8 9 10Frecventa absoluta
16 16 62 12 10 8
Frecventa absoluta cumulata crescatoare
16 32 64 76 86 94
![Page 11: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/11.jpg)
Sa determinam acum mediana unei serii statistice cu variabila cantitativa de tip continuu.Pentru aceasta,sa consideram distributia unui lot de piese dupa diametrul lor masurat in mm.
Jumatate din efectivul total al populatiei este 60/2=30. Clasa de valori din seria frecventelor absolute cumulate careia ii corespunde cel putin jumatate din
efectivul total al populatiei se numeste clasa mediana. In cazul seriei date clasa mediana este [30,40).Presupunand ca pentru aceasta serie cresterea efectivului
este proportionala cu cresterea valorilor variabilei,avem: La cresterea efectivului cu (37-25) piese,corespunde cresterea valorilot variabilei cu (40-30)=10 mm; La cresterea efectivului cu (30-25) de piese ,ce crestere a valorilor variabilei corespunde?
Aplicand regula de trei simpla, se obtine: (30-25)*(40-30)/(37-25)=25/6=4,17 mm Rezulta ca mediana seriei statistice este Me=30+4,17=34,17 mm.
Diametrul(mm)
[10,20) [20,30) [30,40) [40,50) [50,60)
Frecventa absoluta
10 15 12 15 8
Frecventa cumulata crescatoare
10 25 37 52 60
![Page 12: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/12.jpg)
Mediana unei serii statistice cu variabila cantitativa de tip continuu se calculeaza cu formula: ,unde:
L=limita inferioara a clasei mediane; =cota medianei (daca N este par,atunci
=N/2,iar daca N este impar,atunci Ni-1=frecventa absoluta cumulata
crescatoare pana la clasa mediana; =frecventa absoluta corespunzatoare
clasei mediane; k=amplitudinea clasei mediane:
knNCLMei
iM *1
MCMC
21
NCM
in
ii xx 1
![Page 13: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/13.jpg)
Me=30+[(30-25)/12]*10=34,17 Se poate calcula si cu regula de trei simpla: (37-25)…………….(40-30)mm (30-25)…………....X mm X=(30-25)*(40-30)/(37-25)=25/6=4,17
mm→Me=30+4,17=34,17mm. Concluzie:Mediana seriei statistice este un indicator al
pozitionarii valorilor xi ale acesteia.Aceasta este utila in realizarea ierarhizarii valorilor.
![Page 14: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/14.jpg)
Modulul unei serii statistice In multe activitati economico-sociale
prezinta interes acele aspecte care survin cel mai frecvent in derularea lor.
De exemplu,compararea numarului de apeluri telefonice pe intervale mici de timp da posibilitatea determinarii perioadei din zi cand o centrala telefonica este cel mai mult solicitata si, in consecinta,da posibilitatea determinarii capacitatii optime a centralei.
Astfel de probleme se rezolva folosind parametrul statistic de pozitie numit modul sau dominanta.
![Page 15: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/15.jpg)
Modulul sau dominanta unei serii statistice ,reprezinta valoarea sau clasa de valori a variabilei care
corespunde celui mai mare efectiv si se noteaza Mo.Asadar,modulul sau dominanta este parametrul ce evidentiaza
valoarea variabilei care apare cel mai frecvent in multimea datelor. Exemplu: 1.Fie distributia unui grup de tineri dupa inaltimea masurata in cm:
Clasa mondiala este[175,180) careia ii corespunde cea mai mare frecventa.Modulul sriei poate fi exprimat prin valoarea centrala a clasei mondiale: .
pinx ii 1),,(
Inaltimea(cm)
[160,165)
[165,170)
[170,175)
[175,180)
[180,185)
[185,190)
Numarul de
tineri
4 14 27 35 14 6
5,1772180175
Mo
![Page 16: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/16.jpg)
![Page 17: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/17.jpg)
Pentru determinarea unei valori mai exacte a modulului unei
serii statistice cu date grupate in clase de valori,sa consideram o secventa a diagramei structurale a acesteia care sa contina si valorile din clasa modala [1,L).
Notam: =diferenta dintre frecventa clasei modale si aceea a clasei anterioare ei.
=diferenta dintre frecventa clasei modale si aceea a clasei urmatoare.
k=amplitudinea clasei modale,k=L-1
Conform graficului se obtine urmatoarea relatie de proportionalitate:
,relatie din care se obtine
Daca intervalul anterior clasei modale are frecventa mai mare decat a intervalului urmator clasei modale , atunci :
Pentru seria statistica din exemplu de mai sus se aplica formula a 2 –a si se obtine:
1
2
MoLMo
1
2
1 kLMo *21
2
kMo *121
1
38,176)175180(*)1435()2735(
)2735(175*121
1
kMo
![Page 18: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/18.jpg)
Observatii:
1. In cazul formulei a 2a Mo este mai este mai apropiat de 1. In cazul primei formule Mo este mai apropiat de L.
2. Mo coincide cu o valoare a variabilei statistice,reprezentand cea mai frecventa valoare a repartitiei.
3. Mo nu e influentat de valorile foarte mici sau foarte mari ale variabilei.
4. O serie statistica poate avea mai multe module.Modulul prezinta interes daca este unic.
![Page 19: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/19.jpg)
Dispersia.Abaterea medie patratica
Sa consideram urmatoarele seturi de date: {1,2,3,3,4,5} si {2,40;2,50;2,60;2,70;2,80;5} Se constata ca ambele siruri de date au valoarea medie
egala cu 3,sunt disticte ,iar datele primului sir sunt mai raspandite in raport cu media fata de cele ale setului al 2 lea.
Pentru a masura gradul de imprastiere a datelor unei serii statistice fata de medie se folosesc urmatorii parametri de pozitie: dispersia si abaterea medie patratica.
![Page 20: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/20.jpg)
Fiind data seria statistica ,dispersia valorilor
este media aritmetica ponderata a patratelor abaterilor de la medie ale valorilor variabilei.
Se noteaza:
In cazul datelor grupate in clase de valori,se considera abaterile centrelor claselor de valori de la medie.
Compararea dispersiilor a 2 serii statistice capata semnificatie in cazul cand sirurile de date sunt exprimate in aceeasi unitate de masura.
Fiind data seria statistica , se numeste abatere medie patratica a valorilor variabilei numarului , unde este dispersia seriei.
Asadar, .
pinx ii 1),,( pxxx ,...,2,1
N
nxx
nnnnxxnxxnxx
s
p
iii
p
pp
1
2
21
22
221
212
)(
...*)(...*)(*)(
pinx ii 1),,(2s 2s
N
nxx i
p
ii *)(
1
2
![Page 21: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/21.jpg)
Abaterea medie patratica da posibilitatea caracterizarii dispersiei
valorilor variabilei statistice.Astefel,o serie care este putin dispersata,adica prezinta valori ce sunt strans grupate in jurul valorii medii, conduce la o abatere medie patratica mica. Problema rezolvata:
Distributia unui lot de autoturisme noi,dupa consumul de carburant la 100km parcursi,se prezinta astfel:
Sa se caracterizeze seria statistica folosind dispersie si abaterea medie patratica.
Fie valoarea centrala a clasei de valori ,i≥1
Consumul(L)
6,2-6,6
6,6-7 7-7,4 7,4-7,8
7,8-8,2
8,2-8,6
8,6-9 9-9,4 9,4-9,8
Nr,autoturisme
4 12 44 90 107 86 36 15 6
in
*ix ),[ 1ii xx
![Page 22: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/22.jpg)
Pentru concentrarea calculelor vom atasa la tabelul de date de mai sus
urmatoarele rubrici:
Cu ajutorul calculelor din acest tabel, avem:
6,4 6,8 7,2 7,6 8,0 8,4 8,8 9,2 9,6 Total:-
25,6 81,6 316,8
684 856 722,4 316,8 138 57,6 3198,8
10,24 17,28
28,16
14,40 0 13,76 23,04 21,60 15,36 143,84
*ix
ii nx*
ii nxx 2* )(
ln
nxx
i
iii
998,7400
8,3198
9
1
*
3596,040084,143
*)(9
1
2*
2
i
iii
n
nxxs
l5997,03596,0
![Page 23: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/23.jpg)
Se observa ca pentru esantionul de 400 de autoturisme consumul mediu la 100 km este de aproximativ 8 litri.
Dispersia valorilor consumului de carburant in jurul valorii medii 8 este de 0,3596 litri.Valoarea mica a acesteia sugereaza faptul ca valorile consumului de carburant sunt destul de stranse in jurul mediei.
Dispersia valorilor consumului de carburant in jurul valorii medii,masurata prin abatarea medie patratica este de 0,5997 litri.Aceasta arata ca valorile consumului de carburant se abate in medie cu aprozimativ 0,6 litri(in plus sau in minus) de la consumul mediu.
Definitie: Raportul dintre abaterea medie patratica si valoarea medie a unei serii statistice se numeste coeficient de variatie.Se noteaza:
Acest indicator da posibilitatea aprecierii gradului de omogenitate a unei serii statistice.Un coeficient de variatie sub 15% indica o omogenitate buna a repartitiei unui fenomen si ca valoarea medie este reprezentativa.
)(xCV
![Page 24: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/24.jpg)
Exemplu: Pentru seria statistica din tabelul anterior se obtine:
Interpretare: Coeficientul de variatie 7,5% indica o omogenitate a consumului de carburant. Asadar, lotul de masini are un ritm de consum bun (nici prea mare, nici prea mic).
%5,785997,0
)(
xCV
![Page 25: Interpretarea datelor statistice prin parametrii de pozitie](https://reader033.vdocuments.pub/reader033/viewer/2022061615/568162bf550346895dd34e98/html5/thumbnails/25.jpg)
THE ENDVa multumim pentru atentie!