elemente de statistica descriptiva
DESCRIPTION
descriereTRANSCRIPT
Elemente de statistică descriptivă
1. Date statistice
a) Populaţie statisticăPentru a face o cercetare statistică este necesar în primul rând a avea o
populaţie.Prin populaţie înţelegem de fapt o mulţime (finită) oarecare P.De regulă se consideră mulţimile definite drept totalitatea unor
elemente cu o proprietate şi nu printr-o enumerare.
Exemple de populaţie:a) muncitorii dintr-o interprindere;b) elevii unei unităţi şcolare;c) populaţia unei localităţi.Este nevoie ca elementele populaţiei să aibă o caracteristică sau mai
multe. Fiecare individ trebuie să aiba caracteristicile bine determinate. Deci trebuie să avem o mulţime C de caracteristici si o funcţie f:P C.
b) Caracteristici calitative şi cantitativeExistă doua feluri de caracteristici: cantitative şi calitative. În cazul
în care caracteristicile sunt numere, caracteristica se numeşte cantiativă. În cazul în care caracteristicile nu apar ca numere, caracteristica se numeşte calitativă.
c) Enumerarea completă şi selecţiaNumim enumerare completă cazul în care informaţiile sunt luate de la
fiecare individ al unei populaţii.De obicei se face un sondaj adica, se alege din populaţia statistică o submulţime şi pe această submulţime se realizeaza un studiu restrâns.
O asemenea submulţime a unei populaţii statistice este numită eşantion sau selecţie.
d) Gruparea datelor statisticeDatele statistice, la început sunt o masă dezordonată de date.
Ele pot fi obţinute prin analza în timp. Rezultatele obţinute de elevii unei clase de matematică pot fi prezentate intr-un tabel ca cel de mai jos:
Tabel 1Nota 2 3 4 5 6 7 8 9 10Nr.elevi 1 1 2 4 7 15 6 2 1
Din acest tabel putem trage concluzii referitoare la nivelul la
care s-a prezentat clasa respectivă la teza.
Distribuţia a 100 de şuruburi după diametrul lor se prezintă întabelul 2.
Tabelul 2Diametrul în mm 2 3 4 5 6 7 8 9 10 11 12 13
Nr. de şuruburi 1 4 7 11 15 20 16 13 7 4 1 1
Din tabelele 1 şi 2 rezultă ca analiza statistică a unui fenomen, în raport cu o singură caracteristică, ne conduce la o serie de perechi de valori, pe care o vom numi serie statistică.
Populaţia statistică a clasei a X-a H
Clase de valori în centimetri Nr. de persoane 160-165 165-170 170-180 180-185
4 8 9 4
Total 25
2. Frecvenţă absolută şi frecvenţă relativă
Definitie: Numărul tuturor elementelor unei populaţii statistice se
numeşte efectivul total al acelei populaţii şi se notează cu N.Definiţie:
Se numeşte frecvenţă absolută a unei valori a caracteristicii numărul de unităţi ale populaţiei corespunzătoare acelei valori.Definiţie:
Se numeşte frecvenţă relativă a unei valori a caracteristicii raportul dintre frecvenţa absolută a valorii şi efectul total al populaţiei şi se scrie : f( ) = , unde f( ) este frecvenţa relativă a valorii ,n este frecvenţa absolută a acestei valori iar N efectul total al populaţiei. Deseori frecvenţa relativă este dată în proporţii.
Exemplu:Un număr de 30 de elevi de la o unitate şcolară au fost întrebaţi
la câte meciuri de fotbal au participat. Elevii au dat următoarele răspunsuri:4,6,6,5,9,3,2,4,3,3,2,4,7,1,5,8,6,1,12,6,9,9,10,8,2,12,5,1,5,8.
Împărţim intervalul de variaţie al datelor obţinute într+un număr de subintervale pe care le numim clase.[1,3), [3,5),[5,7),[7,9),[9,11),[11,13). Fiecare clasă are limite şi un centru. Un interval se va nota cu [xi,xi+1) , centrul clasei cu xi şi
frecvenţa cu ni. Evident N= ,k fiind numărul de intervale.
Definiţie:Frecvenţa relativă a intervalului i este .
Frecvenţa cumulată corespunzătoare clasei i este . Se
întocmeşte un tabel în care se ilustrează repartiţia frecvenţelor pe diferite clase. Acest tip de tabel se numeşte tabel de frecvenţa.Pentru exemplul nostru tabelul arată astfel:
Numărulclasei
Limitele clasei
Mijlocul clasei
Frecvenţa ni
Frecvenţa cumulată
Frecventa relativă a clasei
Frecventa relativă cumulată
1 [1,3) 2 6 5 1/5 1/6 2 [3,5) 4 6 12 1/5 2/5 3 [5,7) 6 8 20 4/15 2/3 4 [7,9) 8 4 24 2/15 4/5 5 [9,11) 10 4 28 2/15 14/15 6 [11,13) 12 2 30 1/15 1
Din tabel rezultă că în clasa [1,3), un număr de 6 elevi au participat la unul sau două meciuri în timpul vacanţei (frecvenţa ni=6).3.Reprezentarea grafică a datelor statistice cu o singură
caracteristicăReprezentarea grafică a unei serii este uneori foarte sugestivă,
ea contribuind la o primă interpretare intuitivă, pe cale vizuală a datelor.Deseori reprezentarea grafică sugerează insăşi legea pe care o urmează fenomenul studiat.
Graficul corespunzător unei serii statistice poartă numele de diagramă.
Să considerăm de exemplu distribuţia mediilor de pe primul semestru la o şcoală generală.
1 Sub 5 12 2 Între 5 şi 6 89 3 Între 6 şi 7 149 4 Între 7 şi 8 356 5 Între 8 şi 9 137 6 Între 9 şi 10 28
Reprezentare prin sectoare de cerc(Fig.2)
Reprezentare prin dreptunghi (Fig.1)
Datele pot fi reprezentate prin dreptunghiuri (Fig.1) de baze egale şi cu înălţimi proporţionale cu numărul de note sau prin sectoare de cerc (Fig.2), cu unghiurile proporţionale cu aceleaşi numere. 4.Elemente caracteristici ale unei serii caracteristici
a) Valuarea centrală a unei clase de variaţieDefiniţie:
Se numeşte valuare centrală a unei clase de variaţie media aritmetică a extremităţilor acestei clase.Exemplu:
Valuarea centrală a clasei 180-185 din tabelul 4 este 182,5.b) Mărimi medii1) Dacă în cadrul unei selecţii am obţinut n valori distincte x1,x2,x3,...,xn,
se ştie că media lor aritmetică este:
2)Dacă valorile variabilei x=(x1,x2,…,xn)apar respectiv cu frecvenţele y1,y2,...,yn, atunci valuarea medie a variabilei x este:
= (1)
Formula (1) se numeşte media aritmetică ponderată a numerelor x1,x2,...,xn, iar numerele y1,y2,...yn, ponderile respective a acestor valori.
Elemente de date statisticeO mare importanţă în realizarea unor prognoze cât mai exacte îl
constituie studierea valorilor caracteristice analizate în jurul mediilor. Modul de a analiza nu este unic, iar semnificaţiile care se desprind depind de modul de organizare şi de metodologia de calcul.
1)Amplitudinea se defineşte ca diferenţa dintre cea mai mare valuare şi cea mai mică valuare caracteristică, adică A=nmax-nmin.
2)Abaterea medie liniară se defineşte prin = .
3)Dispersia se defineşte prin expresia .
4)Abaterea medie se defineşte ca rădăcină pătrată a dispersiei,adică .
5)Coeficientul de variaţie care se defineşte ca : .Tabelul următor exprimă în primele două coloane distibuţia unor piese
după diametrul lor.
Clase Frecventa absolută
Valuarea centrală
xiyi xi- (xi- )2 (xi- )2yi Dispersia si abaterea medie
10-2020-3030-4040-5050-60
10151215
1525354555
150375420675
-19,3-9,30,710,720,7
372,4986,490,49114,49428,19
3724,901297,355,881717,35
Stavăr Ioana CristinaClasa a X-a H