Ligjërata 3
Statistika përshkruese
Madhësitë mesatare dhe të variacionit
Në këtë kaptinë ju do të mësoni:
Të përshkruani karakteristikat e madhësive mesatare, variacionit dhe formën e shpërndarjes së të dhënave numerike.
Të llogaritni treguesit deskriptiv për mostër dhe populacion dhe të bëni dallimet në mes të tyre.
Të llogaritni treguesit relativ të variacionit
Të kuptoni se si përdoret Excel për llogaritjen e statistikave përshkruese.
Matësit e tendencës qendrore, variacionit dhe forma e shpërndarjes ◦ Mesatarja aritmetike, mediana, moda, mesatarja
gjeometrike
◦ Rangu, Rangu i interkuartilit, varianca dhe devijimi standard, koeficienti i variacionit
Përmbledhje e matësve të popullimit
◦ Mesatarja, varianca, dhe devijimi standard
◦ , etj
Mesatarja aritmetike
Mediana
Moda
Përshkrimi i të dhënave numerike
Varianca
Devijimi standard
Koeficienti i variacionit
Rangu
Interkuartili i rangut
Mesatarja gjeometrike
Asimetria
Tendenca qendrore Variacioni Forma e
shpërndarjes Kuartilet
Tendenca qendrore
Mes. aritmetike Mediana Moda Mes. gjeometrike
n
X
X
n
i
i 1
1 2( )nnG X X X
Vështrim
Vlera e mesit
e të dhënave
të renditura
Vlera e
shfaqur më
së shpeshti
Mesatarja aritmetike është treguesi më i shpeshtë që mat tendencën qendrore të dhënave ◦ Për mostër me madhësi n:
Madhësia e
mostrës
n
XXX
n
X
X n21
n
1i
i
Vlerat e vrojtuara
Matësi më i shpeshtë i tendencës qendrore
Mesataja = shuma e vlerava e ndarë për numrin e vlerave
E ndikuar nga vlerat ekstreme (outliers)
(vazhdim)
0 1 2 3 4 5 6 7 8 9 10
Mesatarja = 3
0 1 2 3 4 5 6 7 8 9 10
Mesatarja = 4
35
15
5
54321
4
5
20
5
104321
Në një renditje të dhënave mediana është vlera e “mesit” ( 50% mbi dhe 50% nën)
Nuk ndikohet nga vlerat ekstreme
0 1 2 3 4 5 6 7 8 9 10
Median = 3
0 1 2 3 4 5 6 7 8 9 10
Median = 3
Vendi i medianës/Rangu i medianës/Pozita e medianës
◦ Nëse numri i të dhënave është tek, medianë është numri i
mesit.
◦ Nëse numri i të dhënave është qift, mediana është mesatare aritmetike e dy numrave të mesit
Veni re nuk është vlera e medianës, por
vetëm pozita e medianës në të dhënat e rregullura.
1
2
nPozitae medianes pozicioni ne te dhenat e renditura
2
1n
Matës i tendencës qendrore;
Vlera që paraqitet më së shpeshti;
Nuk ndikohet nga vlerat ekstreme;
Përdoret për të dhënat numerike dhe nominale;
Mund të mos ketë modë;
Mund të ketë disa moda.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Ska Mode
Ch
ap
3-
11
Pesë shtëpi afër plazhit
$2,000 K
$500 K
$300 K
$100 K
$100 K
Çmimet e shëpive:
$2,000,000
500,000
300,000
100,000
100,000
Mes. aritmetike: ($3,000,000/5) = $600,000
Mediana: Vlera e mesit e të
dhënave të rregulluara = $300,000
Moda: Vlera e shfaqur më së shpeshti = $100,000
Çmimet e shtëpive:
$2,000,000
500,000
300,000
100,000
100,000
Sum $3,000,000
Mes. Aritmetike në përgjithësi përdoret, edhe pse ekzistojnë vlerat ekstreme
Mediana shpesh përdoret, meqë mediana nuk është e ndieshme ndaj vlerave ekstreme.
◦ Shembull: Çmimi medial i shtëpive do të mund të
raportohej për regjionin- sepse është më pak e ndieshme ndaj vlerave ekstreme
14
E dobishme për gjetjen e ndryshimeve mesatare të përqindjeve, normave , indekseve dhe normës së rritjes përgjatë kohës.
Ka aplikim shumë të gjerë në biznes dhe ekonomi sepse ne jemi të interesuar në gjetjen e ndryshimeve në përqindje, ndryshimeve në shitje, paga ose në tregues të tjerë ekonomik si GDP të cilat ndërtohen prej një vit në një vit tjetër.
Mesatarja gjeometrike gjithmonë do të jetë më e vogël ose e barabartë me mesataren aritmetike.
Mesatarja gjeometrike e një grumbulli të dhënash definohet si rrënja e n të prodhimit të n vlerave.
Formula për mesataren gejometrike është :
1 2( )nnG X X X
Shembull:
Supozojmë se individi “X” ka rritje të pages 5% në këtë vit dhe 15% në vitin e ardhshëm. Rritja mesatare është 9.886% e jo 10%.
Vertetim:
Rritja e pare: 3000x0.05 = 150
Rritja e dytë: 3150x0.15 = 472
Gjithsej rritja= 150+472=622.50, kjo është ekuivalente me:
3000x0.9886=296.58
3296.58x 0.9886= 325.90
Gjithsej rritja: 296.58+ 325.90=622.48 =622.50
15
1.05 1.15 1.2075 1.09886 1 0.09886 100 9.886%
1.09886 100 109.886 100 9.886%
G x
ose
Një përdorim tjetër i mesatares gjeometrike është gjetja e normës mesatare të rritjes së shitjeve , prodhimit, apo ndonjë kategorie tjetër ekonomike prej një periudhe në një periudhë tjetër.
Formula për kësi lloj problemesh është:
16
1
1nn
NG
N
Të dhënat e periudhës së fundit
Të dhënat e periudhës së
fillimit Numri i viteve
17
Në vitin 1950 në Organizatën e Kombeve të Bashkuara kanë qenë të anëtarësuara 50 shtete. Në vitin 1996 ky numër është rritur në 185 shtete. Sa është norma mesatare vjetore e rritjes së anëtarësimit për këtë periudhë.
46185
1 0,0288550
G
Norma mesatare e shtimit është 2,885% 0,02885x100=2.885%
Mesatarja aritmetike e ponderuar Mesatarja aritmetike e ponderuar është rast
i veçantë i mesatares aritmetike dhe llogaritet në rastet kur ka disa vrojtime në të njejtën modalitet, gjegjësisht kur të dhënat grupohen në distribucionin e frekuencave.
Mesatarja aritmetike e ponderuar llogaritet në rastet ku përveç vlerave të X janë edhe të dhënat për denduritë, gjegjësisht kur frekuencat nuk janë të barabarta , ashtu që njëri modalitet peshon me shumë e tjetri më pak.
Mesatarja aritmetike e ponderuar quhet edhe mesatare aritmetike e “peshuar”
19
Formula për llogaritjen e mesatares aritmetike të ponderuar është:
Simbolet:
1
1
nf Xi i
iX nfi
i
(iks bar)-prezanton simbolin për mesataren
aritmetike të mostrës
f- frekuencat në çdo klasë
fx - është prodhimi i frekuencave me vlerat e x
X - prezanton vlerat individuale të çdo modaliteti
fx - prezanton shumën e përgjithshme të këtyre
produkteve.
X
Kompania ndërtimore paguan në orë punëtorët e
vet: $16.50, $19.00, ose $25.00 në orë. Gjithësej
janë të punësuar 26 punëtorë, 14 prej tyre
paguhen me $16.50 në orë, 10 prej tyre me
$19.00 në orë, dhe 2 prej tyre $25.00 ne orë.
Mesatarisht sa paguhen punëtorët e kësja firme?
20
14 16,5$ 10 19$ 2 26$ 47118.1154$
14 10 2 261
1
x x x
nf Xi i
iX nfi
i
21
Pagat ($)
(X)
Nr.i punëtorëve
(f)
(X)x(f)
16.5 14 231
19.0 10 190
25.0 2 50
Σ 26 471
1
1
47118,1154$ 18$
26
n
i i
i
n
i
i
X f
X
f
22
Pagat ($) (X) Nr.i
punëtorëve (f)
Frekuencat
.kumulative
16.5 14 14
19.0 10 24
25.0 2 26
Σ 26
Për gjetjen e Medianës duhet të gjejme frekuencat kumulative dhe pozitën e medianës
Rme=Σf/2+1= 26/2+1=14
Me = 16.5& $
Moda është vlera që përsëritet më së shpeshti. Ne rastin konkret Moda=16.5,$ sepse numri më i madh i punëtorëve merr ketë pagë
Mesatarja aritmetike
23
Eksporti ne
(000€) Nr. i firmave
Mesi i
intervalit (X)
0 deri4 25 2 50 4 deri 8 35 6 210 8 deri 12 42 10 420 12 deri16 35 14 490 16 deri 20 25 18 450
162 1620
X f
Se pari gjejme mesin e intervalit
Frekuencat Shumëzojmë frekuencat me mesin
e intervalit
1
1
162010$
162
n
i i
i
n
i
i
X f
X
f
X
Mediana, shembull
24
Eksporti ne
(000€) Nr. i firmave
Frekuencat
kumulative 0 deri4 25 25 4 deri 8 35 (w1) 60 8 deri 12 (fme ) 42 102 12 deri16 35 137 16 deri 20 25 162
162
Se pari ,gjejme Frekuencat kumulative Se dyti, gjejmë pozitën e medianës: Rme=Σf/2+1=162/2+1=82
Elementi i 82 gjindet në grupin 8 deri 12; X1 = 8; d= 4
Frekuencat
11
/ 2
81 608 4 10$
42
me
f wMe X d
f
Me
Formula për gjetjen e medianës
Pse duhet të studiohet variacioni? ◦ Madhësitë mesatare si mesatarja aritmetike ose
mediana , përshkruajnë vetëm qendrën e të dhënave. Kjo është e vlefshme nga ky këndvështrim, mirëpo neve nuk na tregon asgjë rreth shpërndarjes së të dhënave.
◦ Për shembull , nëse të dhënat ju thonë se thellësia mesatare e lumit është 3 këmbë thellë, a do të vendosni që të kaloni lumin këmbë. Sipas të gjitha gjasave jo. Ju doni të dini edhe informata shtesë rreth variacionit të thellësisë së lumit.
◦ Arsye e dytë për të studiuar dispersionin në një grumbull të dhënave është që të bëhet krahasimi i shpërndarjes në dy apo më shumë distribucione.
25
Chap 3-26
Qendra e njejtë,
Variacione te ndryshme
Variacioni
Varianca Devijimi
standard
Koeficienti i
variacionit
Rangu Rangu i
interkuartilit
Treguesit e variacionit
japin informata për
shpërndarjen e
variabilitetit të vlerave të
dhënave .
Treguesi më i thjeshtë i variacionit
Diferenca në mes të vlerës më të madhe dhe vlerës më të vogël në një grumbull të dhënash:
Rangu = Xmax – Xmin
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Rangu = 14 - 1 = 13
Shembull:
Nuk e përfill rregullin e renditjes së të dhënave
I ndieshëm ndaj vlerave ekstreme
7 8 9 10 11 12
Range = 12 - 7 = 5
7 8 9 10 11 12
Range = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Range = 5 - 1 = 4
Range = 120 - 1 = 119
Mesatare (e përafërt ) e devijimeve të ngritura në katror të vlerave nga mesatarja e tyre.
◦ Varianca e mostrës:
1-n
)X(X
S
n
1i
2
i2
Ku = mesatarja aritmetike
n = madhësia e mostrës
Xi = ith vlerat e variablës X
S2 – simboli për variancë
X
Treguesi më i shpeshtë i matjes së variacionit;
Tregon variacionet rreth mesatares;
Është rrënja katrore e variancës;
Shprehet në njësi të njejta të matjes sikurse edhe të dhënat.
◦ Devijimi standard i mostrës:
1-n
)X(X
S
n
1i
2
i
Te dhënat e
Mostrës (Xi) : 10 12 14 15 17 18 18 24
n = 8 Mesatarja = X = 16
Matës i devijimeve “mesatare”
rreth mest. aritmetike.
Devijim standard i vogël
Devijim standard i madh
Mes. = 15.5
S = 3.338 11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
Të dhënat B
Të dhënat A
Mest. = 15.5
S = 0.926
11 12 13 14 15 16 17 18 19 20 21
Mest. = 15.5
S = 4.567
Të dhënat C
35
Mat shumë mirë variabilitetin e të dhënave.
► Ka lidhje të ngusht me mesataren aritmetike.
► Është shumë i rëndësishëm për zhvillimin e teorisë statistikore.
► Gjindet lehtë përmes softverëve!
Matës i variacionit relativ
Gjithmonë shprehet në përqindje (%)
Tregon variacionin relativ në raport me
mesataren.
Mund të përdoret për krahasimin e dy apo
më shumë variabiliteve të shprehura në njësi
të ndryshme të matjes.
Fletëaksioni A:
◦ Çmimi mesatar vitin e kaluar= $50
◦ Devijimi standard= $5
Fletëaksioni B:
◦ Çmimi mesatar vitin e fundit = $100
◦ Devijimi standard = $5
Të dy
fletëaksionet
kanë devijim
standard të
njejtë, mirëpo
fletëaksioni B
është më pak
variabil rreth
çmimit të tij.
Statistikat deskriptive mund të gjinden përmes Microsoft® Excel
◦ Përdorni zgjedhjet e menysë:
Data / data analysis / descriptive statistics
◦ Shkruani detajet në kutinë e dialogut
Nëse në menynë Data nuk gjindet data
analysis, atëherë duhet të instaloni këtë meny sipas procedurave të prezantuara në fotot
vijuese sipas hapave 1, 2, 3,4, 5, 6, 7, 8)
Pasi keni përfunduar me proceduren e instalimit (1 deri 8) në menynë “Data” do të paraqitet menyja e re “Data Analysis”, e cila ka shumë zgjedhje rreth metodave statistikore, per qëllime të statistikave përshkruese do të
zgjedhim “Descriptive statistics”
Përdorni menynë
kryesore:
Data / data analysis /
Descriptive statistics
Shkruani detajet ne kutine e dialogut
Kontrolloni kutinë për “Sumary Statistics”
Klikoni OK
(vazhdim)
Rezultati i statistikave
deskriptive
përmes Excel-it,
Shfrytëzimi i të dhënave për
çmimet e shtëpive:
Çmimet e shtëpive:
$2,000,000
500,000
300,000
100,000
100,000
Treguesit përmbledhës të populacionit quhen
parametera
Mesatarja e populimit është shuma e vlerave në
populacion e ndarë me madhësinë e populacionit
N
N
XXX
N
XN21
N
1i
i
μ = mesatarja e popullimit
N = Madhësia e popullimit
Xi = ith vlerat e variablës X
Ku
Mesatare e devijimeve të ngritura në katror të vlerave nga mesatarja e tyre.
◦ Varianca e populacionit:
N
μ)(X
σ
N
1i
2
i2
Ku σ2= Varianca e populimit
N = Madhësia e populimit
Xi = ith vlerat e variablës X
Matësi më I shpeshtë I variacionit
Tregon variacionet rreth mesatares
Është rrënja katrore e variancës së popullimit
Ka njësi të njejtë të matjes sikurse të dhënat origjinale
◦ Devijimi standard i populimit:
N
μ)(X
σ
N
1i
2
i
Populacioni Mostra
Madhësia N n
Mesatarja
Varianca
Devijimi
standard
Populacioni Mostra
Madhësia N n
Mesatarja
Varianca
Devijimi
standard
1
N
i
i
X
N
n
X
X
n
i
i 1
1-n
)X(X
S
n
1i
2
i
N
μ)(X
σ
N
1i
2
i2
1-n
)X(X
S
n
1i
2
i2
N
μ)(X
σ
N
1i
2
i
Përshkrimi i treguesve të tendencës qendrore
◦ Mesatarja aritmetike, mediana, moda, mesatarja
gjeometrike.
Përshkrimi i treguesve të variacionit
◦ Rangu, Rangu i interkuartilit, varianca dhe devijimi
standard, koeficienti i variacionit,
◦ Përdorimi i Excel-it për statistika përshkruese