charakterystyki opisowe rozkładu jednej cechy wykład 3 dr małgorzata radziukiewicz
DESCRIPTION
Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz. Klasyfikacja miar statystycznych. ze względu na informacje, jakie przynoszą one o rozkładzie cechy w zbiorowości: Miary poziomu Miary dyspersji Miary asymetrii. Klasyfikacja miar statystycznych. - PowerPoint PPT PresentationTRANSCRIPT
Charakterystyki opisowe Charakterystyki opisowe rozkładu jednej cechyrozkładu jednej cechy
Wykład 3Wykład 3
dr Małgorzata Radziukiewiczdr Małgorzata Radziukiewicz
Klasyfikacja miar statystycznychKlasyfikacja miar statystycznych
ze względu na informacje, jakie przynoszą one o rozkładzie ze względu na informacje, jakie przynoszą one o rozkładzie cechy w zbiorowości:cechy w zbiorowości:
Miary poziomuMiary poziomu Miary dyspersji Miary dyspersji Miary asymetrii Miary asymetrii
Klasyfikacja miar statystycznychKlasyfikacja miar statystycznych
ze względu zakres danych niezbędnych do wyliczenia tych ze względu zakres danych niezbędnych do wyliczenia tych miar:miar:
● ● miary klasycznemiary klasycznedla wyliczenia tych miar wykorzystuje się wartości cechy dla wyliczenia tych miar wykorzystuje się wartości cechy zaobserwowane u zaobserwowane u wszystkich badanych jednostekwszystkich badanych jednostek
● ● miary pozycyjnemiary pozycyjnedla wyliczenia tych miar wykorzystuje się wartości cechy dla wyliczenia tych miar wykorzystuje się wartości cechy tylko tylko niektórych jednostekniektórych jednostek, wybranych ze względu na , wybranych ze względu na pozycję, jaka zajmują one w uporządkowanym ciągu pozycję, jaka zajmują one w uporządkowanym ciągu zaobserwowanych jednostek cechyzaobserwowanych jednostek cechy
Klasyfikacja miar statystycznychKlasyfikacja miar statystycznych
dodatkowo, miary statystyczne mogą być miarami:dodatkowo, miary statystyczne mogą być miarami:
● ● absolutnymiabsolutnymimianowanymi, a więc wyrażonymi w mianie badanej cechy mianowanymi, a więc wyrażonymi w mianie badanej cechy – lata, metry, sztuki, kilogramy, godziny itp..– lata, metry, sztuki, kilogramy, godziny itp..
● ● względnymi (stosunkowymi)względnymi (stosunkowymi)niemianowanymi, wyrażonymi w ułamku lub w procencie – niemianowanymi, wyrażonymi w ułamku lub w procencie – uzyskanymi poprzez podzielenie przez siebie odpowiednich uzyskanymi poprzez podzielenie przez siebie odpowiednich miar absolutnychmiar absolutnych
Miary jednej cechyMiary jednej cechy
Miary poziomu Miary poziomu
Miary poziomuMiary poziomu rozkładu liczebności rozkładu liczebności zwane są zwane są wartościami przeciętnymiwartościami przeciętnymi
(lub (lub średnimiśrednimi))
najbardziej rozpowszechnione w praktycenajbardziej rozpowszechnione w praktyce zacierają różnice indywidualne badanych jednostekzacierają różnice indywidualne badanych jednostek o wartości liczbowej tej miary decydują wartości liczbowe o wartości liczbowej tej miary decydują wartości liczbowe
cechy posiadane przez wszystkie jednostki populacjicechy posiadane przez wszystkie jednostki populacji za pomocą jednej liczby podają centralną tendencję za pomocą jednej liczby podają centralną tendencję
(poziom wartości zmiennej) (poziom wartości zmiennej)
Miary przeciętne
Miary klasyczne Miary pozycyjne
MedianaDominanta (moda)
Kwantyle
Średnia arytmetycznaŚrednia geometryczna
Miary przeciętne
klasyczne
Średnia arytmetycznaŚrednia geometryczna
są wypadkowymi wartościami wszystkich odmian cechy
wszystkich badanychjednostek zbiorowości
Miary przeciętne
pozycyjne
MedianaDominanta (moda)
Kwantyle
wskazują na określoną pozycję
jednostek
Miary przeciętne
pozycyjne
Mediana
wskazują na określoną pozycję
jednostek
pozycja środkowa
Dominanta (moda) pozycja najczęstsza (typowa)
Kwantyle uporządkowaną populację dzielą na części
Podstawową i najbardziej znaną miarą Podstawową i najbardziej znaną miarą położenia i jednocześnie miarą tendencji położenia i jednocześnie miarą tendencji centralnej jest centralnej jest średniaśrednia
Jest to średnia arytmetyczna wartości cechyJest to średnia arytmetyczna wartości cechy
Aby wyznaczyć poziom średniej Aby wyznaczyć poziom średniej badana badana cecha musi być mierzalnącecha musi być mierzalną
Jak otrzymać wartość średniej Jak otrzymać wartość średniej arytmetycznej dla danych indywidualnych?arytmetycznej dla danych indywidualnych? dysponując dysponując nn wartościami cechy: wartościami cechy:
w pierwszej kolejności obliczamy sumę tych wartości:w pierwszej kolejności obliczamy sumę tych wartości:
a następnie dzielimy przez liczbę obserwacji a następnie dzielimy przez liczbę obserwacji nn::
nxxxx ,.....,,, 321
nxxxx .....321
xn
x
n
xxxxśrednia n
...321
Średnia arytmetyczna jest pewną abstrakcyjną Średnia arytmetyczna jest pewną abstrakcyjną wielkością, wielkością, wypadkową wszystkich wypadkową wszystkich zaobserwowanych wartości cechyzaobserwowanych wartości cechy, powstałą wskutek , powstałą wskutek operacji matematycznejoperacji matematycznej
Obliczona wartość średnia z reguły przyjmuje Obliczona wartość średnia z reguły przyjmuje wartość w zbiorowości nie występującąwartość w zbiorowości nie występującą
Średnia arytmetyczna zaciera różnice indywidualneŚrednia arytmetyczna zaciera różnice indywidualne
Zmiana jakiejkolwiek wartości w zbiorze danych Zmiana jakiejkolwiek wartości w zbiorze danych pociąga za sobą zmianę wartości średniejpociąga za sobą zmianę wartości średniej
Jak otrzymać wartość średniej Jak otrzymać wartość średniej arytmetycznej dla danych arytmetycznej dla danych pogrupowanych?pogrupowanych?
w tym przypadku można uzyskać jedynie pewne w tym przypadku można uzyskać jedynie pewne przybliżenie, przyjmując, że każda jednostka nprzybliżenie, przyjmując, że każda jednostka ni i należąca do należąca do danej klasy ma wartość cechy równą wartościom środka danej klasy ma wartość cechy równą wartościom środka przedziału klasowego:przedziału klasowego:
k
ii
k
iii
k
kk
n
nx
nnnnn
nxnxnxnxnxx
1
1
4321
44332211
....
....
Właściwości średniej Właściwości średniej arytmetycznejarytmetycznej
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Wartość liczbowa średniej arytmetycznej ma Wartość liczbowa średniej arytmetycznej ma takie samo miano jak badana cechatakie samo miano jak badana cecha
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Średnia arytmetyczna zawiera się między Średnia arytmetyczna zawiera się między krańcowymi wartościami cechy:krańcowymi wartościami cechy:
maxmin xxx
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Średnia arytmetyczna obliczona z Średnia arytmetyczna obliczona z wartości sum wartości sum xxii + y + yii jest równa jest równa sumie średnich arytmetycznych sumie średnich arytmetycznych obliczonych oddzielnie dla obu obliczonych oddzielnie dla obu wartości:wartości:
yxyx
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Wartość średniej Wartość średniej arytmetycznej nie ulega arytmetycznej nie ulega zmianie, jeśli wszystkie zmianie, jeśli wszystkie wagi pomnożymy wagi pomnożymy przez liczbę stałą przez liczbę stałą cc::
xnc
xnc
n
xn
i
ii
i
ii
)(
.)(.
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Jeżeli zbiorowość (populację) liczącą Jeżeli zbiorowość (populację) liczącą nn elementów podzielimy elementów podzielimy na na r r podgrup (podpopulacji) o liczebnościach podgrup (podpopulacji) o liczebnościach ww11, w, w22, w, w33,,…….w…….wrr, wówczas średnia arytmetyczna całej zbiorowości , wówczas średnia arytmetyczna całej zbiorowości (populacji) jest równa średniej ważonej średnich (populacji) jest równa średniej ważonej średnich arytmetycznych arytmetycznych ( gdzie j = 1,2,…r) podgrup (podpopulacji), z ( gdzie j = 1,2,…r) podgrup (podpopulacji), z
wagami wagami wwjj ::
r
jj
r
jjj
k
ii
k
iii
w
xw
n
xnx
1
1
1
1
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Jeśli zmniejszymy każdy wariant Jeśli zmniejszymy każdy wariant cechy cechy xxii o stałą o stałą cc, to średnia , to średnia arytmetyczna też ulegnie arytmetyczna też ulegnie zmniejszeniu o stałą zmniejszeniu o stałą cc::
cxn
cxn
i
ii
)(
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Jeśli pomnożymy każdy wariant cechy xJeśli pomnożymy każdy wariant cechy x ii przez stałą przez stałą
cc, to nowa średnia arytmetyczna będzie c – , to nowa średnia arytmetyczna będzie c – krotnością średniej pierwotnej:krotnością średniej pierwotnej:
xcn
xcn
i
ii
).(
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Jeśli od każdego wariantu Jeśli od każdego wariantu xxii odejmiemy średnią odejmiemy średnią
arytmetyczną wówczas suma tych różnic jest równa arytmetyczną wówczas suma tych różnic jest równa zeru:zeru:
Powyższą własność formułujemy często w innej Powyższą własność formułujemy często w innej formie: formie: suma odchyleń od średniej arytmetycznej suma odchyleń od średniej arytmetycznej jest równa zeru:jest równa zeru:
0)( xxn ii
0)( xxi
Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej
Suma kwadratów odchyleń Suma kwadratów odchyleń wartości zmiennych badanej wartości zmiennych badanej cechy od średniej cechy od średniej arytmetycznej rozkładu jest arytmetycznej rozkładu jest najmniejszanajmniejsza
Oznacza to, że suma Oznacza to, że suma kwadratów odchyleń kwadratów odchyleń poszczególnych wartości poszczególnych wartości zmiennych badanej cechy od zmiennych badanej cechy od jakiejkolwiek innej wartości jakiejkolwiek innej wartości zmiennej rozkładu, różnej od zmiennej rozkładu, różnej od średniej, będzie zawsze średniej, będzie zawsze większawiększa
min)( 2xxi
OgraniczeniaOgraniczeniaw stosowaniuw stosowaniuśredniej arytmetycznejśredniej arytmetycznej
Niejednokrotnie średnia arytmetyczna nie Niejednokrotnie średnia arytmetyczna nie może być uznana za wielkość może być uznana za wielkość reprezentatywną dla całego danego zbioru, w reprezentatywną dla całego danego zbioru, w sensie wyrażania tendencji centralnej, jej sensie wyrażania tendencji centralnej, jej wartość poznawcza jest niewielka (lub nawet wartość poznawcza jest niewielka (lub nawet żadna), a niekiedy wprowadza po prostu w żadna), a niekiedy wprowadza po prostu w błąd błąd
Ograniczenia w stosowaniu średniej Ograniczenia w stosowaniu średniej arytmetycznejarytmetycznej
A.A. W przypadku, gdy przedziały klasowe są W przypadku, gdy przedziały klasowe są otwarte (górny i dolny lub jeden z nich).otwarte (górny i dolny lub jeden z nich).
a) gdy liczebności przedziałów a) gdy liczebności przedziałów otwartych są stosunkowo nieliczne, można je otwartych są stosunkowo nieliczne, można je zamknąć i umownie ustalić środek przedziału;zamknąć i umownie ustalić środek przedziału;
b) gdy udział liczebności przedziałów b) gdy udział liczebności przedziałów otwartych w ogólnej sumie liczebności jest otwartych w ogólnej sumie liczebności jest znaczny, rezygnujemy z obliczania średniejznaczny, rezygnujemy z obliczania średniej
Ograniczenia w stosowaniu średniej arytmetycznejOgraniczenia w stosowaniu średniej arytmetycznej
BB.. Gdy największe liczebności skupiają się zdecydowanie Gdy największe liczebności skupiają się zdecydowanie wokół najniższych lub najwyższych wartości cechy (wokół najniższych lub najwyższych wartości cechy (szereg szereg jest skrajnie asymetrycznyjest skrajnie asymetryczny).).
Mężczyźni w wieku produkcyjnym, bierni zawodowo, według wieku
21,04
23,52
4,872,73 2,84
4,3
6,73
9,5910,69
3,69
0
5
10
15
20
25
20 25 30 35 40 45 50 55 60 65wiek w latach
%
Ograniczenia w stosowaniu średniej arytmetycznejOgraniczenia w stosowaniu średniej arytmetycznej
C.C. Wartość poznawcza średniej jest żadna, Wartość poznawcza średniej jest żadna, wówczas, wówczas, gdy ustalamy średnią ze zbiorów gdy ustalamy średnią ze zbiorów niejednorodnychniejednorodnych
Ograniczenia w stosowaniu średniej Ograniczenia w stosowaniu średniej arytmetycznejarytmetycznej
D.D. Obliczanie średniej mija się z celem również w Obliczanie średniej mija się z celem również w tych szeregach, które dają rozkłady z kilkoma tych szeregach, które dają rozkłady z kilkoma skupiskami dominującymi (są to tzw. szeregi skupiskami dominującymi (są to tzw. szeregi wielomodalnewielomodalne))
Rys. Rozkład dwumodalny
W większości przypadków rozkłady cech mierzalnych W większości przypadków rozkłady cech mierzalnych (zwanych zmiennymi) charakteryzują się pewną (zwanych zmiennymi) charakteryzują się pewną tendencja centralną, która polega na tym, że w miarę tendencja centralną, która polega na tym, że w miarę wzrostu liczebności (częstości) zmniejszają się różnice wzrostu liczebności (częstości) zmniejszają się różnice pomiędzy wartościami zmiennej a wartością centralną.pomiędzy wartościami zmiennej a wartością centralną.
Rozkłady, które nie odpowiadają temu warunkowi, nie Rozkłady, które nie odpowiadają temu warunkowi, nie
powinny być opisywane za pomocą wartości średniej.powinny być opisywane za pomocą wartości średniej.
rozkłady skrajnie asymetrycznerozkłady skrajnie asymetryczne
Średnia Średnia geometrycznageometryczna
Średnią geometryczną n liczb jest Średnią geometryczną n liczb jest pierwiastek stopnia n z iloczynu tych pierwiastek stopnia n z iloczynu tych liczb.liczb.
Wykorzystywana jest Wykorzystywana jest do badania do badania zbiorowości, w których zbiorowości, w których wartości jednostek są wartości jednostek są przedstawiane w przedstawiane w liczbach względnychliczbach względnych
nng xxxx ...21
MedianaMediana
MedianaMediana odpowiada środkowi zbioru odpowiada środkowi zbioru danych, w którym to zbiorze wartości danych, w którym to zbiorze wartości cechy uporządkowano kolejno od cechy uporządkowano kolejno od najmniejszej do największej (czyli według najmniejszej do największej (czyli według rosnącej wartości cechy).rosnącej wartości cechy).
cecha jest skokowacecha jest skokowa jeśli liczba obserwacji n jest liczbą nieparzystą, mediana jeśli liczba obserwacji n jest liczbą nieparzystą, mediana
jest wartością, którą przybiera 0,5(n+1) jednostka jest wartością, którą przybiera 0,5(n+1) jednostka liczebności populacji (obserwacja środkowa):liczebności populacji (obserwacja środkowa):
jeśli liczba obserwacji n jest liczbą parzystą, mediana jest jeśli liczba obserwacji n jest liczbą parzystą, mediana jest średnią arytmetyczną wartości cechy dwóch sąsiadujących średnią arytmetyczną wartości cechy dwóch sąsiadujących jednostek o numerach porządkowych 0,5n oraz 0,5(n+2):jednostek o numerach porządkowych 0,5n oraz 0,5(n+2):
2
)1()( nxxM
2)( 2
2
2
nn xx
xM
cecha jest ciągłacecha jest ciągła wtedy szereg rozdzielczy jest pod postacią klasowych wtedy szereg rozdzielczy jest pod postacią klasowych
przedziałów odmian cechy i wówczas kumulacja przedziałów odmian cechy i wówczas kumulacja liczebności wskazuje tylko klasę, w której znajduje się liczebności wskazuje tylko klasę, w której znajduje się medianamediana
wyznaczenie mediany wymaga posłużenia się wzorem wyznaczenie mediany wymaga posłużenia się wzorem interpolacyjnym:interpolacyjnym:
gdzie:gdzie: xxm0m0 –dolna granica klasy mediany –dolna granica klasy mediany hhmm –rozpiętość przedziału klasy mediany –rozpiętość przedziału klasy mediany nnmm – liczebność przedziału klasy dominanty – liczebność przedziału klasy dominanty
m
mm
iim n
hn
nxxM
1
10 2
1)(
medianę M(medianę M(XX) można zdefiniować jako taką wartość cechy, że ) można zdefiniować jako taką wartość cechy, że prosta pionowa przechodząca przez nią dzieli obszar pod prosta pionowa przechodząca przez nią dzieli obszar pod krzywą na dwie równe częścikrzywą na dwie równe części
w praktyce medianę obliczamy w sytuacji, gdzie jedna lub w praktyce medianę obliczamy w sytuacji, gdzie jedna lub kilka wartości leży daleko od środka zbiorukilka wartości leży daleko od środka zbioru
mediana ma często zastosowanie w ekonomii w rozkładach mediana ma często zastosowanie w ekonomii w rozkładach dochodów dochodów
Uwaga!!!Uwaga!!! mediana ma sens tylko wtedy, gdy zbiór danych jest mediana ma sens tylko wtedy, gdy zbiór danych jest
uporządkowany rosnąco lub malejąco.uporządkowany rosnąco lub malejąco.
przykładprzykład
Sprzedaż filmowych kaset video ma ograniczenia czasowe Sprzedaż filmowych kaset video ma ograniczenia czasowe (na ekrany wchodzą coraz to nowsze filmy i „stare” szybko (na ekrany wchodzą coraz to nowsze filmy i „stare” szybko schodzą z ekranów kin).schodzą z ekranów kin).
Właściciel musi decydować rozsądnie, z jakimi filmami Właściciel musi decydować rozsądnie, z jakimi filmami nabyć taśmy.nabyć taśmy.
W tej sytuacji miary: - średnia i mediana – nie będą jemu W tej sytuacji miary: - średnia i mediana – nie będą jemu pomocne.pomocne.
Zamiast tego, właścicielowi potrzebna jest wiedza na temat, Zamiast tego, właścicielowi potrzebna jest wiedza na temat, które filmy są najbardziej popularne i cieszą się które filmy są najbardziej popularne i cieszą się największym zainteresowaniem, a zatem które filmy największym zainteresowaniem, a zatem które filmy prawdopodobnie będą sprzedawać się najlepiej.prawdopodobnie będą sprzedawać się najlepiej.
Dominanta (modaDominanta (moda))
charakterystyczne własności dominantycharakterystyczne własności dominanty
dominantadominanta znajduje zastosowanie wówczas, gdy znajduje zastosowanie wówczas, gdy chcemy jedną liczbą wyrazić wartość cechy chcemy jedną liczbą wyrazić wartość cechy najbardziej typową i najczęściej występującąnajbardziej typową i najczęściej występującą
istnieje możliwość stosowania dominanty w przypadku istnieje możliwość stosowania dominanty w przypadku analizy cech mierzalnych i niemierzalnychanalizy cech mierzalnych i niemierzalnych
dla cechy niemierzalnej dominantą jest ten wariant dla cechy niemierzalnej dominantą jest ten wariant cechy, która ma największą częstość występowania w cechy, która ma największą częstość występowania w badanej zbiorowościbadanej zbiorowości
dominanta jest dominanta jest jedyną miarąjedyną miarą przeciętną, która można przeciętną, która można wyznaczyć dla wyznaczyć dla cech niemierzalnychcech niemierzalnych
charakterystyczne własności dominantycharakterystyczne własności dominanty
jest również możliwe - dla dużych liczebności i jest również możliwe - dla dużych liczebności i odpowiadającym im różnym wartościom - więcej niż odpowiadającym im różnym wartościom - więcej niż jedna dominanta (moda); jedna dominanta (moda);
zbiór z 2-oma modami nazywamy dwumodalnym, zbiór z 2-oma modami nazywamy dwumodalnym, zbiory z 3-ema modami trzymodalnymi;zbiory z 3-ema modami trzymodalnymi;
zbiory mające powyżej 2 mód zwą się zbiory mające powyżej 2 mód zwą się wielomodalnymi;wielomodalnymi;
w diametralnie różnym przypadku, gdy każda wartość w diametralnie różnym przypadku, gdy każda wartość w zbiorze występuje tylko raz – zbiór nie ma mody.w zbiorze występuje tylko raz – zbiór nie ma mody.
w przypadku, kiedy wartości zmiennej pogrupowane są w przypadku, kiedy wartości zmiennej pogrupowane są w szereg rozdzielczy sposób wyznaczanie dominanty w szereg rozdzielczy sposób wyznaczanie dominanty (mody) w oparciu o jej definicję nie może być (mody) w oparciu o jej definicję nie może być zastosowanyzastosowany
analizując liczebności poszczególnych klas można analizując liczebności poszczególnych klas można określić przedział wartości cechy, który dominuje w określić przedział wartości cechy, który dominuje w badanej zbiorowości. Nie wiadomo jednak, która badanej zbiorowości. Nie wiadomo jednak, która wartość dominuje w badanej zbiorowościwartość dominuje w badanej zbiorowości
dominantę (modę) wyznacza się wówczas w sposób dominantę (modę) wyznacza się wówczas w sposób przybliżony poprzez interpolację jej wartości z przybliżony poprzez interpolację jej wartości z przedziału klasowego przedziału klasowego
metoda obliczania dominanty metoda obliczania dominanty
Metoda interpolacyjna polega na obliczeniu dominanty według Metoda interpolacyjna polega na obliczeniu dominanty według wzoru:wzoru:
lub:lub:
gdzie:gdzie:
DDxx00 - dolna granica przedziału dominującego; - dolna granica przedziału dominującego; n n DD -- liczebność (częstości względne) przedziału dominującego; liczebność (częstości względne) przedziału dominującego; nnD-1D-1 - liczebność (częstości względne) przedziału poprzedzającego przedział - liczebność (częstości względne) przedziału poprzedzającego przedział
dominujący;dominujący; nnD+1D+1 - liczebność (częstości względne) przedziału następującego po przedziale - liczebność (częstości względne) przedziału następującego po przedziale
dominującym;dominującym; hhDD - rozpiętość przedziału dominującego. - rozpiętość przedziału dominującego.
D
DDDD
DDD h
nnnn
nnxxD
)()()(
11
10
D
DDDD
DDD h
wwww
wwxxD
)()()(
11
10
Uwaga!!!Uwaga!!!
obliczając dominantę (modę) należy pamiętać o tym, że:obliczając dominantę (modę) należy pamiętać o tym, że:
w szeregu rozdzielczym może występować jedno wyraźnie w szeregu rozdzielczym może występować jedno wyraźnie zaznaczone maksimum (tzn. rozkład empiryczny jest zaznaczone maksimum (tzn. rozkład empiryczny jest jednomodalny);jednomodalny);
przedział dominanty (mody) oraz dwa sąsiadujące z nim przedział dominanty (mody) oraz dwa sąsiadujące z nim przedziały muszą mieć takie same rozpiętości (szerokości);przedziały muszą mieć takie same rozpiętości (szerokości);
jeśli dominanta w szeregu rozdzielczym występuje w jeśli dominanta w szeregu rozdzielczym występuje w skrajnych przedziałach klasowych, wówczas nie oblicza skrajnych przedziałach klasowych, wówczas nie oblicza się jej według wzoru interpolacyjnego się jej według wzoru interpolacyjnego
Średnie pozycyjne Średnie pozycyjne wyższych rzędów wyższych rzędów
W statystyce często używane są:W statystyce często używane są: percentylepercentyle – dzielimy całkowitą liczebność na – dzielimy całkowitą liczebność na
100 części (100 części (a=100 elementów, b=99 percentylia=100 elementów, b=99 percentyli)) decyledecyle – całkowitą liczebność dzielimy na 10 – całkowitą liczebność dzielimy na 10
części części (a=10 elementów, b=9 decyli)(a=10 elementów, b=9 decyli)
kwartylekwartyle – całkowitą liczebność dzielimy na 4 – całkowitą liczebność dzielimy na 4 części części (a=4 elementy, b=3 kwartyle)(a=4 elementy, b=3 kwartyle)
kwintylekwintyle - całkowitą liczebność dzielimy na 5 - całkowitą liczebność dzielimy na 5 części części (a=5 elementów, b=4 kwintyle)(a=5 elementów, b=4 kwintyle)
k-ty percentylk-ty percentyl zbioru danych zbioru danych uporządkowanych rosnąco jest to wartość x uporządkowanych rosnąco jest to wartość x mająca tę własność, że k procent liczebności mająca tę własność, że k procent liczebności zbioru leży na lub poniżej wartości xzbioru leży na lub poniżej wartości x
Przy dzieleniu zbiorowości statystycznej na Przy dzieleniu zbiorowości statystycznej na aa równych równych elementów i uzyskiwaniu elementów i uzyskiwaniu b = a-1b = a-1 charakterystyk charakterystyk korzystamy z formuły:korzystamy z formuły:
gdzie:gdzie: QQa,ba,b – symbol przeciętnej pozycyjnej – symbol przeciętnej pozycyjnej
xxq0q0 –dolna granica przedziału, w której znajduje się poszukiwana przeciętna –dolna granica przedziału, w której znajduje się poszukiwana przeciętna
pozycyjnapozycyjna hhqq –rozpiętość przedziału klasy liczonej przeciętnej pozycyjnej –rozpiętość przedziału klasy liczonej przeciętnej pozycyjnej
nnqq – liczebność klasy liczonej przeciętnej pozycyjnej – liczebność klasy liczonej przeciętnej pozycyjnej
q
iiqba n
hn
b
naxQ
1
10,
1
KwartyleKwartyle
kwartylekwartyle to takie wartości cechy Q to takie wartości cechy Q4,14,1, Q, Q4,24,2 i i QQ4,34,3 , że ¼ obserwacji leży poniżej Q , że ¼ obserwacji leży poniżej Q4,14,1, ¼ , ¼ powyżej Qpowyżej Q4,34,3 , ¼ obserwacji leży między Q , ¼ obserwacji leży między Q4,14,1 a medianą a ¼ obserwacji leży między a medianą a ¼ obserwacji leży między medianą a Qmedianą a Q4,34,3..
wielkość Qwielkość Q4,14,1 zwana jest kwartylem dolnym a zwana jest kwartylem dolnym a QQ4,34,3 kwartylem górnym. kwartylem górnym.
Uwaga!Uwaga!
Posługiwanie się przeciętnymi pozycyjnymi Posługiwanie się przeciętnymi pozycyjnymi wyższych rzędów ma sens tylko wówczas, wyższych rzędów ma sens tylko wówczas, gdy liczebność zbiorowości statystycznej jest gdy liczebność zbiorowości statystycznej jest znaczna.znaczna.