charakterystyki opisowe rozkładu jednej cechy wykład 3 dr małgorzata radziukiewicz

52
Charakterystyki opisowe Charakterystyki opisowe rozkładu jednej cechy rozkładu jednej cechy Wykład 3 Wykład 3 dr Małgorzata dr Małgorzata Radziukiewicz Radziukiewicz

Upload: slone

Post on 15-Jan-2016

52 views

Category:

Documents


0 download

DESCRIPTION

Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz. Klasyfikacja miar statystycznych. ze względu na informacje, jakie przynoszą one o rozkładzie cechy w zbiorowości:  Miary poziomu  Miary dyspersji  Miary asymetrii. Klasyfikacja miar statystycznych. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Charakterystyki opisowe Charakterystyki opisowe rozkładu jednej cechyrozkładu jednej cechy

Wykład 3Wykład 3

dr Małgorzata Radziukiewiczdr Małgorzata Radziukiewicz

Page 2: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Klasyfikacja miar statystycznychKlasyfikacja miar statystycznych

ze względu na informacje, jakie przynoszą one o rozkładzie ze względu na informacje, jakie przynoszą one o rozkładzie cechy w zbiorowości:cechy w zbiorowości:

Miary poziomuMiary poziomu Miary dyspersji Miary dyspersji Miary asymetrii Miary asymetrii

Page 3: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Klasyfikacja miar statystycznychKlasyfikacja miar statystycznych

ze względu zakres danych niezbędnych do wyliczenia tych ze względu zakres danych niezbędnych do wyliczenia tych miar:miar:

● ● miary klasycznemiary klasycznedla wyliczenia tych miar wykorzystuje się wartości cechy dla wyliczenia tych miar wykorzystuje się wartości cechy zaobserwowane u zaobserwowane u wszystkich badanych jednostekwszystkich badanych jednostek

● ● miary pozycyjnemiary pozycyjnedla wyliczenia tych miar wykorzystuje się wartości cechy dla wyliczenia tych miar wykorzystuje się wartości cechy tylko tylko niektórych jednostekniektórych jednostek, wybranych ze względu na , wybranych ze względu na pozycję, jaka zajmują one w uporządkowanym ciągu pozycję, jaka zajmują one w uporządkowanym ciągu zaobserwowanych jednostek cechyzaobserwowanych jednostek cechy

Page 4: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Klasyfikacja miar statystycznychKlasyfikacja miar statystycznych

dodatkowo, miary statystyczne mogą być miarami:dodatkowo, miary statystyczne mogą być miarami:

● ● absolutnymiabsolutnymimianowanymi, a więc wyrażonymi w mianie badanej cechy mianowanymi, a więc wyrażonymi w mianie badanej cechy – lata, metry, sztuki, kilogramy, godziny itp..– lata, metry, sztuki, kilogramy, godziny itp..

● ● względnymi (stosunkowymi)względnymi (stosunkowymi)niemianowanymi, wyrażonymi w ułamku lub w procencie – niemianowanymi, wyrażonymi w ułamku lub w procencie – uzyskanymi poprzez podzielenie przez siebie odpowiednich uzyskanymi poprzez podzielenie przez siebie odpowiednich miar absolutnychmiar absolutnych

Page 5: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Miary jednej cechyMiary jednej cechy

Miary poziomu Miary poziomu

Page 6: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Miary poziomuMiary poziomu rozkładu liczebności rozkładu liczebności zwane są zwane są wartościami przeciętnymiwartościami przeciętnymi

(lub (lub średnimiśrednimi))

najbardziej rozpowszechnione w praktycenajbardziej rozpowszechnione w praktyce zacierają różnice indywidualne badanych jednostekzacierają różnice indywidualne badanych jednostek o wartości liczbowej tej miary decydują wartości liczbowe o wartości liczbowej tej miary decydują wartości liczbowe

cechy posiadane przez wszystkie jednostki populacjicechy posiadane przez wszystkie jednostki populacji za pomocą jednej liczby podają centralną tendencję za pomocą jednej liczby podają centralną tendencję

(poziom wartości zmiennej) (poziom wartości zmiennej)

Page 7: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Miary przeciętne

Miary klasyczne Miary pozycyjne

MedianaDominanta (moda)

Kwantyle

Średnia arytmetycznaŚrednia geometryczna

Page 8: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Miary przeciętne

klasyczne

Średnia arytmetycznaŚrednia geometryczna

są wypadkowymi wartościami wszystkich odmian cechy

wszystkich badanychjednostek zbiorowości

Page 9: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Miary przeciętne

pozycyjne

MedianaDominanta (moda)

Kwantyle

wskazują na określoną pozycję

jednostek

Page 10: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Miary przeciętne

pozycyjne

Mediana

wskazują na określoną pozycję

jednostek

pozycja środkowa

Dominanta (moda) pozycja najczęstsza (typowa)

Kwantyle uporządkowaną populację dzielą na części

Page 11: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Podstawową i najbardziej znaną miarą Podstawową i najbardziej znaną miarą położenia i jednocześnie miarą tendencji położenia i jednocześnie miarą tendencji centralnej jest centralnej jest średniaśrednia

Jest to średnia arytmetyczna wartości cechyJest to średnia arytmetyczna wartości cechy

Aby wyznaczyć poziom średniej Aby wyznaczyć poziom średniej badana badana cecha musi być mierzalnącecha musi być mierzalną

Page 12: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Jak otrzymać wartość średniej Jak otrzymać wartość średniej arytmetycznej dla danych indywidualnych?arytmetycznej dla danych indywidualnych? dysponując dysponując nn wartościami cechy: wartościami cechy:

w pierwszej kolejności obliczamy sumę tych wartości:w pierwszej kolejności obliczamy sumę tych wartości:

a następnie dzielimy przez liczbę obserwacji a następnie dzielimy przez liczbę obserwacji nn::

nxxxx ,.....,,, 321

nxxxx .....321

xn

x

n

xxxxśrednia n

...321

Page 13: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Średnia arytmetyczna jest pewną abstrakcyjną Średnia arytmetyczna jest pewną abstrakcyjną wielkością, wielkością, wypadkową wszystkich wypadkową wszystkich zaobserwowanych wartości cechyzaobserwowanych wartości cechy, powstałą wskutek , powstałą wskutek operacji matematycznejoperacji matematycznej

Obliczona wartość średnia z reguły przyjmuje Obliczona wartość średnia z reguły przyjmuje wartość w zbiorowości nie występującąwartość w zbiorowości nie występującą

Średnia arytmetyczna zaciera różnice indywidualneŚrednia arytmetyczna zaciera różnice indywidualne

Zmiana jakiejkolwiek wartości w zbiorze danych Zmiana jakiejkolwiek wartości w zbiorze danych pociąga za sobą zmianę wartości średniejpociąga za sobą zmianę wartości średniej

Page 14: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Jak otrzymać wartość średniej Jak otrzymać wartość średniej arytmetycznej dla danych arytmetycznej dla danych pogrupowanych?pogrupowanych?

w tym przypadku można uzyskać jedynie pewne w tym przypadku można uzyskać jedynie pewne przybliżenie, przyjmując, że każda jednostka nprzybliżenie, przyjmując, że każda jednostka ni i należąca do należąca do danej klasy ma wartość cechy równą wartościom środka danej klasy ma wartość cechy równą wartościom środka przedziału klasowego:przedziału klasowego:

k

ii

k

iii

k

kk

n

nx

nnnnn

nxnxnxnxnxx

1

1

4321

44332211

....

....

Page 15: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej Właściwości średniej arytmetycznejarytmetycznej

Page 16: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Wartość liczbowa średniej arytmetycznej ma Wartość liczbowa średniej arytmetycznej ma takie samo miano jak badana cechatakie samo miano jak badana cecha

Page 17: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Średnia arytmetyczna zawiera się między Średnia arytmetyczna zawiera się między krańcowymi wartościami cechy:krańcowymi wartościami cechy:

maxmin xxx

Page 18: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Średnia arytmetyczna obliczona z Średnia arytmetyczna obliczona z wartości sum wartości sum xxii + y + yii jest równa jest równa sumie średnich arytmetycznych sumie średnich arytmetycznych obliczonych oddzielnie dla obu obliczonych oddzielnie dla obu wartości:wartości:

yxyx

Page 19: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Wartość średniej Wartość średniej arytmetycznej nie ulega arytmetycznej nie ulega zmianie, jeśli wszystkie zmianie, jeśli wszystkie wagi pomnożymy wagi pomnożymy przez liczbę stałą przez liczbę stałą cc::

xnc

xnc

n

xn

i

ii

i

ii

)(

.)(.

Page 20: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Jeżeli zbiorowość (populację) liczącą Jeżeli zbiorowość (populację) liczącą nn elementów podzielimy elementów podzielimy na na r r podgrup (podpopulacji) o liczebnościach podgrup (podpopulacji) o liczebnościach ww11, w, w22, w, w33,,…….w…….wrr, wówczas średnia arytmetyczna całej zbiorowości , wówczas średnia arytmetyczna całej zbiorowości (populacji) jest równa średniej ważonej średnich (populacji) jest równa średniej ważonej średnich arytmetycznych arytmetycznych ( gdzie j = 1,2,…r) podgrup (podpopulacji), z ( gdzie j = 1,2,…r) podgrup (podpopulacji), z

wagami wagami wwjj ::

r

jj

r

jjj

k

ii

k

iii

w

xw

n

xnx

1

1

1

1

Page 21: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Jeśli zmniejszymy każdy wariant Jeśli zmniejszymy każdy wariant cechy cechy xxii o stałą o stałą cc, to średnia , to średnia arytmetyczna też ulegnie arytmetyczna też ulegnie zmniejszeniu o stałą zmniejszeniu o stałą cc::

cxn

cxn

i

ii

)(

Page 22: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Jeśli pomnożymy każdy wariant cechy xJeśli pomnożymy każdy wariant cechy x ii przez stałą przez stałą

cc, to nowa średnia arytmetyczna będzie c – , to nowa średnia arytmetyczna będzie c – krotnością średniej pierwotnej:krotnością średniej pierwotnej:

xcn

xcn

i

ii

).(

Page 23: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Jeśli od każdego wariantu Jeśli od każdego wariantu xxii odejmiemy średnią odejmiemy średnią

arytmetyczną wówczas suma tych różnic jest równa arytmetyczną wówczas suma tych różnic jest równa zeru:zeru:

Powyższą własność formułujemy często w innej Powyższą własność formułujemy często w innej formie: formie: suma odchyleń od średniej arytmetycznej suma odchyleń od średniej arytmetycznej jest równa zeru:jest równa zeru:

0)( xxn ii

0)( xxi

Page 24: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Właściwości średniej arytmetycznejWłaściwości średniej arytmetycznej

Suma kwadratów odchyleń Suma kwadratów odchyleń wartości zmiennych badanej wartości zmiennych badanej cechy od średniej cechy od średniej arytmetycznej rozkładu jest arytmetycznej rozkładu jest najmniejszanajmniejsza

Oznacza to, że suma Oznacza to, że suma kwadratów odchyleń kwadratów odchyleń poszczególnych wartości poszczególnych wartości zmiennych badanej cechy od zmiennych badanej cechy od jakiejkolwiek innej wartości jakiejkolwiek innej wartości zmiennej rozkładu, różnej od zmiennej rozkładu, różnej od średniej, będzie zawsze średniej, będzie zawsze większawiększa

min)( 2xxi

Page 25: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

OgraniczeniaOgraniczeniaw stosowaniuw stosowaniuśredniej arytmetycznejśredniej arytmetycznej

Page 26: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Niejednokrotnie średnia arytmetyczna nie Niejednokrotnie średnia arytmetyczna nie może być uznana za wielkość może być uznana za wielkość reprezentatywną dla całego danego zbioru, w reprezentatywną dla całego danego zbioru, w sensie wyrażania tendencji centralnej, jej sensie wyrażania tendencji centralnej, jej wartość poznawcza jest niewielka (lub nawet wartość poznawcza jest niewielka (lub nawet żadna), a niekiedy wprowadza po prostu w żadna), a niekiedy wprowadza po prostu w błąd błąd

Page 27: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Ograniczenia w stosowaniu średniej Ograniczenia w stosowaniu średniej arytmetycznejarytmetycznej

A.A. W przypadku, gdy przedziały klasowe są W przypadku, gdy przedziały klasowe są otwarte (górny i dolny lub jeden z nich).otwarte (górny i dolny lub jeden z nich).

a) gdy liczebności przedziałów a) gdy liczebności przedziałów otwartych są stosunkowo nieliczne, można je otwartych są stosunkowo nieliczne, można je zamknąć i umownie ustalić środek przedziału;zamknąć i umownie ustalić środek przedziału;

b) gdy udział liczebności przedziałów b) gdy udział liczebności przedziałów otwartych w ogólnej sumie liczebności jest otwartych w ogólnej sumie liczebności jest znaczny, rezygnujemy z obliczania średniejznaczny, rezygnujemy z obliczania średniej

Page 28: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Ograniczenia w stosowaniu średniej arytmetycznejOgraniczenia w stosowaniu średniej arytmetycznej

BB.. Gdy największe liczebności skupiają się zdecydowanie Gdy największe liczebności skupiają się zdecydowanie wokół najniższych lub najwyższych wartości cechy (wokół najniższych lub najwyższych wartości cechy (szereg szereg jest skrajnie asymetrycznyjest skrajnie asymetryczny).).

Mężczyźni w wieku produkcyjnym, bierni zawodowo, według wieku

21,04

23,52

4,872,73 2,84

4,3

6,73

9,5910,69

3,69

0

5

10

15

20

25

20 25 30 35 40 45 50 55 60 65wiek w latach

%

Page 29: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Ograniczenia w stosowaniu średniej arytmetycznejOgraniczenia w stosowaniu średniej arytmetycznej

C.C. Wartość poznawcza średniej jest żadna, Wartość poznawcza średniej jest żadna, wówczas, wówczas, gdy ustalamy średnią ze zbiorów gdy ustalamy średnią ze zbiorów niejednorodnychniejednorodnych

Page 30: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Ograniczenia w stosowaniu średniej Ograniczenia w stosowaniu średniej arytmetycznejarytmetycznej

D.D. Obliczanie średniej mija się z celem również w Obliczanie średniej mija się z celem również w tych szeregach, które dają rozkłady z kilkoma tych szeregach, które dają rozkłady z kilkoma skupiskami dominującymi (są to tzw. szeregi skupiskami dominującymi (są to tzw. szeregi wielomodalnewielomodalne))

Rys. Rozkład dwumodalny

Page 31: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

W większości przypadków rozkłady cech mierzalnych W większości przypadków rozkłady cech mierzalnych (zwanych zmiennymi) charakteryzują się pewną (zwanych zmiennymi) charakteryzują się pewną tendencja centralną, która polega na tym, że w miarę tendencja centralną, która polega na tym, że w miarę wzrostu liczebności (częstości) zmniejszają się różnice wzrostu liczebności (częstości) zmniejszają się różnice pomiędzy wartościami zmiennej a wartością centralną.pomiędzy wartościami zmiennej a wartością centralną.

Rozkłady, które nie odpowiadają temu warunkowi, nie Rozkłady, które nie odpowiadają temu warunkowi, nie

powinny być opisywane za pomocą wartości średniej.powinny być opisywane za pomocą wartości średniej.

Page 32: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

rozkłady skrajnie asymetrycznerozkłady skrajnie asymetryczne

Page 33: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Średnia Średnia geometrycznageometryczna

Page 34: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Średnią geometryczną n liczb jest Średnią geometryczną n liczb jest pierwiastek stopnia n z iloczynu tych pierwiastek stopnia n z iloczynu tych liczb.liczb.

Wykorzystywana jest Wykorzystywana jest do badania do badania zbiorowości, w których zbiorowości, w których wartości jednostek są wartości jednostek są przedstawiane w przedstawiane w liczbach względnychliczbach względnych

nng xxxx ...21

Page 35: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

MedianaMediana

Page 36: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

MedianaMediana odpowiada środkowi zbioru odpowiada środkowi zbioru danych, w którym to zbiorze wartości danych, w którym to zbiorze wartości cechy uporządkowano kolejno od cechy uporządkowano kolejno od najmniejszej do największej (czyli według najmniejszej do największej (czyli według rosnącej wartości cechy).rosnącej wartości cechy).

Page 37: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

cecha jest skokowacecha jest skokowa jeśli liczba obserwacji n jest liczbą nieparzystą, mediana jeśli liczba obserwacji n jest liczbą nieparzystą, mediana

jest wartością, którą przybiera 0,5(n+1) jednostka jest wartością, którą przybiera 0,5(n+1) jednostka liczebności populacji (obserwacja środkowa):liczebności populacji (obserwacja środkowa):

jeśli liczba obserwacji n jest liczbą parzystą, mediana jest jeśli liczba obserwacji n jest liczbą parzystą, mediana jest średnią arytmetyczną wartości cechy dwóch sąsiadujących średnią arytmetyczną wartości cechy dwóch sąsiadujących jednostek o numerach porządkowych 0,5n oraz 0,5(n+2):jednostek o numerach porządkowych 0,5n oraz 0,5(n+2):

2

)1()( nxxM

2)( 2

2

2

nn xx

xM

Page 38: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

cecha jest ciągłacecha jest ciągła wtedy szereg rozdzielczy jest pod postacią klasowych wtedy szereg rozdzielczy jest pod postacią klasowych

przedziałów odmian cechy i wówczas kumulacja przedziałów odmian cechy i wówczas kumulacja liczebności wskazuje tylko klasę, w której znajduje się liczebności wskazuje tylko klasę, w której znajduje się medianamediana

wyznaczenie mediany wymaga posłużenia się wzorem wyznaczenie mediany wymaga posłużenia się wzorem interpolacyjnym:interpolacyjnym:

gdzie:gdzie: xxm0m0 –dolna granica klasy mediany –dolna granica klasy mediany hhmm –rozpiętość przedziału klasy mediany –rozpiętość przedziału klasy mediany nnmm – liczebność przedziału klasy dominanty – liczebność przedziału klasy dominanty

m

mm

iim n

hn

nxxM

1

10 2

1)(

Page 39: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

medianę M(medianę M(XX) można zdefiniować jako taką wartość cechy, że ) można zdefiniować jako taką wartość cechy, że prosta pionowa przechodząca przez nią dzieli obszar pod prosta pionowa przechodząca przez nią dzieli obszar pod krzywą na dwie równe częścikrzywą na dwie równe części

w praktyce medianę obliczamy w sytuacji, gdzie jedna lub w praktyce medianę obliczamy w sytuacji, gdzie jedna lub kilka wartości leży daleko od środka zbiorukilka wartości leży daleko od środka zbioru

mediana ma często zastosowanie w ekonomii w rozkładach mediana ma często zastosowanie w ekonomii w rozkładach dochodów dochodów

Uwaga!!!Uwaga!!! mediana ma sens tylko wtedy, gdy zbiór danych jest mediana ma sens tylko wtedy, gdy zbiór danych jest

uporządkowany rosnąco lub malejąco.uporządkowany rosnąco lub malejąco.

Page 40: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

przykładprzykład

Sprzedaż filmowych kaset video ma ograniczenia czasowe Sprzedaż filmowych kaset video ma ograniczenia czasowe (na ekrany wchodzą coraz to nowsze filmy i „stare” szybko (na ekrany wchodzą coraz to nowsze filmy i „stare” szybko schodzą z ekranów kin).schodzą z ekranów kin).

Właściciel musi decydować rozsądnie, z jakimi filmami Właściciel musi decydować rozsądnie, z jakimi filmami nabyć taśmy.nabyć taśmy.

W tej sytuacji miary: - średnia i mediana – nie będą jemu W tej sytuacji miary: - średnia i mediana – nie będą jemu pomocne.pomocne.

Zamiast tego, właścicielowi potrzebna jest wiedza na temat, Zamiast tego, właścicielowi potrzebna jest wiedza na temat, które filmy są najbardziej popularne i cieszą się które filmy są najbardziej popularne i cieszą się największym zainteresowaniem, a zatem które filmy największym zainteresowaniem, a zatem które filmy prawdopodobnie będą sprzedawać się najlepiej.prawdopodobnie będą sprzedawać się najlepiej.

Page 41: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Dominanta (modaDominanta (moda))

Page 42: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

charakterystyczne własności dominantycharakterystyczne własności dominanty

dominantadominanta znajduje zastosowanie wówczas, gdy znajduje zastosowanie wówczas, gdy chcemy jedną liczbą wyrazić wartość cechy chcemy jedną liczbą wyrazić wartość cechy najbardziej typową i najczęściej występującąnajbardziej typową i najczęściej występującą

istnieje możliwość stosowania dominanty w przypadku istnieje możliwość stosowania dominanty w przypadku analizy cech mierzalnych i niemierzalnychanalizy cech mierzalnych i niemierzalnych

dla cechy niemierzalnej dominantą jest ten wariant dla cechy niemierzalnej dominantą jest ten wariant cechy, która ma największą częstość występowania w cechy, która ma największą częstość występowania w badanej zbiorowościbadanej zbiorowości

dominanta jest dominanta jest jedyną miarąjedyną miarą przeciętną, która można przeciętną, która można wyznaczyć dla wyznaczyć dla cech niemierzalnychcech niemierzalnych

Page 43: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

charakterystyczne własności dominantycharakterystyczne własności dominanty

jest również możliwe - dla dużych liczebności i jest również możliwe - dla dużych liczebności i odpowiadającym im różnym wartościom - więcej niż odpowiadającym im różnym wartościom - więcej niż jedna dominanta (moda); jedna dominanta (moda);

zbiór z 2-oma modami nazywamy dwumodalnym, zbiór z 2-oma modami nazywamy dwumodalnym, zbiory z 3-ema modami trzymodalnymi;zbiory z 3-ema modami trzymodalnymi;

zbiory mające powyżej 2 mód zwą się zbiory mające powyżej 2 mód zwą się wielomodalnymi;wielomodalnymi;

w diametralnie różnym przypadku, gdy każda wartość w diametralnie różnym przypadku, gdy każda wartość w zbiorze występuje tylko raz – zbiór nie ma mody.w zbiorze występuje tylko raz – zbiór nie ma mody.

Page 44: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

w przypadku, kiedy wartości zmiennej pogrupowane są w przypadku, kiedy wartości zmiennej pogrupowane są w szereg rozdzielczy sposób wyznaczanie dominanty w szereg rozdzielczy sposób wyznaczanie dominanty (mody) w oparciu o jej definicję nie może być (mody) w oparciu o jej definicję nie może być zastosowanyzastosowany

analizując liczebności poszczególnych klas można analizując liczebności poszczególnych klas można określić przedział wartości cechy, który dominuje w określić przedział wartości cechy, który dominuje w badanej zbiorowości. Nie wiadomo jednak, która badanej zbiorowości. Nie wiadomo jednak, która wartość dominuje w badanej zbiorowościwartość dominuje w badanej zbiorowości

dominantę (modę) wyznacza się wówczas w sposób dominantę (modę) wyznacza się wówczas w sposób przybliżony poprzez interpolację jej wartości z przybliżony poprzez interpolację jej wartości z przedziału klasowego przedziału klasowego

Page 45: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

metoda obliczania dominanty metoda obliczania dominanty

Metoda interpolacyjna polega na obliczeniu dominanty według Metoda interpolacyjna polega na obliczeniu dominanty według wzoru:wzoru:

lub:lub:

gdzie:gdzie:

DDxx00 - dolna granica przedziału dominującego; - dolna granica przedziału dominującego; n n DD -- liczebność (częstości względne) przedziału dominującego; liczebność (częstości względne) przedziału dominującego; nnD-1D-1 - liczebność (częstości względne) przedziału poprzedzającego przedział - liczebność (częstości względne) przedziału poprzedzającego przedział

dominujący;dominujący; nnD+1D+1 - liczebność (częstości względne) przedziału następującego po przedziale - liczebność (częstości względne) przedziału następującego po przedziale

dominującym;dominującym; hhDD - rozpiętość przedziału dominującego. - rozpiętość przedziału dominującego.

D

DDDD

DDD h

nnnn

nnxxD

)()()(

11

10

D

DDDD

DDD h

wwww

wwxxD

)()()(

11

10

Page 46: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Uwaga!!!Uwaga!!!

obliczając dominantę (modę) należy pamiętać o tym, że:obliczając dominantę (modę) należy pamiętać o tym, że:

w szeregu rozdzielczym może występować jedno wyraźnie w szeregu rozdzielczym może występować jedno wyraźnie zaznaczone maksimum (tzn. rozkład empiryczny jest zaznaczone maksimum (tzn. rozkład empiryczny jest jednomodalny);jednomodalny);

przedział dominanty (mody) oraz dwa sąsiadujące z nim przedział dominanty (mody) oraz dwa sąsiadujące z nim przedziały muszą mieć takie same rozpiętości (szerokości);przedziały muszą mieć takie same rozpiętości (szerokości);

jeśli dominanta w szeregu rozdzielczym występuje w jeśli dominanta w szeregu rozdzielczym występuje w skrajnych przedziałach klasowych, wówczas nie oblicza skrajnych przedziałach klasowych, wówczas nie oblicza się jej według wzoru interpolacyjnego się jej według wzoru interpolacyjnego

Page 47: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Średnie pozycyjne Średnie pozycyjne wyższych rzędów wyższych rzędów

Page 48: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

W statystyce często używane są:W statystyce często używane są: percentylepercentyle – dzielimy całkowitą liczebność na – dzielimy całkowitą liczebność na

100 części (100 części (a=100 elementów, b=99 percentylia=100 elementów, b=99 percentyli)) decyledecyle – całkowitą liczebność dzielimy na 10 – całkowitą liczebność dzielimy na 10

części części (a=10 elementów, b=9 decyli)(a=10 elementów, b=9 decyli)

kwartylekwartyle – całkowitą liczebność dzielimy na 4 – całkowitą liczebność dzielimy na 4 części części (a=4 elementy, b=3 kwartyle)(a=4 elementy, b=3 kwartyle)

kwintylekwintyle - całkowitą liczebność dzielimy na 5 - całkowitą liczebność dzielimy na 5 części części (a=5 elementów, b=4 kwintyle)(a=5 elementów, b=4 kwintyle)

Page 49: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

k-ty percentylk-ty percentyl zbioru danych zbioru danych uporządkowanych rosnąco jest to wartość x uporządkowanych rosnąco jest to wartość x mająca tę własność, że k procent liczebności mająca tę własność, że k procent liczebności zbioru leży na lub poniżej wartości xzbioru leży na lub poniżej wartości x

Page 50: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Przy dzieleniu zbiorowości statystycznej na Przy dzieleniu zbiorowości statystycznej na aa równych równych elementów i uzyskiwaniu elementów i uzyskiwaniu b = a-1b = a-1 charakterystyk charakterystyk korzystamy z formuły:korzystamy z formuły:

gdzie:gdzie: QQa,ba,b – symbol przeciętnej pozycyjnej – symbol przeciętnej pozycyjnej

xxq0q0 –dolna granica przedziału, w której znajduje się poszukiwana przeciętna –dolna granica przedziału, w której znajduje się poszukiwana przeciętna

pozycyjnapozycyjna hhqq –rozpiętość przedziału klasy liczonej przeciętnej pozycyjnej –rozpiętość przedziału klasy liczonej przeciętnej pozycyjnej

nnqq – liczebność klasy liczonej przeciętnej pozycyjnej – liczebność klasy liczonej przeciętnej pozycyjnej

q

qq

iiqba n

hn

b

naxQ

1

10,

1

Page 51: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

KwartyleKwartyle

kwartylekwartyle to takie wartości cechy Q to takie wartości cechy Q4,14,1, Q, Q4,24,2 i i QQ4,34,3 , że ¼ obserwacji leży poniżej Q , że ¼ obserwacji leży poniżej Q4,14,1, ¼ , ¼ powyżej Qpowyżej Q4,34,3 , ¼ obserwacji leży między Q , ¼ obserwacji leży między Q4,14,1 a medianą a ¼ obserwacji leży między a medianą a ¼ obserwacji leży między medianą a Qmedianą a Q4,34,3..

wielkość Qwielkość Q4,14,1 zwana jest kwartylem dolnym a zwana jest kwartylem dolnym a QQ4,34,3 kwartylem górnym. kwartylem górnym.

Page 52: Charakterystyki opisowe rozkładu jednej cechy Wykład 3 dr Małgorzata Radziukiewicz

Uwaga!Uwaga!

Posługiwanie się przeciętnymi pozycyjnymi Posługiwanie się przeciętnymi pozycyjnymi wyższych rzędów ma sens tylko wówczas, wyższych rzędów ma sens tylko wówczas, gdy liczebność zbiorowości statystycznej jest gdy liczebność zbiorowości statystycznej jest znaczna.znaczna.