stat jk10 zmienność
TRANSCRIPT
OPISAĆ PRÓBĘ MIARY ZMIENNOŚĆI
PO CO MI TO?
• Badamy złożoność wypowiedzi (w zależności od wykształcenia).
• Wskaźnikiem złożoności jest długość poszczególnych zdań mierzona w słowach.
• Dla trzech wybranych osób uzyskaliśmy następujące wyniki.
osoba 1:
[8, 7, 6 , 9, 8, 7]
osoba 2:
[4, 3, 2, 5, 27, 4]
osoba 3:
[12, 8, 10, 12, 1, 2]
ROZSTĘP
różnica między najniższym a najwyższym wynikiem w rozkładzie
32 3 4 6 7 7 8 9
ROZSTĘP
• bardzo prosty do obliczenia;
• przydatny w obliczaniu przedziałów dla zmiennych na podstawie badań pilotażowych;
• zależy tylko od dwóch wartości w całym rozkładzie;
• nie jest wrażliwy na stan całego rozkładu;
• mocno wrażliwy na wartości skrajne;
• duża zmienność w kolejnych próbach;
• w wielu wypadkach – uzależniony od wielkości próby;
ODCHYLENIE ĆWIARTKOWE
Q1 – pierwszy punkt kwartylowy – punkt poniżej którego znajduje się ¼ obserwacji;
Q3 – trzeci punkt kwartylowy – punkt poniżej którego znajduje się ¾ obserwacji;
𝑄=𝑄3−𝑄1
2
OBLICZANIE Q1 I Q3
• zbiór danych:1. Szeregujemy obserwacje od najmniejszej do największej (lub odwrotnie);2. Numerujemy uszeregowane obserwacje od 1 do N;3. Wybieramy liczby znajdujące się na pozycji N/4 i 3N/4 (lub obliczamy średnią z
sąsiadujących z tą pozycją);
DANE W PRZEDZIAŁACH
szukamy Q1;
mamy 80 obserwacji;
Q1 znajduje się na pozycji 20;
przedziały mają szerokość 3;
15 18 19 20 21 2616 17
3/11
…
3/11 3/113/11
DANE W PRZEDZIAŁACHdolna
pozornagórna
pozornadolna realna
górna realna
f f cum
96 98 95,5 98,5 1 80
93 95 92,5 95,5 1 79
90 92 89,5 92,5 3 78
87 89 86,5 89,5 3 75
84 86 83,5 86,5 4 72
81 83 80,5 83,5 7 68
78 80 77,5 80,5 8 61
75 77 74,5 77,5 9 53
72 74 71,5 74,5 12 44
69 71 68,5 71,5 6 32
66 68 65,5 68,5 11 26
63 65 62,5 65,5 7 15
60 62 59,5 62,5 2 8
57 59 56,5 59,5 3 6
54 56 53,5 56,5 3 3
1. Określamy pozycję, na której będzie znajdował się Q1 (Q3)
2. Znajdujemy przedział klasowy, w którym będzie wartość Q1 (Q3).
3. Określamy liczbę obserwacji znajdujących się pomiędzy dolnym końcem rozkładu a dolną granicą przedziały, w którym znajduje się Q1 (Q3) [].
4. Określamy liczbę obserwacji potrzebnych do uzupełnienia różnych miedzy liczbą ustalona w kroku 3 a liczbą określoną w kroku 1.
5. Zakładamy, że wszystkie wyniki w przedziale są równo rozłożone.
6. Określamy liczbę obserwacji w interesującym nas przedziale [f]
7. Znajdujemy szerokość przedziału [i]8. Znajdujemy odległość w przedziale brakującą do
punktu Q1 (Q3), dzielimy ją przez f i mnożymy przez i.
9. Dodajemy otrzymaną wartość do dolnej granicy przedziału.
ODCHYLENIE ĆWIARTKOWE
• jego wartość zależy od środkowej części wyników (nie uwzględnia skrajnych 25% z każdej strony; • inaczej: rozstęp 50% środkowych wyników;• właściwości podobne do mediany:
• wrażliwe bardziej na liczbę wyników poniżej/powyżej pewnej wartości niż na ich dokładną wartość;
• mniej od innych miar zmienności wrażliwe na wartości skrajne;
• jedyna miara dla rozkładów otwartych na końcu;
• dobra stabilność dla różnych prób (słabsza niż dla odchylenia standardowego)
WARIANCJA
średnia z kwadratów odchyleń wszystkich wyników od średniej
– suma kwadratów – oznaczana też jako SS.
Problem!
Wariancja jest w jednostkach kwadratowych, więc nie można jej bezpośrednio porównać np. ze średnią.
Rozwiązanie:
ODCHYLENIE STANDARDOWE
ODCHYLENIE STANDARDOWE
tendencja centralnej dla odchylenia wyników
(z pominięciem ich znaku)
S
x średnia różnica kwadrat
16 42,47 -26,47 700,48
36 42,47 -6,47 41,82
11 42,47 -31,47 990,15
17 42,47 -25,47 648,55
30 42,47 -12,47 155,42
33 42,47 -9,47 89,62
61 42,47 18,53 343,48
65 42,47 22,53 507,75
41 42,47 -1,47 2,15
65 42,47 22,53 507,75
43 42,47 0,53 0,28
42 42,47 -0,47 0,22
62 42,47 19,53 381,55
50 42,47 7,53 56,75
65 42,47 22,53 507,75
EXCEL:==ODCH.STANDARD.POPUL.A(ZAKRES)
ODCHYLENIE STANDARDOWE
• wrażliwe na dokładne położenie każdego wyniku;
• wrażliwe na wartości skrajne;
• najmniej wrażliwe na zmienność próby;
• najczęściej wykorzystywane w analizach statystycznych;
• zagnieżdżone w wielu procedurach statystyki opisowej i wnioskowania statystycznego;
INTERPRETACJE
ŚREDNIA-MEDIANA-MODA
PRZEDSZKOLE 1:
= 5,12 =5 Mo=5
PRZEDSZKOLE 2:
= 5,12 = 8 Mo= 10
PRZEDSZKOLE 3:
= 5,12 = 3 Mo= 2
• badamy liczbę prezentów otrzymywanych przez dzieci na święta;
• zbadano 4 przedszkola, w każdym 50 dzieci;• Czego na podstawie takich wyników możemy się domyślać na temat liczby prezentów, które dostały poszczególne dzieci
ROZKŁAD NORMALNY
PRZEDSZKOLE 1:
= 5,12 =5 Mo=5
większość wyników skupiona jest wokół średniej;
im dalej od średniej, tym mniej wyników;
inaczej rozkład Gaussa
==Mo
SKOŚNOŚĆ UJEMNA
PRZEDSZKOLE 2:
= 5,12 = 8 Mo= 10
wartości skupiają się w prawej części rozkładu;
średnią „obniża” kilka relatywnie niskich wyników na krańcach rozkładu;
inaczej skośny prawostronnie
x Mdm Mo
SKOŚNOŚĆ DODATNIA
PRZEDSZKOLE 3:
= 5,12 = 3 Mo= 2
wartości skupiają się w lewej części rozkładu;
średnią „podwyższa” kilka relatywnie wysokich wyników na krańcach rozkładu;
inaczej skośny lewostronnie
xMdmMo
NAUGHTY OR NICE
• To czy Kasia dostanie prezenty zależy od tego, czy była wśród najlepszych na teście z matematyki;
• Kasia dostała 123 punkty;
• średnia: 115
• min=90, max=125
• S=3,47• założenie: wyniki mają rozkład zbliżony do normalnego
ĆWICZENIE
• badamy świąteczne konsumpcje;
• zdanie:• oblicz miary tendencji centralnej i
zmienności;• przygotuj 5 zdań na temat
opisywanej próby zawierających najciekawsze, najbardziej istotne i jak najbardziej skumulowane informacje;
Zmienne:• karp – w kilogramach• kapusta – w kilogramach• ciasta – w liczbie kawałków• makowiec – w liczbie kawałków• piernik – w liczbie kawałków• sernik – w liczbie kawałków• pierniczki – w sztukach• barszcz – w litrach• prezenty – w sztukach• wydatki_prezenty:1. 1-502. 51-1003. 101-1504. 151-2005. 201-250