analiza statystyczna w naukach przyrodniczych
Post on 14-Jan-2016
62 Views
Preview:
DESCRIPTION
TRANSCRIPT
ANALIZA STATYSTYCZNA W NAUKACH PRZYRODNICZYCH
Dr inż. Agnieszka Strzelczak
Zakład Inżynierii Procesowej i Maszynoznawstwa
E-mail: Agnieszka-Strzelczak@zut.edu.pl
Tel: +48 91 449 65 36
Pokój: 308 PP
Konsultacje: środa 11.30 – 13.30
Statystyka jest tylko narzędziem pozwalającym sprawdzić nasze
pomysły badawcze
Analiza wyników badań opopiera się na statystyce
"Istnieją trzy rodzaje kłamstwa: przepowiadanie
pogody, statystyka i komunikat dyplomatyczny.”
Jean Rigaux
"Statystyka to matematyczny kamuflaż błędu.”
Georges Elgozy
„Jeśli mój sąsiad codziennie bije swoją żonę, ja zaś nie biję jej nigdy, to w świetle
statystyki obaj bijemy je co drugi dzień.”
George Bernard Shaw
„Statystyka jest jak kostium bikini: pokazuje wiele, ale nie pokazuje najważniejszego.”
Aaron Levenstein
„Istnieją trzy rodzaje kłamstw: kłamstwa, okropne
kłamstwa, statystyki.”
Benjamin Disraeli
Po co więc ta „cała” statystyka?
Człowiek otoczony jest różnymi zjawiskami i próbuje je poznać, dowiedzieć się w jaki sposób funkcjonują, jakie relacje między nimi zachodzą.
Aby coś powiedzieć o jakimś zjawisku należy je najpierw zbadać!
Statystyka: obejmuje metody pozyskiwania, prezentacji i analizy danych
Użycie statystyki do badania zjawisk sprawia, że badanie jest oparte na sprawdzonych i
dopracowanych metodach
Podstawowe pojęcia
Pojęcie statystyki
Statystyka jest dyscypliną naukową, zajmującą się „konstrukcją metod liczbowego opisu i wnioskowania o zjawiskach masowych”. Z takiej definicji wynika, że należy wyróżnić tutaj dwa pojęcia:
metodę i zjawisko masowe.
Podstawowe pojęcia
Metoda statystyczna
Jest to sposób badania liczbowego określonych zbiorowości, za pomocą odpowiednich narzędzi i procedur.
Podstawowe pojęcia
Zjawisko masowe
Zjawisko które często występuje, dotyczy ono więc wystarczająco dużej liczby jednostek. Dla odróżnienia, jednostkowym zjawiskiem jest pojedyncze, lub rzadko występujące zdarzenia.
Niektóre zjawiska mogą być traktowane jednostkowo jak i masowo, w zależności od perspektywy z jakiej je
analizujemy.
Przykład: Przyjęcie do przedsiębiorstwa dla nowego pracownika jest zjawiskiem jednostkowym, natomiast dla działu kadr takie zdarzenie będzie jednym z wielu podobnych, a więc będzie traktowane jako zjawisko masowe.
Podstawowe pojęcia
Zjawisko masowe cd.
Dane zjawisko można zaliczyć do masowych, wówczas gdy miała miejsce duża liczba przypadków jego występowania, co umożliwia zaobserwowanie pewnych prawidłowości statystycznych.
Obserwacja pojedynczej jednostki lub niewielkiego zespołu nie prowadzi do wykrycia prawidłowości
zjawiska.
Podstawowe pojęcia
Zbiorowość statystyczna (populacja)
Zespół jednostek objętych badaniem statystycznym (np. istot żywych, przedmiotów, przedsiębiorstw, obszarów geograficznych, zjawisk), które mają chociaż jedną wspólną cechę, a różnią się z innych punktów widzenia.
Podstawowe pojęcia
Zbiorowość statystyczna (populacja) cd.
Przykład zbiorowości stat.: studenci określonego województwa, mają dwie cechy wspólne: mieszkają w tym samym województwie i studiują, różnią się między sobą rodzajem uczelni do jakich uczęszczają, ocenami, cechami osobowości, wyglądem, płcią itd.
Zbiorowością stat. nie są np. krzesła w auli wykładowej o takim samym kształcie, kolorze, stopniu zużycia.
Podstawowe pojęcia
Próba statystyczna z populacji (zbiorowość)
Zbiór obserwacji statystycznych wybranych (zwykle wylosowanych) z populacji.
Podstawowe pojęcia
Jednostka statystyczna
Elementy składowe zbiorowości (próby) nazywane są jednostkami statystycznymi (jednostki badania, obserwacji).
Podstawowe pojęcia
Liczebność zbiorowości (próby)
Suma jednostek statystycznych ujmowana jest jako liczebność zbiorowości (oznaczana jest symbolem N)
Podstawowe pojęcia
Cechy statystyczne
Jednostka statystyczna w ramach zbiorowości statystycznej, charakteryzuje się wieloma
właściwościami, czyli cechami statystycznymi.
Cechy stałe (wspólne dla wszystkich
jednostek danej zbiorowości):
Nie podlegają analizie statystycznej
Cechy zmienne (różnicujące jednostki
między sobą:Podlegają analizie
statystycznej
PROCES BADAWCZY
1) Wymyślamy pytanie badawcze - np. „Czy liczebności ryb w 2 zbiornikach istotnie się różnią?”
2) Znajdujemy lub tworzymy zmienne, które mierzą odpowiednie zjawiska
NO3, PO4 ....
PROCES BADAWCZY
3) Sprawdzamy statystyki opisowe - oglądamy dane
rysunki, wykresy, średnie
4) Sprawdzamy hipotezy testem statystycznym
ważny jest poziom istotności (p)
<<
PROCES BADAWCZY
5) Sprawdzamy czy dane pasują do modelu statystycznego założenia dotyczące testów statystycznych
6) Rozważamy wyjaśnienia alternatywne - szukamy innych teorii
(jeśli znajdziemy to powinniśmy powtórzyć od początku)
TERMINOLOGIA
Przypadki i zmienne:
Przypadki są odpowiednikami rekordów w bazach danych lub wierszy w arkuszach kalkulacyjnych.
Zmienne są zaś odpowiednikami pól lub kolumn.
Każdy przypadek jest zbiorem wartości zmiennych.
TERMINOLOGIA
ZMIENNA
PRZYPADEK
ETAPY ANALIZY STATYSTYCZNEJ
POPULACJA
PRÓBKA
POMIARY
OBLICZENIA
WYNIKI
ANALIZA
ETAPY ANALIZY STATYSTYCZNEJ
POPULACJA
PRÓBKA
POMIARY
OBLICZENIA
WYNIKI
ANALIZA
PRÓBKA
WYBÓR PRÓBKI:
Próbka wybrana do badania musi być odpowiednia
Wybór próbki jest kluczowy etapem z punktu widzenia wiarygodności końcowych wyników
DOBRZE POBRANA PRÓBKA JEST REPREZENTATYWNA!!!
REPREZENTATYWNOŚĆ PRÓBKI
Próbka reprezentatywna: w dobry sposób odzwierciedla populację, z której została pobrana
Dla zapewnienia reprezentatywności konieczna jest odpowiednia liczebność próbki. Im większa próbka, tym bardziej wiarygodne wyniki.
Uwaga! Liczności nie można zwiększać w nieskończoność (koszty analiz!). Należy szukać optimum pomiędzy kosztami a wiarygodnością wyników.
Liczebność próby
Przeprowadzając badania z populacji generalnej pobieramy próbę:
n 100 próba b. dużan 30 próba duża10 n < 30 próba małan < 10 próba b. mała
RODZAJE DANYCH
Dana: każda informacja opisująca badane zjawisko/obiekt
Typy danych:
dane kategorialne (uzyskiwane przy ocenie metodą alternatywną)
dane liczbowe (pochodzące z pomiarów)
RODZAJE DANYCH
Typy danych: dane kategorialne
Uzyskuje się je w przypadkach:
dzielenia (klasyfikowania) przedmiotów na kategorie
zliczania liczby przedmiotów w danych kategoriach
zliczania proporcji przedmiotów
zliczania liczby braków/obecności
RODZAJE DANYCH
Typy danych: dane kategorialne
Są one często wykorzystywane w praktyce, bo do ich zebrania zazwyczaj nie potrzeba skomplikowanych i dokładnych urządzeń pomiarowych.
Przykład: klasyfikacja czystości wody, stwierdzanie braku/obecności danego gatunku ryby w jeziorze
RODZAJE DANYCH
Typy danych: dane kategorialne
Zwykle stosuje się 2 kategorie: brak i obecność.
Można jednak stosować więcej kategorii, które odzwierciedlać będą jakość.
Przykład: klasy czystości wód I, II, III. Klasa I- najwyższej jakości, klasa III- najgorszej.
RODZAJE DANYCH
Typy danych: dane kategorialne
Zalety:
prostota czytelność otrzymanych wyników
Wady:
nieprecyzyjność
RODZAJE DANYCH
Typy danych: dane liczbowe
Uzyskuje się je w przypadkach:
pomiarów cechy obiektu badań
przeliczania numerycznych wartości z dwóch lub więcej pomiarów liczbowych
Wymóg: korzystanie z urządzeń pomiarowych
PREZENTOWANIE DANYCH
Najprostszy sposób: spisywanie w rzędzie np.:
5,6,9,11,6,7,7,6,5,9,7,8,7,6,7,8,4,8,7,8,10,10,9,7,8,...
Ten zapis jest nieczytelny i mało użyteczny
PREZENTOWANIE DANYCH
Użyteczne metody prezentacji danych:
tabela częstości wystąpień (liczności)
histogram
wykres punktowy
PREZENTOWANIE DANYCH
Tabela częstości wystąpień
Wartość danej Wystąpienie danej Liczba wystąpień
3 0
4 2
5 3
6 5
7 1
PREZENTOWANIE DANYCH
Tabela częstości wystąpień
Z tabeli takiej można łatwo odczytać:
ile pomiarów o danej wartości zarejestrowano
która wartość powtarzała się najczęściej
w jakim zakresie pojawiają się dane (minimum i maksimum)
PREZENTOWANIE DANYCH
Histogram
Jest pewnym rozwinięciem tabeli liczności.
Szczególnie przydatny do prezentowania dużej ilości danych liczbowych i kategorialnych.
PREZENTOWANIE DANYCH
Histogram
31,820 33,100 33,780 34,650 34,870 35,530 36,750
32,010 33,120 33,790 34,690 34,880 35,620 36,680
32,010 33,260 33,790 34,690 34,900 35,780 36,780
32,050 33,260 33,790 34,720 34,920 35,790 36,850
32,230 33,280 33,820 34,720 34,960 35,860 38,520
32,600 33,300 33,820 34,810 35,090 36,120
32,950 33,360 33,860 34,810 35,120 36,250
33,030 33,540 33,950 34,810 35,160 36,560
33,050 33,560 34,210 34,860 35,280 36,560
33,060 33,750 34,220 34,870 35,290 36,590
PREZENTOWANIE DANYCH
Histogram
Procedura rysowania histogramu:
1.Posortowanie danych w porządku od najmniejszej do największej: nasze dane są już tak ustawione
2. Wyznaczenie wartości najmniejszej i największej: w naszym zbiorze wartość najmniejsze xmin=31,820, wartość największa xmax=38,520
PREZENTOWANIE DANYCHHistogramProcedura rysowania histogramu:
3. Obliczenie szerokości zakresu, w jakim pojawiają się dane (rozstępu): R=xmax-xmin=38,520-31,820=6,7
4. Wyznaczenie liczby przedziałów: ilość przedziałów= pierwiastek(ilość pomiarów) =pierwiastek(65)=8,068 UWAGA! Zasady tej nie stosujemy przy dużej liczbie pomiarów (>100). Zasadniczo liczba przedziałów powinna się mieścić w przedziale <6,12>
PREZENTOWANIE DANYCH
Histogram
Procedura rysowania histogramu:
5. Ustalenie szerokości przedziałów: szerokość przedziału=rozstęp/l-ba przedziałów =6,7/8=0,831
Otrzymaną wartość zaokrąglamy w taki sposób, aby narysowany histogram był jak najbardziej czytelny (tutaj do wartości 1)
PREZENTOWANIE DANYCHHistogram
Procedura rysowania histogramu:
6. Rozpisanie przedziałów i obliczenie, ile w każdym z nich znajduje się wyników:
Przedział wartości Ilość wyników w przedziale
(31,32] 1
(32,33] 6
(33,34] 21
(34,35] 17
(35,36] 10
(36,37] 9
(37,38] 0
(38,39] 1
PREZENTOWANIE DANYCH
Histogram
Procedura rysowania histogramu:
6. Narysowanie wykresu: w zależności od liczby wyników w poszczególnych przedziałach, rysuje się odpowiednią wysokość słupka.
PREZENTOWANIE DANYCH
PODSTAWY – DANE I ICH PREZENTACJA
Histogram
0
5
10
15
20
25
(31,32] (32,33] (33,34] (34,35] (35,36] (36,37] (37,38] (38,39]
Przedział
Iloś
ć w
ystą
pień
.
Typy rozkładów (histogramów)
Typy rozkładów (histogramów)
Amodalny = skrajnie asymetryczny
Typy rozkładów (histogramów)
PREZENTOWANIE DANYCH
PODSTAWY – DANE I ICH PREZENTACJA
Wykres punktowy
Tabela Dane z pomiarów zagęszczenia makrozoobentosu w zależności od głębokości.
Pomiary w próbce
Głębokość [m]
1 2 3 4 5
1 32,76 33,37 36,54 36,20 36,74
2 32,72 33,11 35,11 36,58 36,40
3 32,70 33,15 36,02 35,24 36,43
4 32,69 33,25 35,59 36,14 36,72
5 32,67 33,20 36,03 35,52 36,55
PREZENTOWANIE DANYCH
PODSTAWY – DANE I ICH PREZENTACJA
Wykres punktowy
Rys. Wykres punktowy zależności pomiędzy głębokością a zagęszczeniem makrozoobentosu.
32
32.5
33
33.5
34
34.5
35
35.5
36
36.5
37
1410 1420 1430 1440 1450 1460 1470 1480 1490
Obroty [obr/min]
Uzi
arni
enie
Głębokość w [m]
Zag
ęszc
zeni
e [o
s./m
2 ]
1 2 3 4 5
PREZENTOWANIE DANYCH
PODSTAWY – DANE I ICH PREZENTACJA
Wykres punktowy
im większa głębokość tym większe zagęszczenie
32
32.5
33
33.5
34
34.5
35
35.5
36
36.5
37
1410 1420 1430 1440 1450 1460 1470 1480 1490
Obroty [obr/min]
Uzi
arni
enie
Głębokość w [m]
Zag
ęszc
zeni
e [o
s./m
2 ]
1 2 3 4 5
PREZENTOWANIE DANYCH
PODSTAWY – DANE I ICH PREZENTACJA
Wykres punktowy
przy głębokości 3 i 4 m zagęszczenie charakteryzuje się największą zmiennością
32
32.5
33
33.5
34
34.5
35
35.5
36
36.5
37
1410 1420 1430 1440 1450 1460 1470 1480 1490
Obroty [obr/min]
Uzi
arni
enie
Głębokość w [m]
Zag
ęszc
zeni
e [o
s./m
2 ]
1 2 3 4 5
PREZENTOWANIE DANYCH
PODSTAWY – DANE I ICH PREZENTACJA
Wykres punktowy
zagęszczenie jest najbardziej jednorodne na głębokości 1m
32
32.5
33
33.5
34
34.5
35
35.5
36
36.5
37
1410 1420 1430 1440 1450 1460 1470 1480 1490
Obroty [obr/min]
Uzi
arni
enie
Głębokość w [m]
Zag
ęszc
zeni
e [o
s./m
2 ]
1 2 3 4 5
top related