Download - Finał konkursu "Analityk Danych"
![Page 1: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/1.jpg)
Finał konkursu "Analityk Danych"
• CAWI jako przyszłościowa technika zbierania danych• Zastosowanie statystyki w analizie danych
giełdowych • Symulacje komputerowe - zastosowanie w
prognozowaniu.• Metody prezentacji danych statystycznych
Koło Naukowe StatystykówUniwersytetu Ekonomicznego w Katowicach
![Page 2: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/2.jpg)
CAWI jako przyszłościowa technika zbierania danych
Piotr Ziuziański
![Page 3: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/3.jpg)
Techniki zbierania danychPAPI (Paper and pencil interview)• Najstarsza metoda: ankieta papierowa• Wymaga wprowadzania i kontroli danych
CAPI (Computer aided personal interview)
• Ankieta w formie elektronicznej, realizowana za pomocą komputera• Zapewnia kontrolę zakresu wartości danych i zależności pomiędzy pytaniami
CATI (Computer aided telephone interview)• Realizowanie wywiadów przez telefon• Ankieta w formie elektronicznej, realizowana za pomocą komputera• Zapewnia kontrolę zakresu wartości danych i zależności pomiędzy pytaniami
CAWI (Computer aided web interview)• Przyszłość badań: wywiady internetowe, bez udziału ankietera• Niski koszt wywiadu• Najbardziej zaawansowana metoda zbierania danych, daje duże poczucie anonimowości
![Page 4: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/4.jpg)
DOTARCIE•Blisko połowa Polaków w wieku 15-75 korzysta z Internetu. Wśród młodzieży, osób z wyższym wykształceniem czy lepiej zarabiających Polaków penetracja Internetu jest niemal całkowita — oscyluje wokół 90%.
DOSTĘPNOŚĆ•Internet umożliwia dotarcie do najróżniejszych, często bardzo wąskich grup respondentów jak np. przedstawiciele różnych grup zawodowych, osoby na wysokich stanowiskach, konsumenci marki X itp.
SZYBKOŚĆ•Realizacja badania trwa zdecydowanie krócej niż w przypadku badań tradycyjnych. Wstępne wyniki można otrzymać już po 2-3 dniach.
NISKIE KOSZTY•Brak kosztów prac terenowych: druku i wysyłki materiałów, wynagrodzenia dla ankieterów sprawia, że ceny badań online są bardzo atrakcyjne.
MULTIMEDIALNOŚĆ•Do ankiet online można z łatwością dołączyć elementy multimedialne takie jak obraz czy film. Dzięki temu badanie online świetnie sprawdza się do testowania reklam czy opakowań.
INTERAKTYWNOŚĆ•Możliwe jest modyfikowanie zestawu i kolejności zadawania pytań w zależności od uzyskiwanych odpowiedzi Dzięki temu można przeprowadzać bardziej precyzyjne badania poprzez eliminację niektórych pytań lub pogłębianie odpowiedzi na inne.
CAWI
zale
ty
![Page 5: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/5.jpg)
(X)HTML(Extensible HyperText Markup
Language)
CSS(Cascading Style Sheets)
PHP
JAVASCRIPT, AJAX(Asynchronous JavaScript and XML)
MYSQL
• struktura formularza ankiety
• ustalenie wyglądu strony
• zaprogramowanie formularza (wysyłanie, sprawdzanie poprawności)
• nadanie dynamiki, wyświetlanie dynamiczne, interakcja po stronie klienta
• przechowywanie danych
Technologie wykorzystywane w CAWI
<html><head></head><body><form><input type = "radio">opcja pierwsza</body></form></html>
body {background-color: #477795;}h1 {color: #99AF34;font-family: "Trebuchet MS",arial,sans-serif;text-align: right;}
<?php $plec = $_POST['0'];
if ($plec == '1') { $napis0 = "mieszkałeś"; $napis1 = "zdawałeś"; $napis2 = "zamierzałeś"; $napis3 = "studiowałeś"; } elseif ($plec == '0') { $napis0 = "mieszkałaś"; $napis1 = "zdawałaś"; $napis2 = "zamierzałaś"; $napis3 = "studiowałaś"; } ?>
<script type='text/javascript'> //<![CDATA[ $(function(){
$("[name=13]").change(function(){ $("#13").toggle($("[name=13]").index(this)!=2);
}); $
("[name=14]").change(function(){ $("#14").toggle($("[name=14]").index(this)!=2);
});
}); //]]> </script>
$Query = "Insert into ankieta_s values(''";
foreach($_POST as $index => $wartosc) //petla tworzy glowna tresc zapytania do sql{
$Query .= ", '$wartosc'";}$Query .=")";
![Page 6: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/6.jpg)
Etapy CAWI
Podanie adresu internetowego
Uwierzytelnienie respondenta
Wypełnienie ankiety przez respondenta
Walidacja poprawności wypełnionej
ankiety
Wysłanie danych do bazy danych
![Page 7: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/7.jpg)
Zastosowanie statystyki w analizie danych giełdowych
Michał MierzwaPaweł Bieroński
![Page 8: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/8.jpg)
Wykres liniowy - EURUSD
![Page 9: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/9.jpg)
Średnie ruchome
![Page 10: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/10.jpg)
20
xxxxx
20
120SMA
n
xxxxx
n
1]n[SMA
2032120
1ii
n321n
1ii
Średnie ruchome
SMA – średnia ruchomax – kurs zamknięcia
![Page 11: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/11.jpg)
Średnie ruchome
![Page 12: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/12.jpg)
Wstęga Bollingera
20
)()()(2
)(20
12
220
22
21
20
1
2
xxxxxxndsBolingerBa
xxndsBolingerBai
i
x – kurs zamknięcia
![Page 13: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/13.jpg)
Wstęga Bollingera
![Page 14: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/14.jpg)
Symulacje komputerowe - zastosowanie w prognozowaniu.
Małgorzata Krzciuk
![Page 15: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/15.jpg)
Symulacja
• stwarzanie fałszywych pozorów; świadome wprowadzanie w błąd otoczenia;
• przybliżone odtworzenie zachowania danego obiektu lub zjawiska zachodzącego w świecie rzeczywistym za pomocą jego modelu.
• symulacja komputerowa - metoda odtwarzania zjawisk zachodzących w świecie rzeczywistym (lub ich niektórych właściwości i parametrów) za pomocą ich zmatematyzowanych modeli, definiowanych i obsługiwanych przy użyciu programów komputerowych; wykorzystywana do wnioskowania o przebiegu tych zjawisk i procesów, których bezpośrednia obserwacja jest niemożliwa lub zbyt kosztowna.
Słownik wyrazów obcych, PWN
![Page 16: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/16.jpg)
Prognozowanie
• Prognozowanie - oparte na uzasadnionych naukowo przesłankach formułowanie przewidywań przyszłych stanów rzeczy, procesów, zdarzeń.
• Prognoza - przewidywanie przyszłych faktów, zjawisk czy zdarzeń na podstawie uzasadnionych przesłanek ustalonych w toku badań nauk., stanowiące wytyczną do dalszego postępowania w danej dziedzinie nauki.
Słownik wyrazów obcych, PWN
![Page 17: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/17.jpg)
R 2.10.1
ESSENTIALSFOR R 19
SPSS 19
Narzędzia statystyczne pozwalające na wykorzystanie symulacji komputerowych w prognozowaniu
![Page 18: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/18.jpg)
Przykład wykorzystania symulacji komputerowej w prognozowaniu
Dane:
![Page 19: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/19.jpg)
Przykład wykorzystania symulacji komputerowej w prognozowaniu
![Page 20: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/20.jpg)
Wykres danych rzeczywistych oraz 10 realizacji wygenerowanychzgodnie z trendem wykładniczym
Wykres danych rzeczywistych i wygenerowanych za pomocą trendów
(z uwzględnieniem prognoz)
![Page 21: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/21.jpg)
Histogram błędów predykcji dla poszczególnych trendów
Wykres rozrzutu wartości generowanych
na okres kolejny i prognoz
![Page 22: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/22.jpg)
Tabela wynikowaprzeprowadzonej symulacji
WYNIKI SYMULACJI
Miary
Trendy
Liniowy Logarytmiczny Potęgowy Wykładniczy
1 2,438 -8,933 -9,606 ,028
2 2,767 9,020 9,685 1,271
3 1,309 1,249 1,233 1,271
4 80,713 1810,331 1825,428 -21,475
(1) względne obciążenie prognoz, (2) względny pierwiastka MSE,(3) względny średni błąd predykcji ex ante, (4) względne obciążenie estymatora V2.
![Page 23: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/23.jpg)
Prognozowanie
Podsumowując, wykorzystanie symulacji komputerowych w procesie prognozowania ma duże znaczenie w szczególności gdy analiza badanego zjawiska lub procesu jest niemożliwa lub zbyt kosztowna. Pozwala ono na łatwe wielokrotne oszacowanie przyszłych wartości badanych zmiennych.
![Page 24: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/24.jpg)
Metody prezentacji danych statystycznychWykresy statystyczne
Paweł DomańskiIzabela Krzyżowska
![Page 25: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/25.jpg)
Metody prezentacji danych statystycznych
• tablice statystyczne,• wykresy statystyczne,• tekst (opis),• mieszana.
![Page 26: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/26.jpg)
![Page 27: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/27.jpg)
Podstawowe wykresy statystyczne
Histogram
Statystyki
Bieżące wynagrodzenie$34,419.57
$28,875.00
$30,750
$17075.66
2.125
.112
$15,750
$135,000
Średnia
Mediana
Dominanta
Odchylenie standardowe
Skośność
Błąd standardowyskośnościMinimum
Maksimum
M ẋ
![Page 28: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/28.jpg)
Słupkowy
Podstawowe wykresy statystyczne
![Page 29: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/29.jpg)
Rozrzutu
Liniowy
LiniowyWykres słonecznikowy
![Page 30: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/30.jpg)
Podstawowe wykresy statystyczne
http://www.wrpo.wielkopolskie.pl
Kołowy Graf
![Page 31: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/31.jpg)
Inne wykresy statystyczne
Twarze Chernoffa Radarowy
![Page 32: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/32.jpg)
Inne wykresy statystyczneWykres konturowy Mapa ciepła
![Page 33: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/33.jpg)
Inne wykresy statystyczne
70 71 72 73 74 75 76 77 78 79 80
1.0
1.2
1.4
1.6
1.8
2.0
2.2
Szwecja
Niemcy
Polska
Czechy
Litwa
Średnia długość życia
Pło
dn
oś
ć
Bąbelkowy PudełkowySkrzypcowy
![Page 34: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/34.jpg)
Programy
Mężczyźni
02004006008001000120014001600
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70
Kobiety
0 200 400 600 800 1000 1200 1400 1600
Piramida wiekuwiek
![Page 35: Finał konkursu "Analityk Danych"](https://reader035.vdocuments.pub/reader035/viewer/2022062410/56815a61550346895dc79ca8/html5/thumbnails/35.jpg)
Dziękujemy za uwagę! :)