od big data do analityki 3.0
TRANSCRIPT
Od Big Data do Analityki 3.0
Od chaosu danych do odkrycia potencjału informacji
Magdalena HoffmanZETO Katowice Sp. z o.o.
Kraków, 17 kwietnia 2023
Opowiemy Kim jesteśmy
Skąd się wzięliśmy
O projekcie słów kilka:
KlientProblem
WyzwanieEfekty
…i potencjał
ZETO Katowice
ZETO INNOVATIONS• Skupiamy się na zaawansowanej analityce• Wykorzystujemy Internet Rzeczy• Stosujemy podejście big data’owe w pracy z danymi• Produkty rozwijamy w modelu Customer Development• Dostarczamy Klientom wiedzy
niezbędnej do podejmowania decyzji biznesowych
w czasie rzeczywistym
Start• Spedytor krajowy• Koszty paliwa to znacząca część kosztów operacyjnych
Cel – obniżyć zużycie paliwa – Eco Driving
Czy to w ogóle jest możliwe?
Choć dysponujemy danymi i częściowo informacjami, to wciąż brakuje nam...
…wiedzy
Wiedza
Informacje
Dane
Potr
zeba
Anal
iza
Wie
dza
Konc
epcja
Dane
Real
izacja
Wer
yfika
cja
Efek
ty
Pote
ncja
ł
Praca z danymi
Model CRISP-DM
Język R
Źródła danych
“Wygrywa nie ten, kto ma najlepszy algorytm, a ten, który ma najwięcej danych.”*
Źródło: Andrew Ng, Ekspert Machine Learning, prof. Stanford University
Źródła danych
Źródła danych, cd.• Strumienie danych
(online)• Listy przewozowe• Rozkłady jazdy• Baza infrastruktury
transportowej• Bazy systemów
dziedzinowych• Zbiory ograniczeń w ruchu
• Dane z systemów ERP / CMMS• Dane meteorologiczne• historyczne• bieżące
• Uzgodnione struktury pośrednie• Słowniki
Najważniejsze procesy ETL
“Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać”*
Źródło: Mieczysław Muraszkiewicz, Instytut Informatyki Teoretycznej i Stosowanej PAN
Najważniejsze procesy ETL
• Infrastruktura• Przejazdy• Tabor• Ludzie• Warunki zewnętrzne
Czyszczenie i przetwarzanie
Przykład duplikowania się identyfikatora pojazdu
Czyszczenie i przetwarzanie
Przykład błędnego profilu trasy
--- Kształt linii przed naprawą--- Kształt linii po naprawie
Czyszczenie i przetwarzanie
Niedokładność wskaźnika zużycia paliwa
Efekty• Zdefiniowana i zasilona Hurtownia danych• Moduł analityczny• Zintegrowana informacja o przejazdach• Prezentacja wizualna przejazdów• Możliwość wyznaczenia spalania chwilowego• Baza infrastruktury transportowej
tworzymy Adaptacyjny algorytm optymalizacji przejazdów uwzględniający bieżące ograniczenia
Wchodzi Analityka 3.0
Wbudowujemy algorytm w aplikacje
Potencjał
Podsumowanie
Pytania