W tym module uczestnicy wcielają się w rolę prawdziwych analityków danych, których zadaniem jest rozwiązanie problemu. Będą podążać za wskazówkami instruktora i przechodzić przez kroki podejmowane przez naukowca zajmującego się danymi - od uzyskania danych i opisania problemu do jego rozwiązania.
Dyscyplina ta, znana również jako nauka o danych, jest jedną z gałęzi informatyki, która rozkwitła w ciągu ostatniej dekady i służy jako podstawa wielu możliwości, jakie oferuje dziś Internet. Jest ściśle związana z popularnymi pojęciami, takimi jak sztuczna inteligencja, uczenie maszynowe, big data, przewidywanie, głębokie uczenie się i wiele innych. Jest to dziedzina, w którą duże firmy, takie jak Google, Facebook, Amazon, Apple, IBM, Microsoft i inne, inwestują znaczne kwoty pieniędzy.
Po ukończeniu modułu studenci nauczą się:
- Różnych metod strukturyzacji danych.
- Różnych typów danych wraz z ich zaletami i wadami.
- Jak zbadać zbiór danych i rozważyć odpowiednie kryteria.
- Prostych algorytmów predykcji (drzewo decyzyjne, las losowy, SVM, KNN).
- Pojęć statystyki do interpretacji wyników.
- Prostych algorytmów grupowania (K-Means, DBScan) z ich zaletami i wadami.
- Sposobów prezentacji wyników i podstawowych typów wykresów.