Program studiów
Program studiów podyplomowych na kierunku Inżynieria Danych. Big Data.
Programowanie w języku Python
(24 godz.)
-
Podstawowe koncepcje
-
Pandas, numpy, statystyka w Pythonie
-
Systemy kontroli wersji
-
Podstawy testowania
-
Analiza porównawcza algorytmów na podstawie złożoności obliczeniowej
Formaty danych
(8 godz.)
- Formaty danych: csv, json, avro, parquet, xml
Programowanie obiektowe w języku Python
(16 godz.)
-
Atrybuty, klasy, konstruktor
-
Metody, dziedziczenie, „metody magiczne”
Orkiestratory
(8 godz.)
-
Cron
-
Airflow
Procesy CICD
(8 godz.)
- Github Actions lub AirFlow
Apache Kafka
(8 godz.)
- Interfejs Apache Kafka – szybki start do strumieniowego przetwarzania danych
NOSQL (MICROSOFT AZURE)
(16 godz.)
- Podstawowe koncepcje baz NoSQL - HBase, Cassandra, Impala, Neo4j
ZAAWANSOWANE BAZY DANYCH I HURTOWANIE DANYCH
(24 godz.)
-
Podstawowe oraz zaawansowane aspekty języka SQL
-
Koncepcje modelowania hurtowni danych (ROLAP, MOLAP, HOLAP)
-
Technologie ETL/ELT
-
Elementy prezentacji danych np. Power BI
NARZĘDZIA BIG DATA (MICROSOFT AZURE)
(24 godz.)
- Apache Hadoop & Apache Spark
Wprowadzenie do sztucznej inteligencji
(32 godz.)
-
Podstawowe pojęcia i definicje
-
Zad. Regresji, klasyfikacji, detekcji, klasteryzacji i optymalizacji
-
Uczenie nadzorowane i nienadzorowane
-
Atrybuty danych, ich typy i właściwości
-
Zbiory danych (uczący, testujący, walidacja, etc.)
-
Metody klasyfikacji, klasteryzacji i estymacji