Program studiów

Program studiów podyplomowych na kierunku Inżynieria Danych. Big Data.

Liczba miesięcy nauki: 9
Liczba godzin: 176
Liczba zjazdów: 11
Liczba semestrów: 2
Programowanie w języku Python
(24 godz.)
  • Podstawowe koncepcje 

  • Pandas, numpy, statystyka w Pythonie  

  • Systemy kontroli wersji 

  • Podstawy testowania 

  • Analiza porównawcza algorytmów na podstawie złożoności obliczeniowej 

Formaty danych
(8 godz.)
  • Formaty danych: csv, json, avro, parquet, xml 
Programowanie obiektowe w języku Python
(16 godz.)
  • Atrybuty, klasy, konstruktor 

  • Metody, dziedziczenie, „metody magiczne” 

Orkiestratory
(8 godz.)
  • Cron 

  • Airflow 

Procesy CICD
(8 godz.)
  • Github Actions lub AirFlow 
Apache Kafka
(8 godz.)
  • Interfejs Apache Kafka – szybki start do strumieniowego przetwarzania danych 
NOSQL (MICROSOFT AZURE)
(16 godz.)
  • Podstawowe koncepcje baz NoSQL - HBase, Cassandra, Impala, Neo4j
ZAAWANSOWANE BAZY DANYCH I HURTOWANIE DANYCH
(24 godz.)
  • Podstawowe oraz zaawansowane aspekty języka SQL 

  • Koncepcje modelowania hurtowni danych (ROLAP, MOLAP, HOLAP) 

  • Technologie ETL/ELT 

  • Elementy prezentacji danych np. Power BI 

NARZĘDZIA BIG DATA (MICROSOFT AZURE)
(24 godz.)
  • Apache Hadoop & Apache Spark 
Wprowadzenie do sztucznej inteligencji
(32 godz.)
  • Podstawowe pojęcia i definicje 

  • Zad. Regresji, klasyfikacji, detekcji, klasteryzacji i optymalizacji 

  • Uczenie nadzorowane i nienadzorowane 

  • Atrybuty danych, ich typy i właściwości 

  • Zbiory danych (uczący, testujący, walidacja, etc.) 

  • Metody klasyfikacji, klasteryzacji i estymacji 

Forma zaliczenia
Testy
test końcowy
Projekt
projekt