Program studiów
Program studiów podyplomowych na kierunku Inżynieria danych. Big Data.
Analiza danych w języku R
(18 godz.)
Środowisko R i RStudio, typy atomowe, wektory, listy, funkcje, data cleaning, tworzenie wykresów, markdown (18 godz.)
SYSTEMY BAZ DANYCH. PODSTAWY SQLA
(24 godz.)
- Diagramy ERD, Normalizacja, MS SQL, DDL, SQL DML (24 godz.)
Programowanie w języku Python
(24 godz.)
- Składnia, tablice, funkcje,Pandas, Statystyka w Pythonie (24 godz.)
ANALIZA DANYCH W JĘZYKU JAVA
(32 godz.)
-
Podstawowe pojęcia programowania obiektowego, środowisko, narzędzia, co to jest analiza danych, data science a analiza danych, dlaczego Java, struktury danych – Java Collections Framework, ETL – pobieranie, przetwarzanie, ładowanie danych (16 godz.)
-
Sposoby integracji z relacyjnymi bazami danych, przetwarzanie danych w podejściu funkcyjnym (16 godz.)
NOSQL (MICROSOFT AZURE)
(20 godz.)
- Podstawowe koncepcje baz NoSQL - HBase, Cassandra, Impala, Neo4j (20 godz.)
PROGRAMOWANIE OBIEKTOWE W JĘZYKU PYTHON
(12 godz.)
- Atrybuty, klasy, konstruktor, metody, dziedziczenie, „metody magiczne” (12 godz.)
APACHE KAFKA
(6 godz.)
Interfejs Apache Kafka - szybki start do strumieniowego przetwarzania danych (6 godz.)
ZAAWANSOWANE BAZY DANYCH I HURTOWANIE DANYCH
(24 godz.)
- Zawansowane aspekty języka SQL i TSQL; Koncepcje modelowania hurtowni danych (ROLAP, MOLAP, HOLAP); Technologie ETL/ELT; Elementy prezentacji danych np. Power BI (24 godz.)
NARZĘDZIA BIG DATA (MICROSOFT AZURE)
(24 godz.)
Apache Hadoop & Apache Spark (24 godz.)
PROJEKT
(8 godz.)
- Seminarian projektowe (8 godz.)
FORMA ZALICZENIA
testy semestralne i egzamin końcowy polegający na obronie projektu.