Program studiów

Program studiów podyplomowych na kierunku analiza Danych – Data Science z  elementami AI na Uniwersytecie WSB Merito we Wrocławiu.

Liczba miesięcy nauki: 9
Liczba godzin: 176
Liczba zjazdów: 11
Liczba semestrów: 2
Wprowadzenie do Pythona dla Data Science
(16 godz.)
  • Podstawy Pythona – składnia, struktury danych (listy, słowniki, zbiory)
  • Wprowadzenie do Jupyter Notebook – praca w środowisku do analizy danych
  • Biblioteki Python: numpy i pandas – podstawowe operacje na danych, modyfikacje, transformacje
Eksploracyjna Analiza Danych (EDA)
(16 godz.)
  • Zaawansowane operacje na danych w pandas – filtrowanie, grupowanie, przekształcanie danych
  • Eksploracyjna analiza danych (EDA) – techniki eksploracyjne, statystyki opisowe
  • Wizualizacja danych w Pythonie – użycie bibliotek matplotlib i seaborn do tworzenia wykresów i wizualizacji
Przetwarzanie i przygotowanie danych z Pythonem
(16 godz.)
  • Czyszczenie danych – obsługa brakujących danych, usuwanie wartości odstających za pomocą pandas i numpy
  • Standaryzacja i normalizacja danych – transformacje za pomocą scikit-learn
  • Łączenie i agregacja danych – operacje merge, join, concatenate w pandas
Podstawy statystyki
(16 godz.)
  • Statystyka opisowa i inferencyjna – podstawowe miary, testy statystyczne z scipy i statsmodels
  • Rozkłady prawdopodobieństwa – implementacja rozkładów przy użyciu numpy i scipy
  • Regresja liniowa w Pythonie – wprowadzenie do modelowania regresji liniowej w scikit-learn, analiza wyników, interpretacja
Uczenie Maszynowe w Pythonie
(16 godz.)
  • Uczenie nadzorowane i nienadzorowane – podstawowe pojęcia i typy problemów
  • Regresja liniowa i logistyczna – implementacja i interpretacja modeli z scikit-learn
  • Wskaźniki oceny modeli – użycie metryk takich jak accuracy, precision, recall, F1-score w scikit-learn
Klasyfikacja i analiza klasteryzacji w Pythonie + Azure Machine Learning
(16 godz.)
  • Modele klasyfikacji – implementacja drzew decyzyjnych, KNN, Naive Bayes w scikit-learn
  • Klasteryzacja – algorytmy K-means, DBSCAN w scikit-learn
  • Wprowadzenie do Azure Machine Learning – założenie konta, praca w środowisku Azure ML Workspace, użycie SDK Azure
  • Tworzenie i uruchamianie eksperymentów ML w Azure – wykorzystanie klasyfikatorów i klasteryzacji, uruchamianie modeli ML w Azure ML Studio
Zaawansowane algorytmy Uczenia Maszynowego + Azure
(16 godz.)
  • Ensemble learning – implementacja lasów losowych (Random Forest) i gradient boosting (XGBoost, LightGBM) w scikit-learn
  • Tuning hiperparametrów – użycie GridSearchCV i RandomizedSearchCV z scikit-learn do poprawy wyników modeli
  • Automatyzacja modelowania ML w Azure – AutoML w Azure ML Studio, wdrażanie i monitorowanie modeli z Azure SDK
Przetwarzanie Danych Tekstowych (NLP) z Pythonem
(16 godz.)
  • Wprowadzenie do przetwarzania języka naturalnego (NLP) – podstawowe pojęcia i zastosowania
  • Analiza tekstu – tokenizacja, ekstrakcja cech za pomocą TF-IDF z scikit-learn, analiza sentymentu  
  • Modele NLP w Pythonie – implementacja modelu Bag of Words, Word2Vec z Gensim, analiza i interpretacja wyników
Wprowadzenie do sztucznej inteligencji (AI) i Sieci Neuronowych + Azure Cognitive Services
(16 godz.)
  • Podstawy sieci neuronowych – budowa perceptronu, teoria działania, neuron w tensorflow i keras
  • Wprowadzenie do TensorFlow i Keras – tworzenie prostych sieci neuronowych, użycie TensorBoard do monitorowania wyników
  • Azure Cognitive Services – przegląd usług AI, takich jak Vision API, Speech API i Text Analytics API
  • Praktyczne zastosowanie Azure Cognitive Services – użycie Vision API do analizy obrazów lub Text Analytics do analizy tekstów
Wprowadzenie do algorytmów głębokiego uczenia maszynowego
(16 godz.)

Deep learning (Keras, TesnorFlow, Pytorch) 

Projekt i egzamin końcowy
(16 godz.)
  • Seminarium projektowe – opracowanie projektu końcowego, wybór problemu do analizy, praca nad projektem.
  • Prezentacja projektu – omówienie wyników, przegląd zastosowanych technik, omówienie wykorzystanych technologii.
  • Egzamin końcowy – test