Program studiów
Program studiów podyplomowych na kierunku analiza Danych – Data Science z elementami AI na Uniwersytecie WSB Merito we Wrocławiu.
Wprowadzenie do Pythona dla Data Science
(16 godz.)
- Podstawy Pythona – składnia, struktury danych (listy, słowniki, zbiory)
- Wprowadzenie do Jupyter Notebook – praca w środowisku do analizy danych
- Biblioteki Python: numpy i pandas – podstawowe operacje na danych, modyfikacje, transformacje
Eksploracyjna Analiza Danych (EDA)
(16 godz.)
- Zaawansowane operacje na danych w pandas – filtrowanie, grupowanie, przekształcanie danych
- Eksploracyjna analiza danych (EDA) – techniki eksploracyjne, statystyki opisowe
- Wizualizacja danych w Pythonie – użycie bibliotek matplotlib i seaborn do tworzenia wykresów i wizualizacji
Przetwarzanie i przygotowanie danych z Pythonem
(16 godz.)
- Czyszczenie danych – obsługa brakujących danych, usuwanie wartości odstających za pomocą pandas i numpy
- Standaryzacja i normalizacja danych – transformacje za pomocą scikit-learn
- Łączenie i agregacja danych – operacje merge, join, concatenate w pandas
Podstawy statystyki
(16 godz.)
- Statystyka opisowa i inferencyjna – podstawowe miary, testy statystyczne z scipy i statsmodels
- Rozkłady prawdopodobieństwa – implementacja rozkładów przy użyciu numpy i scipy
- Regresja liniowa w Pythonie – wprowadzenie do modelowania regresji liniowej w scikit-learn, analiza wyników, interpretacja
Uczenie Maszynowe w Pythonie
(16 godz.)
- Uczenie nadzorowane i nienadzorowane – podstawowe pojęcia i typy problemów
- Regresja liniowa i logistyczna – implementacja i interpretacja modeli z scikit-learn
- Wskaźniki oceny modeli – użycie metryk takich jak accuracy, precision, recall, F1-score w scikit-learn
Klasyfikacja i analiza klasteryzacji w Pythonie + Azure Machine Learning
(16 godz.)
- Modele klasyfikacji – implementacja drzew decyzyjnych, KNN, Naive Bayes w scikit-learn
- Klasteryzacja – algorytmy K-means, DBSCAN w scikit-learn
- Wprowadzenie do Azure Machine Learning – założenie konta, praca w środowisku Azure ML Workspace, użycie SDK Azure
- Tworzenie i uruchamianie eksperymentów ML w Azure – wykorzystanie klasyfikatorów i klasteryzacji, uruchamianie modeli ML w Azure ML Studio
Zaawansowane algorytmy Uczenia Maszynowego + Azure
(16 godz.)
- Ensemble learning – implementacja lasów losowych (Random Forest) i gradient boosting (XGBoost, LightGBM) w scikit-learn
- Tuning hiperparametrów – użycie GridSearchCV i RandomizedSearchCV z scikit-learn do poprawy wyników modeli
- Automatyzacja modelowania ML w Azure – AutoML w Azure ML Studio, wdrażanie i monitorowanie modeli z Azure SDK
Przetwarzanie Danych Tekstowych (NLP) z Pythonem
(16 godz.)
- Wprowadzenie do przetwarzania języka naturalnego (NLP) – podstawowe pojęcia i zastosowania
- Analiza tekstu – tokenizacja, ekstrakcja cech za pomocą TF-IDF z scikit-learn, analiza sentymentu
- Modele NLP w Pythonie – implementacja modelu Bag of Words, Word2Vec z Gensim, analiza i interpretacja wyników
Wprowadzenie do sztucznej inteligencji (AI) i Sieci Neuronowych + Azure Cognitive Services
(16 godz.)
- Podstawy sieci neuronowych – budowa perceptronu, teoria działania, neuron w tensorflow i keras
- Wprowadzenie do TensorFlow i Keras – tworzenie prostych sieci neuronowych, użycie TensorBoard do monitorowania wyników
- Azure Cognitive Services – przegląd usług AI, takich jak Vision API, Speech API i Text Analytics API
- Praktyczne zastosowanie Azure Cognitive Services – użycie Vision API do analizy obrazów lub Text Analytics do analizy tekstów
Wprowadzenie do algorytmów głębokiego uczenia maszynowego
(16 godz.)
Deep learning (Keras, TesnorFlow, Pytorch)
Projekt i egzamin końcowy
(16 godz.)
- Seminarium projektowe – opracowanie projektu końcowego, wybór problemu do analizy, praca nad projektem.
- Prezentacja projektu – omówienie wyników, przegląd zastosowanych technik, omówienie wykorzystanych technologii.
- Egzamin końcowy – test