Конструирование алгоритмов и обработка данных

для Machine Learning (Python)

Информация о курсе:


Стоимость: 6 000 грн в месяц

Длительность курса: 2 месяца (45 часов)
Вечерние группы: 18 занятий х 2,5 часа
Субботние группы: 10 занятий х 4,5 часа
Возможно обучение On-line

Дата начала курса:


уточняйте дату по телефону:
+38 (044) 362-05-77 
+38 (050) 736-91-50 
+38 (068) 934-59-24

Записаться в группу
 

Курс Машинного обучения (Machine Learning) предназначен для систематизации работы с данными различного характера.

Практические знания Науки о данных, полученные с помощью данного курса, позволят:

  • анализировать и структурировать образцы поведения,
  • выявлять закономерности и отклонения от них,
  • строить неочевидные взаимосвязи между данными.

Особо будет рассмотрен случай влияния нескольких факторов в совокупности для построения надежных моделей прогнозирования поведения.

Методы Машинного обучения, рассмотренные в рамках этого курса, дадут возможность:

  • автоматизировать распознавание образцов поведения,
  • строить эффективные алгоритмы в зависимости от требуемых характеристик,
  • обрабатывать массивы информации и выдавать рекомендации за приемлемое время с заданной точностью.

Прикладные аспекты обработки больших массивов данных (Big Data) посредством стека технологий Apache Hadoop дадут слушателям курса масштабируемый инструментарий для работы с нереляционными базами данных. Среди источников информации будут также рассмотрены реляционные СУБД, текстовые файлы, гипертекстовые документы, социальные сети.

Особенностью курса является максимально эффективная визуализация статистических выводов для эффективного принятия решений. По итогам курса каждый слушатель предоставит отчет о финальном проекте с помощью средств визуализации.

 

Курс построен на реальных данных (а не на учебных эталонных примерах).

Подготовка проектного окружения

  • Система контроля версий GitHub/GitLab
  • Пакет для разработки: на Python: Anaconda
  • Основные библиотеки: numpy, matplotlib, pandas, sklearn, tensorflow 

Основы Machine Learning

  • Цели и задачи
  • Жизненный цикл
  • Математический аппарат

Загрузка, обработка и подготовка данных (Data Wrangling)

  • Загрузка данных. Форматы данных: csv/xls/html/sql
  • Пропущенные данные, дублирование, преобразование
  • Работа с публичными данными (банки данных – свободно распространяемые и платные)

Автоматизация работы с распределенными данными

  • Обзор стека распределенных вычислений: Hadoop и аналоги

Визуализация и типы анализа данных

  • Диаграммы точечная и рассеяния, гистограмма
  • Корреляция и ее применения, матричная диаграмма
  • Многомерные представления: параллельные координаты, кривые Эндрю

Модели машинного обучения

  • Снижение размерности: метод главных компонент (PCA), изокарта, KNN
  • Масштабирование (нормализация)
  • Метод k-средних (k-means)
  • Регрессия
  • Метод опорных векторов (SVM)
  • Деревья решений (CART)
  • Случайный лес (RF)
  • Логистическая регрессия
  • Нейронные сети: сверточные и рукуррентные НС (CNN, RNN)

Качество алгоритма и оптимизация

  • Выбор модели
  • Оценка качества
  • Кросс-валидация
  • Подбор параметров
  • Сравнение результатов