cupmrg kurs po mashinnomu obucheniu ot mailru group - gusenov/kb GitHub Wiki

Программа курса по машинному обучению от Mail.Ru Group

  1. Регрессия от одной переменной и нескольких переменных. Переобучение и способы борьбы с ним.
  2. Логистическая регрессия. Бинарная и многоклассовая классификация. Классификатор kNN.
  3. Метод опорных векторов.
  4. Работа с текстом: препроцессинг и векторное представление, задачи классификации.
  5. Тематическое моделирование: pLSI, LDA.
  6. Векторное представление текста: word2vec, fastText.
  7. Алгоритмы понижения размерности: PCA, LSH.
  8. EM-алгоритм, k-means и s-means алгоритм.
  9. Иерархические алгоритмы кластеризации. Метрики оценки кластеризации.
  10. Деревья решений. Ансамбли деревьев: случайный лес.
  11. Градиентный бустинг над деревьями: xgboost.
  12. AB-тестирование.
  13. Интервальные оценки качества классификаторов в продакшене.