cupmrg kurs po mashinnomu obucheniu ot mailru group - gusenov/kb GitHub Wiki
Программа курса по машинному обучению от Mail.Ru Group
- Регрессия от одной переменной и нескольких переменных. Переобучение и способы борьбы с ним.
- Логистическая регрессия. Бинарная и многоклассовая классификация. Классификатор kNN.
- Метод опорных векторов.
- Работа с текстом: препроцессинг и векторное представление, задачи классификации.
- Тематическое моделирование: pLSI, LDA.
- Векторное представление текста: word2vec, fastText.
- Алгоритмы понижения размерности: PCA, LSH.
- EM-алгоритм, k-means и s-means алгоритм.
- Иерархические алгоритмы кластеризации. Метрики оценки кластеризации.
- Деревья решений. Ансамбли деревьев: случайный лес.
- Градиентный бустинг над деревьями: xgboost.
- AB-тестирование.
- Интервальные оценки качества классификаторов в продакшене.