CatBoost — библиотека машинного обучения для решения практических задач с использованием больших данных

Градиентный бустинг — один из наиболее часто используемых алгоритмов машинного обучения. Этот алгоритм помогает решать задачи регрессии, классификации и ранжирования на разнородных данных. При помощи градиентного бустинга в Яндексе мы выбираем наиболее релевантные документы для ответа на поисковые запросы, ранжируем музыкальные композиции, предсказываем погоду и решаем много других задач.

CatBoost — это библиотека градиентного бустинга, написанная в Яндексе и выложенная в открытый доступ. В докладе мы расскажем, что такое градиентный бустинг, как он применяется, чем отличается CatBoost от других библиотек, как при помощи него обучать модели на больших данных и как работать с разными типами данных — числовыми и категориальными.

Василий Ершов
Василий Ершов Яндекс

Разработчик CatBoost
Эксперт по алгоритмам машинного обучения

Закончил Санкт-Петербургский государственный университет и Computer Science Center (Санкт-Петербургское отделение ШАД). Аспирант Санкт-Петербургского государственного университета. C 2014 года работает в Яндексе, занимается развитием алгоритмов машинного обучения и ускорением их на GPU.