Машинное обучение в Поиске: инфраструктура и алгоритмы

В этом докладе мы расскажем о процессе обучения моделей ранжирования. Для этой задачи у нас есть система, позволяющая в несколько кликов запускать сложные графы вычислений распределённо. Она называется «Нирвана». Мы объясним, как она устроена, и покажем примеры её использования.

Вы узнаете также об основном алгоритме машинного обучения в Яндексе — Матрикснете. Это наша реализация градиентного бустинга на деревьях решений. У Матрикснета есть несколько замечательных свойств: он устойчив к переобучению, позволяет эффективно распределять вычисления на кластере и строит модели высокого качества без подбора параметров. Матрикснет используется в Яндексе для широкого спектра задач, в том числе для ранжирования поисковой выдачи.