Метод машинного обучения CatBoost и аналитическая СУБД ClickHouse — технологии Яндекса с открытым исходным кодом. Поучаствовать в их разработке может любой желающий.
28 марта мы вновь проведём для разработчиков встречу в формате спринтов. Участники будут группами по 2–3 человека или индивидуально решать небольшие задачи. Вы посмотрите, как ведётся разработка CatBoost и ClickHouse, узнаете структуру их кода, научитесь писать и запускать тесты. И, мы надеемся, внесёте изменения, которые войдут в один из ближайших релизов.
Сперва мы на простом примере покажем, как решить задачу и опубликовать её на GitHub. Затем приступим к практике. Вы выберете задания из предложенного списка и начнёте работу над ними. Разобраться со сложностями помогут разработчики CatBoost и ClickHouse. В конце мы подведём итоги и наградим победителей.
Задачи отличаются по сложности. У каждой будет подробное описание, каждую можно полностью решить за отведённое время.
Пример задачи: реализовать флаг treat_object_as_categorical в Python. Сейчас обязательно нужно указывать параметр cat_features при обучении или создании классов CatBoost*. Часто нас просят автоматически конвертировать объекты типа object в категориальные фичи, для этого мы предлагаем создание такого флага.
Для участия требуется знание C++. Знание Python будет плюсом. Захватите на встречу ноутбук с любимой средой разработки. Также вам понадобится профиль на GitHub — необходимо создать его до встречи или использовать уже имеющийся. Для подготовки к работе с CatBoost нужно заранее клонировать себе проект catboost и собрать его по инструкции. Если при сборке возникнут проблемы, пишите в телеграм-чат @catboost_ru.
Для подготовки к работе с ClickHouse нужно создать форк репозитория, собрать и запустить СУБД на своей машине. Если при сборке возникнут проблемы, пишите в телеграм-чат @clickhouse_ru. Желательно ознакомиться с архитектурой ClickHouse (видео).
Участие бесплатное, но число мест ограничено. Пожалуйста, регистрируйтесь заранее.