Открытый код в Яндексе. Спринты по CatBoost и ClickHouse

2 февраля
Москва

Метод машинного обучения CatBoost и аналитическая система управления базами данных ClickHouse — технологии Яндекса с открытым исходным кодом. Поучаствовать в их разработке может любой желающий.

2 февраля мы впервые проводим для разработчиков встречу в формате спринтов. Суть нового формата в том, что участники будут группами по 2–3 человека или индивидуально решать небольшие задачи.

На мероприятии вы узнаете, как ведётся разработка CatBoost и ClickHouse, изучите структуру их кода, научитесь писать и запускать тесты. И, мы надеемся, внесёте изменения, которые войдут в один из ближайших релизов.

Сперва мы на простом примере покажем, как решить задачу и опубликовать её на GitHub. Затем приступим к практике. Вы выберете из предложенного списка задания и будете работать над ними индивидуально либо в маленьких группах. Разобраться со сложностями помогут представители команд CatBoost и ClickHouse. В конце мы подведём итоги и наградим победителей.

Для участия в мероприятии необходимо знание C++. Задачи различаются по уровню сложности. У каждой будет подробное описание, и каждую можно решить за отведённое время целиком.

Примеры задач:

  • Улучшить диагностику входных данных и параметров;
  • При вычислении метрик в функции eval_metrics Python-библиотеки CatBoost разрешить стартовать не из нулевой точки, а из какой-либо другой;
  • Добавить generic-вариант функций least, greatest в ClickHouse


На встречу захватите ноутбук с любимой средой разработки. Также вам понадобится профиль на GitHub — нужно создать его до мероприятия или использовать уже имеющийся.

  • Для подготовки к работе с CatBoost необходимо заранее клонировать себе проект catboost и по инструкции собрать его. Если при сборке возникнут проблемы, пишите в телеграм-чат @catboost_ru.

  • Для подготовки к работе с ClickHouse потребуется создать форк репозитория, собрать и запустить СУБД на своей машине. Плюсом будет ознакомление с архитектурой ClickHouse (видео).

Участие бесплатное, но количество мест ограничено. Поэтому, пожалуйста, регистрируйтесь заранее.

Доклады

10:00Регистрация
11:00Введение в разработку CatBoost
12:00Введение в разработку ClickHouse
13:00Распределение задач между участниками
13:30Обед
14:00Решение задач (часть 1)
16:00Перерыв
16:15Решение задач (часть 2)
18:15Перерыв
18:30Подведение итогов и награждение