Команда отказоустойчивости Яндекс Такси приглашает на митап.
Задача нашей команды — избежать длительных даунтаймов. На митапе мы расскажем о метастабильных состояниях отказа, сложностях работы с базами данных и Chaos Engineering, а ещё проведём воркшоп по работе с инцидентами. В конце митапа участников ждёт нетворкинг и экскурсия по офису.
800+
Микросервисов
42,3+ млн
Пользователей в месяц
800+
Микросервисов
42,3+ млн
Пользователей в месяц
Ответим на вопросы:
01
Как с учетом сотен микросервисов
структурировать целевую архитектуру?
Практический воркшоп «Case study: разбор инцидентов Яндекс Такси или как приоритезировать action items правильно»
На реальных примерах разберём инциденты Яндекс Такси, познакомимся с примерами наших пост-мортемов и проведем искусственную ретроспективу даунтайма.
Ждём специалистов, готовых активно участвовать в дискуссии и делиться опытом работы с инцидентами.
Олег Ермаков
Модератор
Руководитель продуктовой бекенд-разработки в Такси
14:00
Сбор гостей, обед, нетворкинг
14:30
Сложность метастабильных состояний отказа на примере Такси
Расскажу про особый класс отказов в распределённых системах, известный в англоязычных источниках как metastable failures. Покажу, как система может войти в такое состояние и почему не сможет выйти из него самостоятельно и как мы справляемся с подобными отказами.
Алексей Быков
Старший разработчик в команде Go Product Platform, координирую инциденты Такси
15:00
Укрощение строптивых баз данных
Поделимся сложностями работы с БД на примере нескольких проектов, связанных темой надёжности. Будут реальные кейсы и блоки о теории вероятностей и теории ограничений под соусом Redis и MongoDB. Всё строго на практических примерах.
Павел Назаров
Руководитель группы Pro Core, инцидентолог Такси
15:30
Перерыв, онлайн-интерактив
16:00
Сломай меня полностью: Chaos Engineering
Что такое Chaos и как мы его используем в Такси. Покажем на тестовом стенде и внутри приложения Яндекс Такси.
Максим Ивашковский
Разрушитель инфры в Такси
Андрей Матвеев
Разрушитель инфры в Такси
16:30
Повышение стабильности legacy продукта в условиях роста нагрузки
Малый бизнес работает с небольшой командой разработчиков, но когда он покупается крупным инвестором, нагрузка возрастает, а технический долг может вызывать даунтаймы. В такой ситуации важно решать не только технические проблемы, но и наращивать функциональность. Я поделюсь опытом решения подобных проблем.
Yandex Go Infra — телеграм-сообщество, в котором специалисты обмениватся опытом работы с инфраструктурами, делятся анонсами митапов и полезными материалами. Здесь можно будет задавать вопросы и обсуждать доклады экспертов прямо во время митапа.