Yandex Go Infra Meetup #2
Reliability

Митап про отказоустойчивость от команды Яндекс Такси

2 сентября 

Команда отказоустойчивости Яндекс Такси приглашает на митап. 
Задача нашей команды — избежать длительных даунтаймов. На митапе мы расскажем о метастабильных состояниях отказа, сложностях работы с базами данных и Chaos Engineering, а ещё проведём воркшоп по работе с инцидентами. В конце митапа участников ждёт нетворкинг и экскурсия по офису.
Ответим на вопросы:
01
Как с учетом сотен микросервисов
структурировать целевую архитектуру?
02
Как в большой системе обнаруживать Corner Cases?
03
Как развивать культуру координации инцидентов?
Программа
11:30
Сбор гостей, завтрак, нетворкинг
12:00
2 часа
Практический воркшоп «Case study:
разбор инцидентов Яндекс Такси или как приоритезировать action items правильно»
На реальных примерах разберём инциденты Яндекс Такси, познакомимся с примерами наших пост-мортемов и проведем искусственную ретроспективу даунтайма.  
Ждём специалистов, готовых активно участвовать в дискуссии и делиться опытом работы с инцидентами. 
Олег Ермаков
Модератор
Руководитель продуктовой бекенд-разработки в Такси
14:00
Сбор гостей, обед, нетворкинг
14:30
Сложность метастабильных состояний отказа на примере Такси
Расскажу про особый класс отказов в распределённых системах, известный в англоязычных источниках как metastable failures. Покажу, как система может войти в такое состояние и почему не сможет выйти из него самостоятельно и как мы справляемся с подобными отказами.
Алексей Быков
Старший разработчик в команде
Go Product Platform,
координирую инциденты Такси
15:00
Укрощение строптивых
баз данных
Поделимся сложностями работы с БД на примере нескольких проектов, связанных темой надёжности. Будут реальные кейсы и блоки о теории вероятностей и теории ограничений под соусом Redis и MongoDB. Всё строго на практических примерах.
Павел Назаров
Руководитель группы Pro Core,
инцидентолог Такси
15:30
Перерыв, онлайн-интерактив
16:00
Сломай меня полностью: Chaos Engineering
Что такое Chaos и как мы его используем в Такси. Покажем на тестовом стенде и внутри приложения Яндекс Такси.
Максим Ивашковский
Разрушитель инфры в Такси
Андрей Матвеев
Разрушитель инфры в Такси
16:30
Повышение стабильности legacy продукта в условиях роста нагрузки
Малый бизнес работает с небольшой командой разработчиков, но когда он покупается крупным инвестором, нагрузка возрастает, а технический долг может вызывать даунтаймы. В такой ситуации важно решать не только технические проблемы, но и наращивать функциональность. Я поделюсь опытом решения подобных проблем.
Иван Ремень
ИТ-лидер кластера, SberAds
17:00
Afterparty 

Москва, офис Яндекса, зал «Экстрополис»
ул. Льва Толстого, д. 16

Парк культуры

Фрунзенская

Куда
поедем?

Wed Sep 06 2023 14:26:05 GMT+0300 (Moscow Standard Time)