Yargy-парсер. Извлечение структурированной информации из текстов на русском языке

На примере конкретной задачи будет показано, как пользоваться Yargy-парсером для извлечения структурированной информации из русскоязычных текстов. Мы возьмём в интернете сырые тексты, сделаем предобработку, составим и отладим словари и грамматики для Yargy-парсера.

Мастер-класс рассчитан на тех, кто уже немного разбирается в вопросе.

Требования к участникам: умение программировать на Python; желателен опыт использования Jupyter Notebook и библиотек для обработки русскоязычных текстов (pymorphy2, Томита-парсер). А также необходимо установить программы и библиотеки:

Скачать и выполнить все ячейки.

Перед мастер-классом будет полезно ознакомиться с материалами по Yargy-парсеру: материал на Хабре о проекте «Наташа», в котором используется Yargy; репозиторий с примерами.

Продолжительность занятия 2 часа. Будет запись.