Томита-парсер позволяет создавать контекстно-свободные грамматики для получения структурированной информации из текста на естественном языке. Извлечение фактов происходит при помощи этих грамматик и словарей ключевых слов. Томита-парсер используется при подготовке данных для различных сервисов Яндекса – например, Яндекс.Новости или Яндекс.Работа. С 15 декабря 2012 года Томита-парсер доступен вне Яндекса для всех желающих.
На мастер-классе мы рассказали, что такое контекстно-свободные грамматики, научили писать грамматики для обработки текста на естественном языке, извлекать факты и познакомили с мощным лингвистическим инструментом.