Поиск списков в неструктурированных данных

Как научить машину выделять полезную информацию на веб-странице? Как извлекать из неё структурированный данные? С какими трудностями можно столкнуться, пытаясь применить один подход к сайтам с разной вёрсткой? Помимо этих вопросов, докладчик затронет темы машинного обучения и алгоритмов обхода веба.