​Наука о данных в анализе современной культуры

Современной цифровой культуре присущи отчасти те же характеристики, которые определяют большие данные: объём, разнородность, скорость. Достаточно представить себе миллиарды постов, изображений и видео, которые ежедневно появляются в соцсетях. Новые произведения, которыми миллионы художников, музыкантов и творческих людей самого разного профиля делятся через Behance, Spotify и другие сайты. Рецензии на книги, выставки, фильмы, дискуссии на форумах, обновления статей Википедии… Такого доступа к культуре в реальном времени у исследователей не было никогда, но вместе с тем они получили новую задачу: что делать с этим огромным количеством культурных данных?

Подобно тому, как о больших данных говорили, что это массивы данных, которые слишком велики и сложны для обработки стандартными программами, можно сказать, что цифровая культура слишком обширна и сложна для стандартных методов гуманитарных наук. Как следствие, применение науки о данных — это не один из возможных подходов, а единственный.

Чтобы увидеть современную культуру во всём её масштабе, разнообразии и стремительности, нужны новые вычислительные и математические методы. При этом требуется вдумчивый и критический подход к популярные методы машинного обучения и статистики, а не простое воспроизведение коммерчески успешных методов.

В своей лекции я рассмотрю примеры проектов которые решают эту проблему. В их числе моя Лаборатория культурной аналитики, действующая с 2008 года. Я также расскажу о нашем новом проекте Elsewhere что мы делаем в нашей Лаборатории культурных трендов Тюменского государственного университета. Цель этого проекта — измерить и сравнить культурную активность в сотнях городов по всему миру в разное время начиная с 1990 года. Тюмень представляется логичной отправной точкой для исследования динамики мировой культуры не только в столицах, но и в небольших городах мира.