Пушкин в стиле Сарджента

Как нейросети (Gemini, Midjourney, Sora) помогают возрождать Золотой век

Историк Сергей Гаврилов

Недавно мы с провели серию экспериментов на стыке классической русской литературы и передовых технологий AI-визуализации. Нашей целью было не просто сгенерировать иллюстрации, а проверить, насколько современные нейросети способны работать с культурно-специфическим и историческим материалом.

Выбор инструментов и тонкая настройка

Первой задачей стало создание серии акварелей для иллюстрации пушкинского шутливого четверостишия «И останешься с вопросом». Сергей работал над статьей о сестрах Велио, которые в нем упоминаются:

И останешься с вопросом
На брегу замерзлых вод:
«Мамзель Шредер с красным носом
Милых Вельо не ведет?»

Мы протестировали несколько популярных инструментов:

Midjourney: Этот генератор, по нашему мнению, оказался одним из самых мощных. Однако для достижения желаемого стиля мне потребовалось как минимум десять попыток и сложная формулировка запроса, включающая референсные изображения (портрет Пушкина и отдельное изображение девушки). Получены изображения в стиле акварелей Джона Сингера Сарджента.

Gemini (Google’s AI): Мы применили Gemini для дополнительной обработки, в частности, для добавления акварели к изображению, изначально созданному в Midjourney.

В ходе работы стало ясно, что AI-генераторы «более ориентированы на Западный контент», что требует от оператора досконального понимания их «знаний» и «незнаний» для получения релевантных русских образов. Тем не менее, результатом стало создание потрясающих акварелей, которые, по оценке Сергея, оказались «потрясающими, живыми, яркими», и сайта, полностью собранного с помощью AI-визуалов.

Sora: При использовании идентичного запроса Sora выдала результат, который больше напоминал «детскую иллюстрацию». Несмотря на это, Сергей успешно использовал Sora для перевода пушкинских стихов в акварель.