Original size 1140x1600

Обучение генеративной нейросети под эстетику «русской тоски»

PROTECT STATUS: not protected
31

Описание проекта

За основу проекта я решила взять не стиль конкретного художника, а некую эстетику, общую атмосферу изображений, которая мне сильно откликается. Я назвала ее эстетикой «Русской тоски». Изображениям подобного характера присущи такие черты как: темные и мрачные тона, изображение привычной нам обыденности. Иногда в таких изображениях встречаются нереалистичные гиперболизированные сюжеты, что только усиливает ощущение той самой «тоски» Это могут быть как картины каких-то художников, так и креативные фотографии.

big
Original size 1961x1143

Фотография сделанная мной, передающая, на мой взгляд, атмосферу и эстетику проекта

Я собрала около ста изображений в заданной стилистике и отформатировала их до одинакового размера (512×512) в Figma. Затем сохранила для дальнейшей загрузки в датасет

big
Original size 907x880

Изображения в Figma

Изображения для анализа

Изображения для анализа

Изображения для анализа

Процесс работы

После установки всех необходимых бибилиотек и подготовки рабочей среды необходимо загрузить изображения

Original size 953x465

Загрузка изображений

Original size 1720x534

Превью

Затем необходимо было задать определенное название моему стилю, по которому программа узнавала бы в какой стилистике нужно создавать изображения

Original size 1788x404

После чего нейросеть проанализировала все изображения из датасета и дала им описание

Original size 1489x426

Затем модель начала свое обучение, которое проходило около часа

Original size 1804x720

Обучение модели

По окончание обучения, я получила модель готовую к работе. Осталось лишь прописать промт для своих изображений и приступить к генерации

Original size 1308x576

Обученная модель

Далее в коде я добавляла к префиксу «photo collage in RUSSTOSKA style» дополнительный промт для создания конкретного изображения. Далее я представлю изображения которые у меня получились + их промт

Итоговые изображения

Original size 1024x1024

«photo collage in RUSSTOSKA style, a residential area of Moscow, with a large skeleton with glowing eyes in the background»

Original size 1024x1024

«photo collage in RUSSTOSKA style, A woman in a red Russian folk costume sits on a tree in cloudy weather»

Original size 1024x1024

«photo collage in RUSSTOSKA style, an empty field, in the middle stands a man in a gas mask and holding flowers in his hands»

Original size 1024x1024

«photo collage in RUSSTOSKA style, a residential area of the city, against the background of a metallurgical plant, the sky is bright pink sunset, a Moskvich car is driving along the road»

Original size 1024x1024

«photo collage in RUSSTOSKA style, Three boys are standing in an adidas tracksuit in the courtyard.»

Итоги и выводы

По итогу работы я получила серию достаточно качественных изображений, которые вполне соответствуют прописанному промту, и что не менее важно, соответствуют заданному стилю. Конечно, нельзя не заметить, что нейросеть плохо справлялась с мелкими деталями (в основном с лицами) Однако, я предполагаю, что если в обучении модели поставить большее количество шагов и заложить больше времени, эту проблему можно решить.

Какие я выводы сделала для себя? Я думаю, что данная модель может быть очень полезна мне как художнику. Я могу задавать параметры стилистики для модели и генерировать идеи изображений, которые в дальнейшем смогу доработать. Я бы это назвала усовершенствованным способом поиска референсов и вдохновения.

Обучение генеративной нейросети под эстетику «русской тоски»
31
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more