
Описание проекта
За основу проекта я решила взять не стиль конкретного художника, а некую эстетику, общую атмосферу изображений, которая мне сильно откликается. Я назвала ее эстетикой «Русской тоски». Изображениям подобного характера присущи такие черты как: темные и мрачные тона, изображение привычной нам обыденности. Иногда в таких изображениях встречаются нереалистичные гиперболизированные сюжеты, что только усиливает ощущение той самой «тоски» Это могут быть как картины каких-то художников, так и креативные фотографии.

Фотография сделанная мной, передающая, на мой взгляд, атмосферу и эстетику проекта
Я собрала около ста изображений в заданной стилистике и отформатировала их до одинакового размера (512×512) в Figma. Затем сохранила для дальнейшей загрузки в датасет

Изображения в Figma


Изображения для анализа


Изображения для анализа


Изображения для анализа
Процесс работы
После установки всех необходимых бибилиотек и подготовки рабочей среды необходимо загрузить изображения
Загрузка изображений
Превью
Затем необходимо было задать определенное название моему стилю, по которому программа узнавала бы в какой стилистике нужно создавать изображения
После чего нейросеть проанализировала все изображения из датасета и дала им описание
Затем модель начала свое обучение, которое проходило около часа
Обучение модели
По окончание обучения, я получила модель готовую к работе. Осталось лишь прописать промт для своих изображений и приступить к генерации
Обученная модель
Далее в коде я добавляла к префиксу «photo collage in RUSSTOSKA style» дополнительный промт для создания конкретного изображения. Далее я представлю изображения которые у меня получились + их промт
Итоговые изображения
«photo collage in RUSSTOSKA style, a residential area of Moscow, with a large skeleton with glowing eyes in the background»
«photo collage in RUSSTOSKA style, A woman in a red Russian folk costume sits on a tree in cloudy weather»
«photo collage in RUSSTOSKA style, an empty field, in the middle stands a man in a gas mask and holding flowers in his hands»
«photo collage in RUSSTOSKA style, a residential area of the city, against the background of a metallurgical plant, the sky is bright pink sunset, a Moskvich car is driving along the road»
«photo collage in RUSSTOSKA style, Three boys are standing in an adidas tracksuit in the courtyard.»
Итоги и выводы
По итогу работы я получила серию достаточно качественных изображений, которые вполне соответствуют прописанному промту, и что не менее важно, соответствуют заданному стилю. Конечно, нельзя не заметить, что нейросеть плохо справлялась с мелкими деталями (в основном с лицами) Однако, я предполагаю, что если в обучении модели поставить большее количество шагов и заложить больше времени, эту проблему можно решить.
Какие я выводы сделала для себя? Я думаю, что данная модель может быть очень полезна мне как художнику. Я могу задавать параметры стилистики для модели и генерировать идеи изображений, которые в дальнейшем смогу доработать. Я бы это назвала усовершенствованным способом поиска референсов и вдохновения.