Original size 1140x1600

ИИероним Босх

PROTECT STATUS: not protected
4

ИДЕЯ ПРОЕКТА

Я увлёкся картинами Иеронима Босха — его странными мирами, полными чудовищ, аллегорий и фантастических пейзажей. Мне захотелось попробовать создать что-то похожее, но с помощью современных технологий. Поэтому я решил обучить генеративную нейросеть на его работах и заставить её придумать свою версию «босховского» мира.

Цель моего проекта — обучить модель генерировать изображения, в которых используются знакомые архетипы персонажей Босха, и что получится, если дать машине «вообразить» рыцарей, рыбаков, черепах и т. д.

ИСХОДНЫЕ ИЗОБРАЖЕНИЯ

big
Original size 0x0

Пример нескольких изображений из датасета

Для генерации изображений было выбрано дополучить модель Stable Diffusion. Для обучения были использованы 20 картин Иеронима Босха в формате 1:1.

ГЕНЕРАЦИИ ИЗОБРАЖЕНИЙ

Первые пять изображений генерировались с сюжетами, близкими к работам Босха: средневековые пейзажи, аллегорические сцены, фантастические существа и мрачная атмосфера, характерная для его эпохи.

big
Original size 1920x1080

Promt: «Knight fight with snail, in the style of Hieronymus Bosch»

«A hermit praying in a cave while shadowy beasts whisper sins into his ear—moonlight through cracks, grotesque hybrid creatures made of roots and bones, rich detail, muted earth tones, Bosch-inspired.»

Original size 1920x1080

«Medieval carnival at dusk: jesters with animal heads lead a procession of sinners toward a gaping mouth of hell, wagons piled with stolen relics—crowded, chaotic, moral satire in Flemish oil style.»

Original size 1920x1080

«A knight lost in a forest of weeping willows, each branch ending in a grasping hand; his armor sprouts vines, his horse has owl eyes—allegory of pride and doubt, dreamlike medieval mood, Bosch visual language.»

Original size 1920x1080

«A scholar in a candlelit study opens a book that sprouts eyes and wings; mice scribble on scrolls, owls wear spectacles—symbolic chaos, rich textures, 15th-century Flemish surrealism in Bosch’s spirit.»

Original size 1920x1080

«turtle in the sea, broken crowns litter the ground, surreal medieval chaos in the style of Hieronymus Bosch, oil on oak.»

Original size 1920x1080

«Sailor asleep in a boat drifting through clouds shaped like cities; fish with compasses guide him past islands made of clocks—ethereal yet detailed, symbolic journey, Bosch-like allegory.»

Original size 1920x1080

Вывод

Итоговая серия изображений, сгенерированная нейросетью, обученной на картинах Босха, удачно передаёт его характерные черты: насыщенную, приглушённую цветовую палитру, плотную композицию и отсутствие перспективы. Сохраняется атмосфера фантастической, морально насыщенной вселенной, свойственная оригиналу. Однако есть и недостатки: изображения часто получаются размытыми, мелкие детали — лица, символы, надписи — теряются или искажаются.

Принцип работы кода

Для начала устанавливаем все необходимые библиотеки и создаем датасет фотографий.

Original size 2900x1156

переносим в папку и проверяем их наличие

Original size 2932x1008

Создание metadata.jsonl с префиксом стиля

Original size 2928x1276

На этом этапе мы вводим заранее созданный токен и запускаем тренировку по нашим параметрам

Original size 2938x1156

Далее сохраняем модель в Hub для использования не только с локальными файлами

Original size 2984x1292

И на последнем этапе генерируем изображение, Вуаля!

Original size 2982x1056

Описание применения генеративной модели

Я использовал QWEN coder для доработки и исправления багов в коде

ИИероним Босх
4
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more