Original size 1240x1750

Обучение генеративной нейросети под стиль Gacha Life

PROTECT STATUS: not protected
12

Концепция

Gacha Life — это компьютерная ролевая игра, в которой есть возможность создать своего персонажа и играть от его лица. У игры есть узнаваемая стилистика, которой я обучила нейросеть. Датасет состоял из 14 изображений. Он послужил основой для серии картинок с вариациями персонажей по запросам.

0

Примеры персонажей из игры, созданные игроками

Общий стиль — аниме и чиби персонажи, с разными атрибутами, такими как одежда, цвет глаз, цвет и форма волос. Каждую составляющую можно выбрать из списка и создать желаемый образ.

Процесс обучения

Для обучения нейросети я использовала Google Colab. Я ориентировалась на лекцию из курса и пошагово написала код.

Первым делом я загрузила датасет в Google Colab и установила необходимые библиотеки.

Original size 1983x1373
Original size 1983x948

После этого я посмотрела превью загруженных картинок.

Original size 1983x474

Я запустила BLIP чтобы он сгенерировал подписи к картинкам из датасета.

Original size 1983x1031

BLIP описал картинки и я добавила к ними «art in GACHA LIFE style» для дальнейшей работы.

Original size 1983x884
Original size 1983x1236
Original size 1983x1295

Дальше прошел главный процесс — обучение модели. Я воспользовалась токеном с HuggingFace, а после ждала 40 минут завершения выполнения кода.

Original size 1983x1601

После я успешно сгенерировала первое изображение, подтвердив работу модели.

Original size 1983x1194

Итоговые изображения

Я задавала нейросети различные промпты, чтобы автоматически создать задуманного персонажа. В целом, программа справлялась отлично, особенно учитывая, что датасет был небольшим.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, boy dragon»

Original size 1024x1024

Промпт: «art in GACHA LIFE style, angel and demon»

Original size 1024x1024

Промпт: «art in GACHA LIFE style, boy with cat ears, black clothes and chains»

Для разнообразия я попробовала дать нейросети имя уже существующего персонажа, чтобы проверить, что она будет делать, если не распознает запрос. Результат не похож на заданного персонажа, но искусственный интеллект не сломался и сгенерировал рандомного мальчика.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, Nagito Komaeda»

После неудачи я решила описать того же персонажа в промпте, чтобы посмотреть, сделает ли нейросеть что-то похожее на оригинал. Я сделала две генерации по одному промпту, результат очень отдалённо напоминает оригинал, что было ожидаемо. Также нейросеть почему-то добавила хвост.

0

Промпт: «art in GACHA LIFE style, boy with curly long white hair, green eyes, green coat, black pants and a smirk on his face»

После я снова описала уже существующего персонажа, на этот раз другого, чтобы проверить реакцию на более сложные запросы. Результат совсем не похож на оригинал.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, rockstar girl with pink blue white and black hair colour»

Далее я генерировала уже привычные промпты без экспериментов.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, angel dog boy»

Original size 1024x1024

Промпт: «art in GACHA LIFE style, demon cat girl»

Следующие два изображения показали, что нейросеть не может совмещать образы и менять цвет кожи на заданный.

Original size 1024x1024

Промпт: «art in GACHA LIFE style, demon and angel girl with halo, heterochromia and rainbow hair»

Original size 1024x1024

Промпт: «art in GACHA LIFE style, girl with blue skin and red hair»

Итог

Генеративная модель справилась с задачей и подстроилась под характерный стиль персонажей Gacha Life. Она не смогла генерировать сложные запросы, такие как изменение цвета кожи или персонаж по имени, но в остальном отражала заданные запросы. У ИИ получилось работать качественно даже с небольшим датасетом, так что программа настроена хорошо и при дополнении данных может развиться в лучшую версию себя.

Нейросеть также справилась с изображением двух персонажей на картинке, хотя в датасете таких примеров не было. В остальном она опиралась на стилистику и вариации оригинала.

Использованные генеративные нейросети

BLIP — https://huggingface.co/docs/transformers/model_doc/blip. Для генерации подписей к картинкам.

HuggingFace — https://huggingface.co. Для генерация токена для обучения модели, её загрузки на сайт.

Stable Diffusion — https://stability.ai/. Для обучения генеративной модели на датасете.

Обучение генеративной нейросети под стиль Gacha Life
12
We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more