Original size 1140x1600

Portraits of ARCANE

PROTECT STATUS: not protected
30

ИДЕЯ

В 2024 году завершился сериал, ставший всемирно популярным и глубоко обожаемым мировым сообществом. ARCANE полюбился зрителям трагичной человечной историей, захватывающими саундтреками, потрясающим уровнем проработки — любовь создателей пронизывает каждый кадр и сквозит через экран.

Однако есть деталь, которая бросается в глаза еще до сюжетных поворотов — уникальный визуальный стиль этого мира. Создатели Riot в сотрудничестве со студией Fortiche изобрели что-то совершенно новое в своей сфере, совместив всем привычное 3D с рисоваными текстурами: штришки, мазки, переходы красок — все это видно как на пейзажах, объектах, так и на персонажах.

Идея проекта — попытка воспроизвести уникальный визуальный стиль анимационного сериала с помощью инструментов генеративного ИИ. Проект исследует, насколько точно и выразительно можно передать характерные черты оригинальной стилистики через дообучение модели LoRA на кастомном датасете. Дополнительно ставится задача сравнить полученные результаты с эстетикой первоисточника и оценить потенциал нейросетей в создании авторских визуальных решений.

ДАТАСЕТ

Датасет/Главные героини

big
Original size 918x212

Загрузка датасета

Для обучения модели было отобрано 81 оригинальное изображение, каждое из которых представляет персонажа крупным планом. Такой подход позволяет максимально точно передать особенности черт лица, текстуры и характерную стилистику прорисовки. В выборку вошли как ключевые герои сериала, так и второстепенные персонажи, появляющиеся лишь в отдельных сценах, — это обеспечило разнообразие данных.

Original size 2048x1536

Датасет/Примеры персонажей

Все изображения были сначала обрезаны вручную (чтобы в кадре было лицо), а затем с помощью кода кадрированы к единому размеру 512 на 512 пикселей.

ПРОЦЕСС ОБУЧЕНИЯ

Original size 1920x291
Original size 917x164

Создание текстовых описаний изображений

После загрузки изображений следовал этап создания автоматических промптов, где под префиксом «character portrait in ARCANE style» к каждому персонажу создавалось краткое текстовое описание.

Original size 1920x288
Original size 1212x435

Код для обучения

Подключение Hugging Face и, наконец, модель готова учиться у студии Fortiche их тонкому искусству создания неповторимых персонажей!

ГЕНЕРАЦИЯ ИЗОБРАЖЕНИЙ

Original size 1319x233

Подготовка к генерации

После подключения всех необходимых библиотек наконец можно приступить к созданию персонажей!

Original size 1588x524

Первые результаты генераций

По какой-то причине первые генерации случились в ярко-розовых оттенках, несмотря на то, что в датасете не было преобладания такого цвета.

Однако сам результат оказался более чем успешным! Сгенерированные персонажи сохранили узнаваемые черты визуального стиля ARCANE: hand painted текстуры, акварельные градиенты света и тени, выразительная геометрия лиц, подчёркнутая резкими мазками. Образы получились не только атмосферными, но и стилистически цельными — каждый из них словно мог бы органично вписаться в мир сериала.

0

Примеры промптов

Original size 1588x525

Генерация персонажей

Original size 1588x527

Генерация персонажей

Далее было принято решение поэкспериментировать с цветовой гаммой генерируемых изображений. Для этого в текстовые промпты начали добавляться уточнения вроде «natural colors» и «cinematic lighting». Это позволило добиться более сбалансированной палитры: изображения стали выглядеть натуральнее и глубже. Со временем модель начала выдавать удачные цветовые решения даже без подобных уточнений, что говорит о её адаптации к заданному стилю.

Original size 1588x1057

Генерации персонажей по людям

Конечно, как не попробовать сгенерировать себя и своих близких! Сложность заключалась в том, чтобы попасть в сходство по текстовому запросу. Тем не менее, благодаря настройке и корректировке промптов, удалось повторить некоторые ключевые особенности внешности, что добавило интересный и уникальный элемент в процесс генерации.

Original size 1189x74

Промпт для генерации обычного парня

Original size 1588x523

Генерация простого персонажа

Лучше всего модель справилась с самым простым персонажем — обычным парнем в черной водолазке без фэнтезийных элементов. Но и с более причудливыми образами модель справлялась достаточно удачно и интересно!

ИЗМЕНЕНИЕ ВЕСА МОДЕЛИ

Original size 1135x198

Изменение веса в коде

Эксперименты с весом модели от 0.5 до 0.9 и теми же промптами, что уже были использованы, оказались менее удачными.

Original size 1588x527

Генерация с разным весом модела LoRA

Несмотря на то, что детализация и разнообразие цветов увеличилось, особенность стилистики ARCANE гораздо менее заметна, поэтому было принято решение вернуться к изначальному весу.

СРАВНЕНИЕ И ИТОГИ

Original size 1920x288

Итоговые результаты от обучения модели на стилистике сериала ARCANE оказались удачными и превзошли ожидания. Особенности стиля были сохранены, а каждый уникальный персонаж мог бы отлично вписаться в мир Пилтовера и Зауна. Модель смогла сохранить hand painted текстуры, штришки, изломы геометрии в чертах лиц. Так, например, крайне похожими на особенности персонажей сериала вышли сгенирированные носы (четкие ровные линии), губы (асимметрия в левой и правой стороне), глаза (ярко выделенные тени и блики под нижним веком).

Original size 2027x1516

Итоговые изображения

Во многих итоговых изображениях можно легко узнать характерные черты персонажей, использованных в датасете. Для обучения было выбрано всего 81 изображение и, вероятно, с увеличением количества оригиналов, возросла бы и оригинальность сгенерированных персонажей. Тем не менее, даже при таком количестве результат получился впечатляющим и интересным, с ярко выраженными индивидуальными особенностями.

Итогом проекта можно назвать вполне успешное подражание оригинальному стилю нашумевшего сериала — модель LoRA отлично справилась с задачей, что говорит о высоких возможностях в обучении нейросетей применительно к искусству создания концептов персонажей и арта в целом. Конечно, это не значит, что студия-создатель перестанет быть актуальной, однако настороженность в этом вопросе стоит сменить интересом: такой инструмент может стать отличным помощником в процессе разработки, позволяя создавать новые шедевры с ещё большим творческим потенциалом!

Original size 1920x291

ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ/НОУТБУК С КОДОМ

В работе были использованы: Stable Diffusion XL (SDXL) — генерация изображения по текстовому запросу (https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0) BLIP-1 — описание изображений датасета (https://huggingface.co/Salesforce/blip-image-captioning-base) Chat GPT-4 Turbo — генерация идея и кода (https://openai.com/index/gpt-4/) UpScale 2.11.0 — улучшение качества изображений (https://upscayl.org/)

We use cookies to improve the operation of the HSE website and to enhance its usability. More detailed information on the use of cookies can be fou...
Show more