Последний трюк DALL-E: расширение границ картин

Open AI вводит новую функцию в свой генератор преобразования текста в изображение. Вот как это работает.

Отредактировано 2023-25-06
Девушка с жемчужной сережкой на фоне заполненном краскойПример художественного произведения с фоном, заполненным краской.

Open AI, разработчики ИИ-генератора текста к изображению DALL-E 2, только что объявили о новой функции для приложения под названием "outpainting". Она позволяет пользователям дополнять существующие изображения и произведения искусства контентом, сгенерированным ИИ. Это довольно интересно и значительно расширяет возможности инструмента.

DALL-E 2 - один из самых популярных генераторов текста в изображение, доступных в настоящее время. С более чем миллионом пользователей неудивительно, что контент, созданный с его помощью, можно встретить повсюду. (Многие другие генераторы текста в изображение либо находятся в закрытом бета-тестировании, как Stable Diffusion, либо недоступны для общественности, как Imagen от Google, либо имеют гораздо более ограниченный охват, как Craiyon).

DALL-E 2 берет текстовую подсказку, например, "астронавт верхом на лошади в стиле Энди Уорхола", и генерирует девять изображений размером 1024 пикселя на 1024 пикселя, которые иллюстрируют ее. При этом используется процесс, называемый "диффузией", когда все начинается со случайного шума, а затем он редактируется, чтобы максимально точно соответствовать основным характеристикам подсказки.

До сих пор пользователи были ограничены в размерах и соотношении сторон того, что они могли создать с помощью DALL-E 2. Программа искусственного интеллекта могла создавать только квадраты размером 1024 пикселя на 1024 пикселя - о большем размере или другой форме не могло быть и речи. Можно было использовать функцию под названием "инпайнтинг" для изменения деталей в существующих произведениях искусства, но чтобы создать полотно большего размера, нужно было вручную сшивать различные участки вместе с помощью приложения типа Photoshop. (Для различных соотношений сторон можно было обрезать изображение, но это снижало общее разрешение).

Теперь с outpainting единственным ограничением для пользователей, помимо фильтров контента, является количество имеющихся у них кредитов. (Каждый получает 50 бесплатных кредитов на генерацию в течение первого месяца и 15 кредитов на использование каждый последующий месяц. Блоки из 115 дополнительных кредитов можно приобрести за $15.) Генерация начального изображения занимает один кредит, как и каждый дополнительный нарисованный участок.

Outpainting работает как расширение к DALL-E 2. Пользователи выбирают квадратную область размером 1024 пикселя на 1024 пикселя, на которую они хотят расширить изображение, и могут указать любые дополнительные подсказки, которыми будет руководствоваться ИИ. Например, чтобы добавить больше фона к астронавту на лошади, можно изменить подсказку на "астронавт верхом на лошади на Луне со звездами на заднем плане в стиле Энди Уорхола".

Для каждого перекрашенного участка DALL-E 2 предложит пользователям четыре варианта на выбор. Если ни один из них не подходит для изображения, вы сможете заставить его попробовать еще раз.

Наиболее впечатляющим является то, что аутпейнтинг "учитывает существующие визуальные элементы изображения, включая тени, отражения и текстуры". Это означает, что любые добавленные детали "сохраняют контекст" изображения и могут действительно выглядеть как часть единого целого.

В анонсе фильма DALL-E 2, посвященного перекрашиванию, есть таймлапс, показывающий, как "Девушка с жемчужной сережкой" Иоганна Вермеера увеличивается примерно в 20 раз от своего первоначального размера. Вместо простого портрета на картине изображена молодая женщина, стоящая в захламленном доме. На это интересно смотреть, потому что, если не присматриваться слишком пристально, картина действительно выглядит как продолжение оригинала. Общий стиль и настроение точно переданы. Это почти как воображаемая съемка за кадром.

Если вы хотите попробовать аутпейнтинг, вам нужно записаться на DALL-E 2. Open AI в настоящее время ведет скользящий список ожидания. Если вы хотите записаться, вы можете сделать это здесь.