Нелепость генератора изображений Dall-E Mini может быть его главной привлекательностью

Система с искусственным интеллектом никого не обманывает. Те, кто обманывает, представляют собой технику, о которой следует беспокоиться.

Отредактировано 2023-25-06
На сетке из 12 изображений изображен персонаж Звездных войн Чубакка выполняющий офисные заданияЧубакка за работой.

Сальвадор Дали, испанский художник, родившийся в 1904 году, известен своими сюрреалистическими картинами: тающие часы, слоны с тонкими как у насекомого ногами, искаженные человеческие лица и конечности. Dall-E (произносится как Дали) Mini, новая программа искусственного интеллекта, дебютировавшая в начале июня, быстро стала еще одним источником сюрреалистического искусства, создавая по запросам пользователей такие изображения, как бутылка ранчо, дающая показания в суде, инструкции wikihow о том, как съесть молоток, и медсестра из фильма "Сайлент Хилл", поедающая пиццу.

Изображения получаются забавными, и программа набирает популярность в Интернете благодаря своему забавному искусству. Пользователи могут набрать фразу - любую фразу - и затем увидеть, как сгенерированное ИИ изображение, которое они написали, вспыхивает. Dall-E Mini - это проект с открытым исходным кодом, основанный на оригинальной технологии Dall-E от OpenAI, исследовательской лаборатории ИИ, которая генерирует реалистичные изображения и искусство из текста. Большая часть произведений искусства, созданных Dall-E Mini, была воспринята со смехом. Но по мере совершенствования и широкого применения подобных технологий возрастает риск злоупотреблений, а это не повод для смеха.

За Dall-E Mini последовал Dall-E 2, который OpenAI официально выпустила в апреле 2022 года. Dall-E 2 работает путем создания ассоциаций между миллиардами изображений в Интернете и их описаниями. Dall-E Mini работает аналогичным образом, но был создан в гораздо меньших масштабах. Проект, возглавляемый Борисом Дайма, использовал около 15 миллионов изображений из трех наборов данных для создания своей модели и примерно в 27 раз меньше, чем оригинальная программа OpenAI Dall-E. Dall-E Mini размещается на Hugging Face, компании, которая предоставляет модели и инструменты машинного обучения и говорит, что их миссия - "демократизация хорошего машинного обучения".

Пользователи могут создавать практически любые изображения, хотя результаты получаются скорее комичными, чем точными. Шуман Госемаджумдер, бывший руководитель отдела искусственного интеллекта в компании F5, специализирующейся на технологической безопасности, говорит, что часть комичности и привлекательности заключается в неожиданных несовершенствах. "Причина, по которой это весело, отчасти в том, что изображения не идеальны", - говорит Госемаджумдер. "Есть импрессионистические образы, есть кошмарные образы, есть безумные образы. На все это интересно смотреть, и этим интересно делиться".

Гозмаджумдер говорит, что он видит, как подобная технология проходит несколько различных этапов под пристальным вниманием общественности. Сначала людям интересно, какими возможностями может обладать подобная программа. Люди удивляются и учатся, изучая сложность того, что они могут создать - как это уже было показано в Интернете. Затем, по его словам, вторая фаза - это переход от чистого развлечения к пониманию людьми ценности того, что они могут произвести.

"Вы можете создавать элементарные иллюстрации для конкретных целей и лучше понимать текущее состояние технологии, чтобы начать строить планы по использованию более продвинутых версий этой технологии в будущем", - говорит Госемаджумдер.

Забегая вперед, он представляет, что третьим этапом восприятия этих технологий будет то, как они заложат основу для еще более продвинутых инноваций в будущем, таких как высококачественное синтетическое видео.

Но по мере совершенствования этих инноваций возрастает риск появления опасных и вводящих в заблуждение изображений.

Сейчас, говорит Госемаджумдер, изображения Dall-E Mini достаточно "низкокачественные", чтобы пользователи обычно знали, что они сгенерированы ИИ и не обязательно являются реальной фотографией, сделанной, скажем, бутылкой ранчо, дающей показания в суде. Но когда станет сложнее определить, было ли что-то сделано на платформе ИИ, а не снято в нецифровом мире, людям будет проще создавать изображения, которые будут использоваться в кампаниях по дезинформации в Интернете.

"Это будет не просто импрессионистская версия Тупака или Дарта Вейдера, которую могут создать люди", - говорит Госемаджумдер. "Вместо этого это будет что-то вроде: "Вау, это похоже на реального человека, который что-то делает". Я могу создать образ политика, который делает что-то, чего он никогда не делал, и в итоге создать целую сюжетную линию и использовать ее для распространения дезинформации".

На данный момент Dall-E 2 еще недоступен для общественности, пока разработчики OpenAI борются с потенциальными рисками злоупотреблений. (Dall-E Mini - это аналогичная, но публично выпускаемая версия с открытым исходным кодом.) Аналогично, Imagen, программа Google для преобразования текста в изображение, не предоставила доступ к своей платформе. В обоих случаях компании наняли исследователей и художников для тестирования программ и улучшения операционных и учебных данных, обеспечения безопасности и совершенствования искусства. Ограниченный выпуск перед общим релизом - это "общепринятый принцип программного обеспечения", говорит Госемаджумдер, который, по его мнению, будет становиться все более важным по мере усложнения технологий.

В конечном счете, одно из самых больших преимуществ технологий, подобных Dall-E Mini, заключается в том, что они позволят большему числу людей визуализировать вещи проще, чем сейчас, говорит Госемаджумдер. Он рассматривает это как демократизацию высококачественного контента.

"Это раскрывает творческий потенциал людей и позволяет им общаться более эффективно", - говорит Госемаджумдер. "Это может сделать людей гораздо более эффективными и результативными в создании иллюстраций и фотографий различных концепций, которые они хотят визуализировать".

Что касается Госемаджумдера, то его творение Dall-E Mini представляло собой серию изображений, изображающих, как Чубакка проводил бы свой день - если бы у него была офисная работа.