ИИ DeepMind от Google может "трансфреймировать" одно изображение в видеоролик

Для создания движущегося изображения этому искусственному интеллекту достаточно одного неподвижного движения.

Отредактировано 2023-25-06
Скриншот примеров изображений DeepMind Transframer от GoogleTransframer может представить себе окружающую обстановку по одному изображению.

Ранее на этой неделе команда, стоящая за продвинутой нейронной сетью DeepMind от Google, представила новую способность под названием Transframer, которая позволяет ИИ генерировать 30-секундные видеоролики из одного изображения. На первый взгляд, это небольшой ловкий трюк, но его последствия гораздо серьезнее, чем просто интересный файл .GIF.

"Transframer занимает передовые позиции в различных тестах по генерации видео и... может генерировать связные 30-секундные видеоролики из одного изображения без какой-либо явной геометрической информации", - объясняет исследовательская группа DeepMind. По сути, все, что нужно Transframer, - это одна фотография, которую он затем анализирует и определяет обрамление снимка, т.е. подсказки вроде стола, коридора или улицы. После прогнозирования окружения объекта с помощью этих "контекстных изображений", он представляет (и впоследствии показывает), как будет выглядеть объект с различных ракурсов. Команда DeepMind иллюстрирует эту процедуру с помощью таких объектов, как стул, ноутбук, стакан воды и даже учебник по GRE.

Фотография ИИShapeNet (1 контекстное представление, 128×128). DeepMind.

"Учитывая коллекцию контекстных изображений с соответствующими аннотациями (временные метки, точки обзора камеры и т.д.) и аннотацию запроса, задача состоит в том, чтобы предсказать распределение вероятности по целевому изображению", - продолжает команда. "Эта система поддерживает ряд задач визуального прогнозирования, включая моделирование видео, синтез новых видов и многозадачное зрение".

Как отмечает Futurism, Transframer может однажды предложить совершенно новый путь в индустрии видеоигр, используя машинное обучение для создания цифрового окружения, а не полагаясь на более трудоемкие методы рендеринга. По мере развития технологии, обучение DeepMind's Transframer может открыть совершенно новые пути для искусства, научного анализа и дальнейшего развития ИИ. Кроме того, один из пользователей Твиттера представил себе, как они накладывают свои изображения из OpenAI "DALL-E" поверх программы Transframer, чтобы создать стекированные творения ИИ - как будто эти изображения не могут быть более сюрреалистичными.