Google объявляет о разработке Lumiere, генератора текста в видео

Команда исследователей искусственного интеллекта из Google Research разработала генератор текста в видео нового поколения на основе искусственного интеллекта под названием Lumiere. Группа опубликовала документ, описывающий свои усилия по созданию сервера препринтов arXiv. За последние несколько лет приложения искусственного интеллекта перешли из исследовательских лабораторий в сообщество пользователей в целом: например, LLM, такие как ChatGPT, были интегрированы с браузерами, что позволяет пользователям генерировать текст беспрецедентными способами. Совсем недавно генераторы текста в изображение позволили пользователям создавать сюрреалистические изображения. А генераторы текста в видео позволили пользователям создавать короткие видеоклипы, используя всего несколько слов. В этом новом проекте команда Google подняла эту последнюю категорию на новую высоту, анонсировав генератор текста в видео под названием Lumiere . Lumiere, названный, вероятно, в честь братьев Люмьер, которые стали пионерами первой фототехники, позволяет пользователям ввести простое предложение, например «два енота вместе читают книги», и получить полностью готовое видео, показывающее, как два енота делают именно это, — и делает это в потрясающе высокое разрешение. Новый генератор представляет собой следующий шаг в развитии генераторов преобразования текста в видео, обеспечивая гораздо более привлекательные результаты. Google описывает технологию, лежащую в основе нового генератора, как «революционную архитектуру пространства-времени U-Net». Он был разработан для создания анимированного видео за один проход модели. Демонстрационное видео показывает, что Google добавил дополнительные функции, такие как разрешение пользователям редактировать существующее видео, выделив его часть и набрав инструкции, такие как «изменить цвет платья на красный». Генератор также выдает различные типы результатов, например стилизацию, при которой создается стиль объекта, а не его полноцветное представление. Он также допускает подстили, например ссылки на различные стили. Он также занимается кинематографией, в которой пользователь может выделить часть или все неподвижное изображение и анимировать его. В своем объявлении Google не уточнил, планируют ли они выпустить или распространить Люмьера среди публики, вероятно, из-за очевидных юридических последствий, которые могут возникнуть из-за потенциального создания видео, нарушающих законы об авторском праве....

Google объявляет о разработке Lumiere, генератора текста в видео

Сообщает android-robot.com

 

Опубликовано: 01:09, 29.01.2024

 

Новость из рубрики:

 

Поделиться новостью: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

 
 

Мощь Технологии в Ваших Руках: Услуги по Разработке Программного Обеспечения 11:54, 31 Янв Мощь Технологии в Ваших Руках: Услуги по Разработке Программного Обеспечения В современном мире, где технологии становятся движущей силой для различных сфер бизнеса и жизни, разработка программного обеспечения становится необходимостью, открывая новые горизонты для предприятий и индивидуальных пользователей. Услуги по разраб...

Компания Google запустила Android 15 DP1 07:18, 20 Фев Компания Google запустила Android 15 DP1 Компания Google выпустила Android 15 Developer Preview 1,предназначенную для разработчиков. Бета-версия, как известно, включает в себя множество улучшений для повышения качества связи между программным и аппаратным обеспечением, а еще несколько опци...

Google представила семейство мультимодальных моделей Gemini 11:18, 07 Дек Google представила семейство мультимодальных моделей Gemini Компания Google представила семейство мультимодальных нейросетевых моделей Gemini, которые способны оперировать, обобщать, и комбинировать информацию различного типа, включая текст изображения, аудио, видео, а также программный код. В отличие от дру...

Google выпустила Gemini  полную замену Bard и Ассистента 00:09, 10 Фев Google выпустила Gemini – полную замену Bard и «Ассистента» Google объявила о ребрендинге Bard, своего чат-бота и помощника с искусственным интеллектом, включая новое приложение и варианты подписки. Bard теперь называется Gemini – у приложения то же имя, что и у набора моделей ИИ, на которых основан чат-бот....

Google Tensor G3 стал первым мобильным процессором с поддержкой кодирования 4K 60FPS AV1 02:27, 25 Фев Google Tensor G3 стал первым мобильным процессором с поддержкой кодирования 4K 60FPS AV1 Новый чип Tensor G3 используется в смартфонах серии Pixel 8. Недавно выяснилось, что процессор оснащен скрытой функцией — встроенной поддержкой кодека AV1. Это делает Tensor G3 первым процессором для смартфонов, способным обрабатывать видео AV...

Бесплатный курс по модели Po3 из 5 видео уроков 16:09, 27 Фев Бесплатный курс по модели Po3 из 5 видео уроков Сегодня представляю вам Бесплатный курс по модели Po3 из 5 видео уроков. Её еще называют: Power of Three / Power of 3 / модель AMD / pattern AMD. Уже давно решил, что начну публиковать краткие обзоры по модели Po3 в телеграмм канале — https://...

Лева Би-2 опубликовал фото и видео из миграционной тюрьмы в Таиланде 17:00, 10 Фев Лева Би-2 опубликовал фото и видео из миграционной тюрьмы в Таиланде Лидер группы «Би-2» Егор Бортник (Лева Би-2) опубликовал в своем инстаграме фото и видео из миграционной тюрьмы в Таиланде, где музыканты провели несколько дней после задержания 24 января. View this post on Instagram A post shared by Лева Би-2 (@lev...

Опрос: две трети россиян ест во время просмотра видео на YouTube 12:00, 01 Дек Опрос: две трети россиян ест во время просмотра видео на YouTube Аналитики из «Русопрос» и «VK Видео» узнали, чем занимаются россияне во время просмотра видео на YouTubeРоссияне сегодня весьма творчески используют время, проводимое перед экранами. Почти две трети из них приятно удивили, признавшись, что совмещают...

12:38, 30 Июн Видеомонтаж – почему выгоднее заказать монтаж видео профессионалам Видеомонтаж является важной частью процесса создания качественного видеоконтента. Это творческий процесс, требующий определенных навыков и опыта. В данной статье мы рассмотрим преимущества заказа монтажа видео профессионалам и почему это выгоднее, ч...

07:00, 14 Ноя Al Rabiaa опубликовал видео с похищенной в Ираке гражданкой России и Израиля Цурковой Иракский телеканал Al Rabiaa опубликовал видеозапись, на которой похищенная в Ираке гражданка России и Израиля Елизавета Цуркова заявила о «службе в «Моссаде» и ЦРУ». На видео Цуркова впервые показана после похищения. На опубликованном Al Rabiaa вид...

03:36, 05 Дек Отправить фото и видео в Ватсапе на Айфоне теперь можно в исходном качестве. Скорее обновляемся Долгие годы пользователи Ватсапа жаловались на то, что мессенджер очень сильно сжимает фотографии и видео при пересылке, и из-за этого страдает качество. В итоге некоторые снимки портились настолько сильно, что использовать их после такой процедуры ...