Google представила функцию создания реалистичных цифровых аватаров в приложении Gemini
Калькулятор калорий Рассчитай свое питание
Навигация по сайту

Google представила функцию создания реалистичных цифровых аватаров в приложении Gemini

Компания Google выпустила обновление для своего мобильного приложения Gemini, которое позволяет пользователям создавать персонализированные видеоаватары. Новая технология, работающая на базе видеомодели Omni, способна генерировать цифровых двойников реальных людей и помещать их в любые виртуальные декорации. Функция доступна подписчикам платного тарифного плана AI Pro, стоимость которого составляет около 20 долларов в месяц.

Процесс создания цифрового двойника

Для генерации аватара пользователю требуется пройти процедуру регистрации внешности, которая занимает около пяти минут. Процесс включает в себя несколько этапов:

  • Запись видео лица при хорошем освещении;
  • Чтение вслух последовательности цифр для синхронизации голоса и мимики;
  • Повороты головы в разные стороны для фиксации анатомических особенностей.

В обзорах отмечается, что система детально копирует внешность, вплоть до специфических особенностей строения лица и движений губ. Однако эксперты рекомендуют заранее продумать выбор одежды, так как нейросеть часто переносит текущий образ пользователя в сгенерированные ролики.

Возможности и ограничения модели Omni

В ходе тестирования нейросеть создавала десятисекундные клипы по текстовым запросам. Например, ИИ успешно сгенерировал видео, на котором цифровой клон поет песню в парке Долорес в Сан-Франциско, и ролик с серфингом под мостом Золотые Ворота. Примечательно, что алгоритмы Google точно воспроизводят реальные локации: на заднем фоне можно узнать характерные улицы и даже конкретные здания, такие как небоскреб Salesforce Tower.

Несмотря на фотореалистичность, технология пока не лишена артефактов. В материалах тестирования упоминаются следующие недочеты:

  • Неестественное отображение зубов при крупном плане;
  • Ошибки в подборе гардероба (например, появление персонажа на серфборде в джинсовой одежде);
  • Внезапное появление случайных предметов в кадре;
  • Периодические заминки в движениях и речи.

Безопасность и этические аспекты

На фоне роста числа несанкционированных дипфейков Google ввела строгие ограничения. В отличие от некоторых конкурентов, компания разрешает создавать аватары только совершеннолетним пользователям и исключительно на основе их собственной внешности. Использование образов других людей заблокировано на программном уровне.

По словам руководителя группы продуктов в Google DeepMind Николь Бричтовой, команда стремится найти баланс между предотвращением потенциального вреда и сохранением творческой свободы пользователей. В настоящий момент использование функции ограничено лимитами, которые обновляются каждые пять часов.

Специалисты подчеркивают, что созданные копии выглядят пугающе реалистично. Цифровой двойник воспринимается не как улучшенная версия человека, а как его точная копия, готовая выполнять любые действия в виртуальном пространстве по команде оператора.

Поделитесь с друзьями

Комментарии закрыты

Наверх