Google представила функцию создания реалистичных цифровых аватаров в приложении Gemini
Компания Google выпустила обновление для своего мобильного приложения Gemini, которое позволяет пользователям создавать персонализированные видеоаватары. Новая технология, работающая на базе видеомодели Omni, способна генерировать цифровых двойников реальных людей и помещать их в любые виртуальные декорации. Функция доступна подписчикам платного тарифного плана AI Pro, стоимость которого составляет около 20 долларов в месяц.
Процесс создания цифрового двойника
Для генерации аватара пользователю требуется пройти процедуру регистрации внешности, которая занимает около пяти минут. Процесс включает в себя несколько этапов:
- Запись видео лица при хорошем освещении;
- Чтение вслух последовательности цифр для синхронизации голоса и мимики;
- Повороты головы в разные стороны для фиксации анатомических особенностей.
В обзорах отмечается, что система детально копирует внешность, вплоть до специфических особенностей строения лица и движений губ. Однако эксперты рекомендуют заранее продумать выбор одежды, так как нейросеть часто переносит текущий образ пользователя в сгенерированные ролики.
Возможности и ограничения модели Omni
В ходе тестирования нейросеть создавала десятисекундные клипы по текстовым запросам. Например, ИИ успешно сгенерировал видео, на котором цифровой клон поет песню в парке Долорес в Сан-Франциско, и ролик с серфингом под мостом Золотые Ворота. Примечательно, что алгоритмы Google точно воспроизводят реальные локации: на заднем фоне можно узнать характерные улицы и даже конкретные здания, такие как небоскреб Salesforce Tower.
Несмотря на фотореалистичность, технология пока не лишена артефактов. В материалах тестирования упоминаются следующие недочеты:
- Неестественное отображение зубов при крупном плане;
- Ошибки в подборе гардероба (например, появление персонажа на серфборде в джинсовой одежде);
- Внезапное появление случайных предметов в кадре;
- Периодические заминки в движениях и речи.
Безопасность и этические аспекты
На фоне роста числа несанкционированных дипфейков Google ввела строгие ограничения. В отличие от некоторых конкурентов, компания разрешает создавать аватары только совершеннолетним пользователям и исключительно на основе их собственной внешности. Использование образов других людей заблокировано на программном уровне.
По словам руководителя группы продуктов в Google DeepMind Николь Бричтовой, команда стремится найти баланс между предотвращением потенциального вреда и сохранением творческой свободы пользователей. В настоящий момент использование функции ограничено лимитами, которые обновляются каждые пять часов.
Специалисты подчеркивают, что созданные копии выглядят пугающе реалистично. Цифровой двойник воспринимается не как улучшенная версия человека, а как его точная копия, готовая выполнять любые действия в виртуальном пространстве по команде оператора.








Комментарии закрыты