PUBLICIDADE
Inteligência Artificial

VLOGGER AI, do Google, cria avatares realistas a partir de uma foto e voz

Utilizando uma arquitetura de difusão avançada, que já é a base de modelos de geração de imagem, vídeo e 3D, o VLOGGER adiciona controles mais refinados para a criação do avatar.

PUBLICIDADE

Os pesquisadores do Google apresentaram um avanço tecnológico que promete transformar a forma como interagimos digitalmente. Chamado de VLOGGER AI, este novo desenvolvimento permite criar avatares altamente realistas a partir de uma única foto, os quais podem ser controlados através da voz do usuário. Esta inovação representa um avanço em relação às ferramentas existentes, oferecendo uma solução mais simples e com requisitos de largura de banda mais baixos.

No momento, o VLOGGER encontra-se na fase de projeto de pesquisa, acompanhado de demonstrações impressionantes de sua capacidade. Embora ainda não esteja disponível para testes públicos, as demonstrações sugerem a possibilidade futura de utilizar essa tecnologia para criar avatares personalizados em plataformas de comunicação como Teams ou Slack, promovendo uma nova era de interação digital.

Este modelo de inteligência artificial é capaz de gerar um avatar animado a partir de uma imagem estática, preservando a aparência realista da pessoa em cada quadro do vídeo. Através da análise de um arquivo de áudio com a voz do usuário, o modelo simula movimentos corporais e faciais naturais, incluindo gestos e expressões, sem necessidade de referências externas.

Google VLOGGER AI cria avatares realistas a partir de uma foto
Google VLOGGER AI cria avatares realistas a partir de uma foto (Imagem: Google)

Funcionamento inovador do VLOGGER

Utilizando uma arquitetura de difusão avançada, que já é a base de modelos de geração de imagem, vídeo e 3D, o VLOGGER adiciona controles mais refinados para a criação do avatar. O processo começa com a entrada de áudio e uma imagem estática, passa por uma geração de movimento 3D, segue para um modelo de difusão temporal que determina os movimentos e, por fim, é refinado até se tornar a saída final do vídeo.

Este modelo é treinado com um vasto conjunto de dados chamado MENTOR, contendo vídeos de diversas pessoas falando, com cada movimento facial e corporal meticulosamente etiquetado, permitindo uma precisão impressionante na geração dos avatares.

Limitações e potencial do VLOGGER

Apesar de ser uma tecnologia promissora, o VLOGGER ainda enfrenta desafios, como a reprodução fiel dos movimentos naturais da pessoa e a limitação na duração dos vídeos. No entanto, os pesquisadores do Google veem um vasto potencial de aplicação, desde a tradução de vídeos até a criação de avatares para assistentes virtuais e personagens de jogos.

PUBLICIDADE
VLOGGER traduz vídeos, ajustando lábios e rostos para corresponderem ao novo áudio, como de inglês para espanhol. (Imagem: Google)

Um dos usos mais intrigantes do VLOGGER poderia ser na comunicação de vídeo de baixa largura de banda, permitindo chats de vídeo baseados apenas em áudio, onde avatares animados substituem o vídeo tradicional, ideal para ambientes de realidade virtual.

Implicações futuras

A tecnologia VLOGGER, ainda em estágio de pesquisa, sinaliza uma revolução iminente na forma como criamos e interagimos com conteúdo digital. Embora seu lançamento como produto comercial ainda esteja no horizonte, o VLOGGER oferece um vislumbre fascinante do futuro das comunicações digitais, prometendo tornar as interações virtuais mais pessoais e imersivas. Com a contínua evolução dessa tecnologia, poderemos em breve testemunhar uma nova era de avatares digitais realistas, transformando a maneira como nos apresentamos e interagimos no mundo virtual.

PUBLICIDADE

Thiago Santos

Sou um estudante de Ciências e Tecnologia, apaixonado por inovação e sempre antenado nas últimas tendências tecnológicas. Acredito que o futuro está intrinsecamente ligado ao avanço da ciência, e estou empenhado em contribuir para esse progresso. Além dos estudos, sou um apaixonado por cinema e séries. Nos momentos de lazer, valorizo a companhia dos amigos. Gosto de compartilhar risadas, experiências e construir memórias com aqueles que são importantes para mim. Essa convivência é fundamental para equilibrar minha busca por conhecimento e meu amor pelo entretenimento e tecnologia.

Deixe uma resposta