A Google anunciou na quarta-feira (6/12) seu mais recente avanço em inteligência artificial (IA): Gemini.
Este novo grande modelo de linguagem (LLM) multimodal promete superar o GPT-4, utilizado no popular chatbot ChatGPT, e marca um marco significativo no desenvolvimento de IAs.
Diferentemente de seus predecessores, o Gemini destaca-se por sua capacidade única de “compreender, operar e combinar diferentes tipos de informação”, abrangendo texto, áudio, imagem, vídeo e linguagens de programação.
Demis Hassabis, CEO e cofundador da Google DeepMind, enfatiza que a criação do Gemini busca torná-lo menos parecido com um “software inteligente” e mais intuitivo e prático.
Mais sobre Gemini, nova IA da Google
A flexibilidade é outra característica notável do Gemini, sendo o modelo mais versátil já criado pela Google.
Disponível em três tamanhos distintos — Ultra, Pro e Nano —, ele pode ser implementado em data centers ou dispositivos móveis, proporcionando assim uma variedade de usos.
Imagem: Shutterstock/LookerStudio
Atualmente, o Gemini 1.0 já está disponível no Google Bard em 170 países, incluindo o Brasil, embora restrito ao idioma inglês.
A expectativa é que, até 2024, o modelo mais potente seja integrado ao chatbot, expandindo também para outros idiomas.
O Google Pixel 8 Pro já incorpora o Gemini, e, futuramente, ele estará acessível diretamente na busca do Google, no Chrome e em outros serviços e produtos da empresa.
No âmbito mobile, o Gemini Nano demonstra sua eficiência ao realizar tarefas no aplicativo de gravação de áudio e na função Smart Reply do Gboard no WhatsApp.
Entretanto, a versão mais robusta, Gemini Ultra, programada para lançamento no próximo ano, passará inicialmente por uma fase restrita a alguns clientes, desenvolvedores, parceiros e especialistas em segurança e responsabilidade, visando coletar feedbacks e aprimorar o produto.
Em relação às capacidades do Gemini, destaca-se sua habilidade de extrair insights de documentos extensos e a capacidade de compreender simultaneamente texto, imagens, áudios e mais.
Essa abordagem multimodal permite respostas mais contextuais, especialmente diante de perguntas complexas.
O Google afirma que o Gemini obteve sucesso em 30 dos 32 benchmarks acadêmicos, superando especialistas humanos em diversas áreas, como matemática, física, história, direito, medicina e ética.
Em comparação com o GPT-4, o Gemini Ultra demonstrou superioridade em texto, raciocínio, matemática e programação, além de se destacar em testes multimodais que envolvem imagens, vídeos e áudios.
Em resumo, o Gemini surge como uma promissora inovação em IA, desafiando as capacidades do ChatGPT e prometendo uma abordagem mais cuidadosa e precisa ao responder perguntas desafiadoras.