Saiba tudo sobre o Gemini Nano, a inteligência artificial do Google para celulares

Gemini Nano é a versão do LLM da Google otimizada para dispositivos móveis

Gemini Nano é a versão do LLM da Google otimizada para dispositivos móveis (Divulgação)

Grandes empresas de tecnologia como Google, OpenAI, Anthropic e Meta estão engajadas em uma intensa corrida para criar o melhor modelo de linguagem de grande escala (LLM). O objetivo é usar os dados de treinamento disponíveis para desenvolver serviços úteis que conquistem a atenção de consumidores, empresas e investidores. Esses modelos, muitas vezes, exigem um poder computacional muito superior ao disponível nos smartphones que carregamos no bolso, o que leva algumas empresas a desenvolver versões menores de seus LLMs, otimizadas para rodar localmente em dispositivos móveis.

Google e o Gemini Nano: o LLM para dispositivos móveis

A versão otimizada do modelo de linguagem da Google para dispositivos móveis é chamada de Gemini Nano. Disponível inicialmente em alguns smartphones Android, essa versão foi lançada em dezembro de 2023 exclusivamente no Pixel 8 Pro. Um mês depois, o Gemini Nano foi disponibilizado também na série Galaxy S24 da Samsung, encerrando o período de exclusividade do Pixel sobre o modelo de IA. Ao longo de 2024, o Google expandiu o suporte para mais dispositivos das linhas Pixel e Samsung. Recentemente, o modelo também chegou aos smartphones da Xiaomi.

Expansão do Gemini Nano para outras marcas

O lançamento do Gemini Nano no Xiaomi 14T foi apenas o começo de uma expansão mais ampla. O Google liberou o suporte para uma variedade de novos smartphones, incluindo marcas como Motorola e Realme, além de continuar ampliando a compatibilidade com os modelos da Samsung. Isso demonstra o compromisso da empresa em popularizar o uso de IA em dispositivos móveis.

Lista de dispositivos compatíveis com Gemini Nano

Em 1º de outubro de 2024, os seguintes dispositivos suportam o Gemini Nano:

Dispositivos com a versão mais recente e multimodal do Gemini Nano

Além dos dispositivos citados, a versão mais recente do Gemini Nano, que suporta multimodalidade, está disponível nos seguintes modelos:

Diferença entre as versões do Gemini Nano

Embora ambas as versões do Gemini Nano pertençam à família Gemini 1.0, a versão multimodal permite a entrada de dados de imagem, áudio e fala, além de texto. Segundo a Google, essa versão é aproximadamente duas vezes maior do que a anterior e oferece um desempenho muito superior em testes acadêmicos e aplicações do mundo real.

O papel da multimodalidade no Gemini Nano

A nova versão multimodal do Gemini Nano está disponível apenas na série Google Pixel 9. Até o momento, a Google não anunciou se essa tecnologia será expandida para outros dispositivos. No entanto, essa versão aprimorada do LLM permite uma gama mais ampla de funcionalidades baseadas em IA nos smartphones compatíveis.

Funcionalidades de IA alimentadas pelo Gemini Nano

A versão mais recente do Gemini Nano com multimodalidade no Google Pixel 9 alimenta diversos recursos de IA em aplicativos como Pixel Screenshots, Talkback, Pixel Recorder, Phone by Google e Pixel Weather. Esses aplicativos utilizam a IA para analisar imagens, transcrever áudios e até gerar resumos automáticos de conversas e previsões meteorológicas.

Limitações da versão mais antiga do Gemini Nano

Nos dispositivos da série Pixel 8, o Gemini Nano oferece funcionalidades mais limitadas devido ao seu suporte apenas para entrada de texto. Ele auxilia o aplicativo Gboard a gerar respostas inteligentes em apps de mensagens compatíveis e contribui para a geração de resumos no Pixel Recorder, embora com algumas restrições, como a impossibilidade de processar áudios muito longos.

Gemini Nano em dispositivos não-Pixel

Nos dispositivos que não pertencem à linha Pixel, o Gemini Nano alimenta atualmente apenas um recurso de IA: o Magic Compose no Google Messages. Esse recurso utiliza os últimos 20 textos de uma conversa para sugerir respostas inteligentes, processando os dados diretamente no dispositivo, sem enviar informações para servidores externos.

Futuro do Gemini Nano em dispositivos Android

Embora o Magic Compose seja o único recurso comum a todos os dispositivos que suportam o Gemini Nano, a Google já abriu acesso experimental ao AI Edge SDK, permitindo que desenvolvedores utilizem o Gemini Nano em novos aplicativos. No entanto, esse acesso é limitado ao desenvolvimento de funcionalidades baseadas em texto, e apenas para a versão multimodal mais recente.

Google e a expansão do Gemini Nano

Com 15 dispositivos já suportando o Gemini Nano e mais quatro compatíveis com a versão multimodal, a Google está claramente empenhada em expandir a presença de sua IA em dispositivos móveis. Isso deve incentivar o desenvolvimento de novos recursos e aplicações que aproveitem ao máximo o poder desse modelo de linguagem.

Resumo para quem está com pressa

Sair da versão mobile