O que é a IA ‘Gemma’ do Google e como ela é diferente da Gemini

2024/02/22

O Google tem viajado muito no trem da IA nas últimas semanas. Primeiro, a empresa lançou os modelos Gemini Advanced e 1.5 Pro, e agora, a gigante da tecnologia está aqui com Gemma AI.

Gemma é uma família de modelos de IA leves e de código aberto baseados em seus principais modelos Gemini. As mesmas tecnologias e pesquisas foram usadas para construir esses modelos de última geração usados na criação do Gemini. Você pode pensar em Gemma como a irmã mais nova de Gêmeos.

O que é Gema

Projetado para desenvolvedores, Gemma se concentra em trazer recursos de IA para desenvolvedores de IA comuns, uma vez que eles podem ser executados em vários tipos de hardware de consumo (laptops, ambientes de nuvem ou estações de trabalho padrão), sem a necessidade dos extensos recursos computacionais exigidos pelo Gemini.

Tamanhos:

Gemma está atualmente disponível em dois tamanhos: 2B e 7B (parâmetros), e cada modelo possui duas variantes, base (pré-treinado) e ajustado por instrução.

O Google filtrou informações pessoais e outros dados confidenciais dos conjuntos de treinamento para tornar os modelos pré-treinados seguros e confiáveis.

Para modelos ajustados à instrução, a empresa utilizou amplo ajuste fino e aprendizagem por reforço de feedback humano (RLHF) para alinhar os modelos com o comportamento responsável.

Acessando Gemma:

É fácil começar a usar o Gemma, pois ele é integrado a ferramentas populares, como HuggingFace, Kaggle, NVIDIA NeMo, MaxText, etc. A implantação no Google Cloud também é fácil por meio do Vertex AI e do Google Kubernetes Engine (GKE).

Também foi otimizado para plataformas de hardware de IA, como GPUs NVIDIA e Google Cloud TPUs.

Disponibilidade:

Disponíveis em todo o mundo, os modelos Gemma funcionarão atualmente apenas em inglês, e o Google espera expandir no futuro. Eles também são mais adequados para tarefas relacionadas ao idioma, como resposta a perguntas, resumos e raciocínio, devido ao seu tamanho pequeno.

Os desenvolvedores podem ajustar os modelos Gemma para seus aplicativos para tarefas como resumo ou geração aumentada de recuperação (RAG).

Como é mais difícil colocar barreiras em modelos de código aberto, os modelos Gemma estão sendo enviados com kits de ferramentas de IA responsáveis, permitindo que os desenvolvedores criem suas próprias diretrizes ao usar o Gemma.

Gema x Gêmeos

O Gemini está disponível para clientes finais por meio do aplicativo web , do aplicativo Android ou do Google app no iOS . Mas os modelos Gemma são projetados apenas para desenvolvedores.

Os desenvolvedores podem acessar o Gemini por meio de APIs ou Vertex AI, tornando-o um modelo fechado. Em comparação, Gemma é um modelo de código aberto prontamente disponível para desenvolvedores, pesquisadores e empresas para experimentação e integração em seus próprios aplicativos.

Os modelos Gemini também são enormes, muitas vezes exigindo hardware de data center especializado. Considerando que o Gemma é menor, o que o torna muito mais portátil e econômico de operar.

Embora ambos possam ser ajustados, o Gemma foi construído com a personalização em mente. Os desenvolvedores podem adaptar mais facilmente os modelos Gemma para trabalhar com tipos específicos de dados ou executar tarefas especializadas.

Os modelos Gemma, especialmente o Gemma 7B, tiveram desempenho comparável em testes de benchmark a outros modelos LLM semelhantes, como Llama 2 7B ou Mistral 7B. Gemma representa os esforços do Google para tornar os modelos avançados de IA mais acessíveis e adaptáveis. A empresa também planeja lançar mais variantes no futuro, à medida que expande a família Gemma.

O que é Gema

Gema x Gêmeos

Deixe um comentário Cancelar resposta