Google revela modelos avançados da série Gemini 1.5 e reduz o preço da API em 50%

2024/09/24

Hoje, o Google revelou dois modelos Gemini 1.5 aprimorados e prontos para produção: Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002. Esses modelos mais recentes oferecem melhorias incrementais em comparação aos modelos Gemini 1.5 originais lançados em maio.

Os modelos revisados da série Gemini 1.5 alcançam um aumento de aproximadamente 7% no MMLU-Pro, um aprimoramento de cerca de 20% nos benchmarks MATH e HiddenMath e melhorias que variam de 2% a 7% em cenários de visão e codificação. Além disso, o Google refinou a utilidade geral das respostas do modelo. Esses modelos agora geram respostas em um formato mais conciso, com o comprimento de saída padrão aproximadamente 5% a 20% menor do que seus predecessores.

Além das melhorias na funcionalidade do modelo, o Google também está implementando uma mudança notável nos preços: eles estão reduzindo o custo das APIs do modelo da série Gemini 1.5.

Uma redução de 64% nos tokens de entrada.
Uma redução de 52% nos tokens de saída.
Uma redução de 64% nos tokens em cache incrementais para o Gemini 1.5 Pro, em vigor em 1º de outubro de 2024, para prompts com menos de 128 mil tokens.

O Google também está elevando os limites de taxa, permitindo que os desenvolvedores criem aplicativos de IA sofisticados. Os limites de taxa de nível pago para o modelo Gemini 1.5 Flash agora são 2.000 RPM, enquanto para o modelo Pro, aumentou para 1.000 RPM, de 1.000 e 360, respectivamente. Além disso, há uma redução na latência com esses novos modelos, oferecendo aos desenvolvedores a saída esperada que é duas vezes mais rápida e três vezes menos latência.

Com o lançamento do Gemini 1.5 atualizado (modelos -002), o Google aprimorou a capacidade do modelo de aderir às instruções do usuário, mantendo os protocolos de segurança. Por padrão, o Google não aplicará filtros de segurança de conteúdo de IA nesses modelos mais recentes; em vez disso, os desenvolvedores podem aplicar os filtros com base em suas necessidades específicas.

Finalmente, o Google lançou uma versão atualizada do modelo Gemini 1.5 conhecido como “Gemini-1.5-Flash-8B-Exp-0924”. Esta versão experimental apresenta melhorias significativas no desempenho em aplicativos textuais e multimodais. Todos esses modelos Gemini 1.5 atualizados agora estão acessíveis aos desenvolvedores por meio do Google AI Studio e da API Gemini. Para empresas maiores e clientes do Google Cloud, esses modelos Gemini 1.5 recém-atualizados estão disponíveis no Vertex AI.

Fonte

Deixe um comentário Cancelar resposta