Google apresenta IA acessível com Gemini 1.5 Flash-8B, o modelo mais econômico até agora

Google apresenta IA acessível com Gemini 1.5 Flash-8B, o modelo mais econômico até agora

O modelo Gemini 1.5 Flash ganhou popularidade rapidamente entre os desenvolvedores desde seu lançamento, principalmente devido à sua velocidade impressionante e eficiência de custo. Em agosto, o Google apresentou o Gemini 1.5 Flash 8B, um modelo experimental de IA projetado para cortar custos ainda mais utilizando apenas 8 bilhões de parâmetros.

Após semanas de testes com desenvolvedores, o Google anunciou hoje que o Gemini 1.5 Flash 8B agora está pronto para produção. Este modelo se destaca em aplicativos multimodais de alto volume, tarefas de resumo de contexto longo e muito mais. Quando comparado ao 1.5 Flash original, o novo modelo 1.5 Flash 8B é 50% mais acessível, suporta limites de taxa 2x maiores e oferece latência reduzida para prompts menores.

Em relação ao desempenho, o 1.5 Flash 8B é muito parecido com o modelo 1.5 Flash lançado em maio. Ele é particularmente adepto a lidar com tarefas como interfaces de bate-papo, transcrição e tradução de idiomas de contexto longo. Uma comparação dos resultados de benchmark para este novo modelo pode ser encontrada abaixo.

Gêmeos 1.5 Flash 8B

O recurso de destaque do modelo 8B é sua acessibilidade, tornando o Gemini 1.5 Flash 8B o modelo de IA mais econômico do Google até o momento. Aqui está uma análise detalhada do preço:

  • $ 0,0375 por 1 milhão de tokens em prompts
  • US$ 0,15 por 1 milhão de tokens em prompts
  • US$ 0,01 por 1 milhão de tokens em prompts em cache

Para atender a aplicações de IA de alto volume, o Google também está aumentando o limite de taxa para este modelo. O Gemini 1.5 Flash 8B agora acomoda 4.000 solicitações por minuto (RPM), o dobro do limite anterior.

Desenvolvedores interessados ​​em explorar o novo modelo gemini-1.5-flash-8b podem se inscrever para acesso gratuito por meio do Google AI Studio e da API Gemini. Para desenvolvedores de nível pago, o faturamento para este modelo inovador começará na segunda-feira, 14 de outubro.

Com sua combinação excepcional de desempenho, preço acessível e acessibilidade, o modelo Gemini 1.5 Flash 8B do Google está pronto para se tornar uma solução de IA preferida por desenvolvedores em diversos campos.

Fonte: Google

Fonte

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *