Modelo de linguagem GODEL de código aberto da Microsoft para conversas realistas
Criar melhores modelos de linguagem para ajudar as pessoas em vários aspectos da vida continua sendo uma importante área de atuação para grandes empresas de tecnologia. De fato, houve tantos avanços nessa área que até os engenheiros do Google começaram a acreditar que a inteligência artificial da empresa se tornou senciente. Enquanto isso, a Amazon está tentando fazer com que Alexa imite a voz de seu parente falecido.
Agora , a Microsoft anunciou que está abrindo o código-fonte de seu Grounded Open Dialogue Language Model (GODEL) para uso por um público mais amplo.
GODEL combina dois recursos importantes em um modelo de linguagem. Primeiro, concentre-se na tarefa e, segundo, torne a conversa realista e social. Normalmente, os chatbots tentam ser intencionais como assistentes de suporte técnico ou apenas tentam se comunicar sem um propósito.
GODEL é uma classe de modelos pré-treinados que basicamente permite que um agente conversacional como um chatbot forneça respostas com base na conversa atual e também gere informações externas e relacionadas para tornar sua interação mais realista e informada. O exemplo fornecido pela Microsoft é uma palestra sobre recomendações de restaurantes que discute receitas, métodos de cozimento e muito mais.
A Microsoft quer que o GODEL seja irrestrito quanto às consultas que pode responder e expandir, mas ao mesmo tempo tornar útil a conversa geral.
Na verdade, GODEL é uma evolução do DialoGPT que a Microsoft Research lançou em 2019 . Os testes humanos automatizados da Microsoft mostraram que sua mais recente IA de conversação é muito superior ao DialoGPT, então a empresa acha que está pronta para uso mais amplo em uma variedade de ambientes. Abaixo você pode ver um exemplo de conversa com GODEL em que ele responde uma pergunta sobre um evento atual que não fazia parte de seu conjunto de treinamento:
O GODEL agora está disponível como um repositório GitHub de código aberto aqui, e você também pode conferir o artigo de pesquisa relacionado aqui . Ele vem em três tipos, junto com o código que você precisará para treinar novamente o GODEL em um conjunto específico de informações.
Deixe um comentário