Microsoft registra nova patente para som gerado por IA em jogos e filmes
A Microsoft registrou uma nova patente para o uso de música/trilhas sonoras/áudio geradas por IAem uma ampla variedade de mídias, incluindo filmes, videogames, gravações ao vivo e campos relacionados. A patente é intitulada “ MODELOS DE INTELIGÊNCIA ARTIFICIAL PARA CRIAR MATERIAIS DE ÁUDIO ” e foi publicada em 17 de novembro de 2022. MICROSOFT TECHNOLOGY LICENSING , LLC é o requerente da patente.
A descrição da patente explica como o som em tempo real pode ser gerado com um sistema de inteligência artificial construído com grandes conjuntos de dados que incluirão técnicas de aprendizado de máquina usando visual, áudio e texto (pistas). Você pode ler a descrição exata da patente abaixo.
Um método para treinar um ou mais modelos de IA para gerar pontuações de áudio que acompanham conjuntos de dados visuais inclui receber dados de treinamento contendo uma pluralidade de conjuntos de dados audiovisuais e analisar cada um dos múltiplos conjuntos de dados audiovisuais para extrair uma pluralidade de recursos visuais, recursos textuais e recursos de áudio. O método também inclui a correspondência de vários recursos visuais e de texto com vários recursos de áudio por meio de uma rede de aprendizado de máquina. Com base nas correlações entre recursos visuais, de texto e de áudio, um ou mais modelos de IA são treinados para produzir uma ou mais partituras de áudio para acompanhar um determinado conjunto de dados.
De acordo com a patente, esta nova tecnologia vai ajudar o sistema a gerar som em tempo real dependendo da situação, ou, mais simplesmente, ajudar a gerar som dinâmico/adaptativo . Curiosamente, esta tecnologia irá separar a experiência de cada pessoa com base na sua escolha e situação num videojogo, se considerarmos os videojogos como exemplo da implementação desta tecnologia.
A nova IA para som da Microsoft pode ir muito além do uso usual de música dinâmica/adaptativa em jogos. As ações do jogador podem ser avaliadas dinamicamente em tempo real com pistas de áudio e música apropriadas. Como resultado, a experiência sonora será diferente de pessoa para pessoa.
Por exemplo, usamos partituras e sons de fundo pré-gravados em videogames e filmes que foram gravados de acordo com uma situação predeterminada que um usuário encontrará em um determinado jogo ou filme. No entanto, os videogames usam mais tecnologia de IA do que os filmes; Nos videogames, muitas áreas já estão implementando IA, seja na interação do jogador com NPCs ou no nível primário de som dinâmico baseado nos movimentos do jogador.
Por outro lado, os filmes são mais rígidos em comparação aos videogames porque todos os aspectos do filme são pré-determinados e gravados, e nada muda em tempo real para os espectadores. Assim, conforme descrito na patente, essa nova tecnologia pode ser revolucionária no campo da mídia. Isso mudará tudo e os jogadores ou espectadores se sentirão mais envolvidos e imersos do que nunca na mídia que consomem.
Também não é tão improvável se pensarmos sobre isso de forma realista, já que a tecnologia AI evoluiu muito nos últimos anos, desde o simples uso de AI para anúncios direcionados até a criação de fotos e vídeos ultrarrealistas com uma única linha de texto; a tecnologia percorreu um longo caminho e, mais cedo ou mais tarde, será introduzida em todas as áreas da indústria de mídia para automatizar processos longos.
Será interessante ver algo como trilhas sonoras criadas por inteligência artificial em tempo real. Então, o que você acha disso? Você está ansioso para experimentar algo assim? Deixe-nos saber na seção de comentários abaixo.
Deixe um comentário