EzPC: tentativa da Microsoft de melhorar a segurança dos dados na validação do modelo de IA

Aqueles que trabalharam no campo da ciência de dados sabem que desenvolver um modelo de inteligência artificial (IA) normalmente envolve três etapas de alto nível: treinamento, validação e teste. Ao testar a precisão de um modelo, geralmente há muitas considerações ao escolher um conjunto de teste para ajuste de hiperparâmetro. As organizações tendem a usar alguns de seus dados da vida real para validação para avaliar modelos com precisão, mas naturalmente há muitas preocupações de segurança e privacidade, especialmente ao lidar com informações de identificação pessoal (PII).

Se o seu modelo está sendo desenvolvido por uma empresa externa, você basicamente tem duas opções. Ou a empresa compartilhará seu modelo com você – o que pode comprometer sua propriedade intelectual – ou você compartilhará seus dados reais com ela, o que representa um risco de privacidade para você e pode levar a um ajuste excessivo do modelo a dados reais. Há muitos obstáculos legais a serem superados ao fazer qualquer uma dessas escolhas difíceis. Portanto, embora as organizações desejem adotar a IA o mais rápido possível, elas enfrentam desafios ao lidar com dados, seja o processo de desenvolvimento do modelo interno ou externo.

Para resolver esse problema, a Microsoft está trabalhando em uma nova estrutura chamada EzPC , que significa “Easy Secure Multi-party Computation”. Essencialmente, o EzPC é baseado em Secure Multiparty Computing (MPC). O MPC permite que várias partes calculem conjuntamente uma função usando criptografia sem expor seus dados uns aos outros.

Embora o MPC exista há muitos anos, provou ser difícil de implementar devido aos desafios de torná-lo escalável e eficiente em várias funções. O EzPC resolve esses problemas usando o MPC como um bloco de construção e permitindo que desenvolvedores, não apenas especialistas em criptografia, ampliem seus recursos. De acordo com a Microsoft:

O EzPC é baseado em duas inovações. Primeiro, um compilador modular chamado CrypTFlow recebe como entrada o código TensorFlow ou Open Neural Network Exchange (ONNX) para inferência de ML e gera automaticamente código semelhante ao C, que pode ser compilado em vários protocolos MPC. Este compilador suporta MPC e é otimizado para eficiência e escalabilidade dos protocolos MPC. A segunda inovação é um conjunto de protocolos criptográficos de alto desempenho para computar com segurança funções complexas de aprendizado de máquina.

A Microsoft se gabou de que o EzPC forneceu “a primeira validação segura de um modelo de IA de nível de produção” em testes com pesquisadores da Universidade de Stanford, provando que você não precisa trocar dados para realizar a validação. Embora o modelo EzPC da Microsoft exigisse 15 minutos para inferência segura com um elemento de validação – que é 3.000 vezes maior que a inferência normal – em “duas VMs em nuvem padrão”, a empresa diz que não importa, pois o paralelismo computacional pode resolver esse problema. problema. Sob a metodologia atual, mais de 500 imagens no conjunto de validação foram inferidas em cinco dias a um custo total de menos de US$ 100. A Microsoft afirma que poderia concluir a saída de todo o conjunto em 15 minutos, se todos os dados fossem processados em paralelo. Você pode explorar as descobertas em um artigo publicado aqui .

Como tal, a Microsoft está incentivando o uso do EzPC, enfatizando sua base no MPC. As organizações que usam o EzPC também poderão contornar obstáculos legais, garantindo que o modelo de IA seja avaliado com precisão antes de ser usado em ambientes de produção. EzPC é uma estrutura de código aberto que você pode encontrar no GitHub aqui . Você também pode acompanhar os últimos desenvolvimentos desta iniciativa aqui e ler artigos de pesquisa sobre este tópico aqui .

Deixe um comentário Cancelar resposta