Ataques contra IA - jcr1m3/PrivacyRedTeam-AI GitHub Wiki

⚔️ Ataques Contra Modelos de IA

Principais Vetores

  • Membership Inference Attack → Determinar se um dado foi usado no treinamento.
  • Data Extraction / Exfiltration → Extrair informações privadas do modelo.
  • Prompt Injection → Manipular modelos baseados em linguagem.

Impacto

  • Vazamento de dados sensíveis.
  • Quebra de compliance com leis de privacidade.
  • Riscos reputacionais e legais.