Ataques contra IA - jcr1m3/PrivacyRedTeam-AI GitHub Wiki
⚔️ Ataques Contra Modelos de IA
Principais Vetores
- Membership Inference Attack → Determinar se um dado foi usado no treinamento.
- Data Extraction / Exfiltration → Extrair informações privadas do modelo.
- Prompt Injection → Manipular modelos baseados em linguagem.
Impacto
- Vazamento de dados sensíveis.
- Quebra de compliance com leis de privacidade.
- Riscos reputacionais e legais.