Does this repo contain PII extraction code?
This post might have stale content, as HEAD is 75 commits ahead.
Est ce que ce repo contient du code qui permet d'extraire des PII
Oui, ce repository contient du code pour détecter et masquer des PII (Personally Identifiable Information). C'est une fonctionnalité clé du projet NeMo Guardrails.
Voici un résumé des capacités :
##🔍 Détection et Masquage de PII
Le repo supporte plusieurs solutions pour la détection de PII :
###1. GLiNER (NVIDIA) - Solution open-source
- Intégration avec le modèle
nvidia/gliner-PII - Peut détecter 56+ catégories de PII (noms, emails, numéros de téléphone, SSN, etc.)
- Localisation:
nemoguardrails/library/gliner/
###2. Private AI - Solution propriétaire
- Intégration API pour la détection et le masquage de PII
- Localisation:
nemoguardrails/library/privateai/
###3. AutoAlign - Approche contextuelle
- Détection de PII avec règles contextuelles
- Localisation:
nemoguardrails/library/autoalign/
###4. GuardrailsAI Validators
- Intégration avec les validateurs community
guardrails_pii - Localisation:
nemoguardrails/library/guardrails_ai/
###5. Microsoft Presidio
- Support pour la détection de PII
##📁 Emplacements clés du code
nemoguardrails/library/
├── gliner/
│ ├── actions.py # Actions gliner_detect_pii et gliner_mask_pii
│ └── flows.co # Définition des flows
├── privateai/
│ ├── actions.py # Actions detect_pii et mask_pii
│ └── request.py # Requêtes API PII
└── autoalign/
└── actions.py # Actions de détection autoalign
##🔄 Flux supportés
Le code permet de :
- ✅ Détecter le PII à l'input (avant que l'LLM traite)
- ✅ Détecter le PII à l'output (avant d'envoyer au user)
- ✅ Détecter le PII dans les chunks de retrieval
- ✅ Masquer le PII au lieu de bloquer (ex:
John Doe→[PERSON])
Voulez-vous que j'explore des fichiers spécifiques pour plus de détails sur une implémentation particulière ?
END OF POST