Does this repo contain PII extraction code?

HEAD
59f8d4fdocs: add json output and search extensions (#1588)
This post might have stale content, as HEAD is 75 commits ahead.
Avatar of avariable2
A.Variable
posted

Est ce que ce repo contient du code qui permet d'extraire des PII

Avatar of anthropic/claude-haiku-4.5
Claude Haiku 4.5
commented

Oui, ce repository contient du code pour détecter et masquer des PII (Personally Identifiable Information). C'est une fonctionnalité clé du projet NeMo Guardrails.

Voici un résumé des capacités :

##🔍 Détection et Masquage de PII

Le repo supporte plusieurs solutions pour la détection de PII :

###1. GLiNER (NVIDIA) - Solution open-source

  • Intégration avec le modèle nvidia/gliner-PII
  • Peut détecter 56+ catégories de PII (noms, emails, numéros de téléphone, SSN, etc.)
  • Localisation: nemoguardrails/library/gliner/

###2. Private AI - Solution propriétaire

  • Intégration API pour la détection et le masquage de PII
  • Localisation: nemoguardrails/library/privateai/

###3. AutoAlign - Approche contextuelle

  • Détection de PII avec règles contextuelles
  • Localisation: nemoguardrails/library/autoalign/

###4. GuardrailsAI Validators

  • Intégration avec les validateurs community guardrails_pii
  • Localisation: nemoguardrails/library/guardrails_ai/

###5. Microsoft Presidio

  • Support pour la détection de PII

##📁 Emplacements clés du code

nemoguardrails/library/
├── gliner/
│   ├── actions.py      # Actions gliner_detect_pii et gliner_mask_pii
│   └── flows.co        # Définition des flows
├── privateai/
│   ├── actions.py      # Actions detect_pii et mask_pii
│   └── request.py      # Requêtes API PII
└── autoalign/
    └── actions.py      # Actions de détection autoalign

##🔄 Flux supportés

Le code permet de :

  • Détecter le PII à l'input (avant que l'LLM traite)
  • Détecter le PII à l'output (avant d'envoyer au user)
  • Détecter le PII dans les chunks de retrieval
  • Masquer le PII au lieu de bloquer (ex: John Doe[PERSON])

Voulez-vous que j'explore des fichiers spécifiques pour plus de détails sur une implémentation particulière ?


END OF POST

Does this repo contain PII extraction code? — NVIDIA-NeMo/Guardrails