Data & Analyse

Nettoyer et dédupliquer un jeu de données en lot

Un fichier propre et sans doublons en quelques minutes, peu importe sa taille

Claude (chat)ChatGPTDébutantSemi-autonome

Le besoin

Les jeux de données réels sont presque toujours sales : doublons, formatages incohérents, valeurs aberrantes.

  • Le nettoyage manuel est fastidieux et source d'erreurs.
  • L'agent applique des règles de nettoyage intelligentes et documente chaque modification.
  • Tu gardes le contrôle en validant les règles avant l'application en masse.

L'approche

L'agent reçoit le fichier brut et effectue d'abord un audit (types, taux de remplissage, doublons suspects).

  • Il propose un plan de nettoyage avec les règles qu'il va appliquer.
  • Après validation, il applique les transformations : normalisation des formats, déduplication, gestion des valeurs vides.
  • Il produit le fichier nettoyé et un rapport détaillant chaque modification.
  • Il signale les cas ambigus qui méritent une décision humaine.

Étape par étape

  1. 1

    Auditer le fichier brut

    L'agent analyse la structure, compte les doublons et détecte les anomalies. Il te présente un résumé avant de toucher quoi que ce soit.

  2. 2

    Valider le plan de nettoyage

    Il propose les règles de nettoyage avec des exemples. Tu approuves, modifies ou exclues certaines règles avant l'application.

  3. 3

    Appliquer et recevoir le rapport

    L'agent nettoie le fichier et produit un rapport ligne par ligne des modifications effectuées, avec les cas qu'il n'a pas su traiter seul.

Le prompt à donner

Voici un export CSV de mon CRM avec environ cinq mille contacts. Détecte les doublons, normalise les numéros de téléphone en format international, corrige les emails malformés et signale les contacts sans aucune information de contact valide.

Le résultat

Un fichier CSV nettoyé et un rapport listant les doublons fusionnés, les corrections appliquées et les contacts signalés pour révision manuelle.

Le verdict NXUS

Un gain de temps immédiat sur une tâche que tout le monde déteste. Très efficace sur les fichiers contacts ou produits, moins sur les données métier très spécifiques.

Cas d'usage similaires

Apprends à piloter tes propres agents IA

Nos formations t'apprennent à transformer ces cas d'usage en automatisations concrètes pour ton métier.

Voir les formations