Supprimer les doublons dans Excel : 5 méthodes complètes

Une liste de clients en double, des références produits qui apparaissent deux fois, des mails qui se répètent dans une newsletter… les doublons sont la plaie des données. Excel propose plusieurs méthodes pour les détecter, les marquer ou les supprimer. Chacune a son cas d'usage. Ce guide vous présente les 5 approches qui couvrent 100 % des besoins.

💡 Qu'est-ce qu'un doublon dans Excel ?

Un doublon, c'est une ligne (ou une valeur) qui apparaît plus d'une fois dans une plage de données. La définition exacte dépend du contexte :

  • Doublon strict : toutes les colonnes sont identiques
  • Doublon sur une clé : seule la colonne ID est identique (le reste peut varier)
  • Doublon approximatif : « Jean Dupont » vs « jean dupont » vs « Jean DUPONT » — même personne mais Excel les voit comme distincts

Avant de supprimer, il faut clarifier ce qu'on entend par « doublon ». La plupart des bugs viennent d'une mauvaise définition.

À retenir : supprimer des doublons est destructif. Faites TOUJOURS une copie de votre fichier avant l'opération.

1️⃣ Méthode 1 — Outil natif « Supprimer les doublons »

La méthode la plus rapide pour les cas simples.

Mode d'emploi

  1. Sélectionnez votre plage de données (ou cliquez n'importe où dans un tableau structuré)
  2. Données → Supprimer les doublons
  3. Une fenêtre liste vos colonnes. Cochez celles qui définissent un doublon (toutes par défaut)
  4. Cliquez OK

Excel vous indique « X doublons trouvés et supprimés, Y valeurs uniques conservées ».

Cas d'usage typique

Une liste de mails newsletter de 5000 contacts importés depuis 3 sources. Vous voulez ne garder qu'une fois chaque mail.

  1. Sélectionnez la colonne Mail
  2. Données → Supprimer les doublons
  3. Cochez « Mail » uniquement
  4. OK → 1200 doublons supprimés

Avantages et limites

  • ✅ Très rapide
  • ✅ Pas de formule à apprendre
  • ❌ Destructif (les doublons sont supprimés définitivement)
  • ❌ Ne dit pas QUI était en double
  • ❌ Ne se met pas à jour si les données changent

2️⃣ Méthode 2 — Fonction UNIQUE (Excel 365 / 2021)

Pour une liste de valeurs uniques DYNAMIQUE, mise à jour automatique.

Mode d'emploi

=UNIQUE(A2:A1000)

Cette formule renvoie la liste des valeurs distinctes de la plage A2:A1000. Elle se met à jour si vous ajoutez/supprimez des lignes.

Variantes

=UNIQUE(A2:C1000)
→ Lignes uniques (combinaison des 3 colonnes)

=TRIER(UNIQUE(A2:A1000))
→ Liste unique triée

=UNIQUE(FILTRE(A2:A1000; B2:B1000>1000))
→ Valeurs uniques de A pour les lignes où B > 1000

Cas d'usage typique

Alimenter une liste déroulante dynamique qui présente toutes les villes existantes dans votre base, sans avoir à la maintenir manuellement.

=TRIER(UNIQUE(Ventes[Ville]))

Référencée dans une validation de données, cette formule garantit que la liste reste à jour quand vous ajoutez des ventes dans une nouvelle ville.

Avantages et limites

  • ✅ Dynamique, mise à jour automatique
  • ✅ Non destructive (les données originales restent)
  • ✅ Combinable avec FILTRE et TRIER
  • ❌ Nécessite Excel 365 ou 2021

3️⃣ Méthode 3 — Repérer les doublons avec NB.SI

Pour identifier QUI est en double sans rien supprimer.

Mode d'emploi

Dans une colonne adjacente à vos données :

=NB.SI(A:A; A2)>1
→ VRAI si A2 a au moins un doublon dans la colonne A

Variante pour numéroter les occurrences :

=NB.SI(A$2:A2; A2)
→ Donne 1, 2, 3... pour la 1ère, 2ème, 3ème apparition

Cas d'usage typique

Vous voulez voir tous les clients en double mais sans les supprimer immédiatement (parce qu'ils ont peut-être des commandes différentes).

En colonne C : =NB.SI(A:A; A2)
→ Vous voyez 1 pour les uniques, 2 ou 3 pour les doublons

Vous pouvez ensuite filtrer sur « > 1 » et investiguer manuellement.

Avantages et limites

  • ✅ Non destructif
  • ✅ Fonctionne sur toutes les versions Excel
  • ✅ Permet d'investiguer avant de supprimer
  • ❌ Lent sur de très grandes plages (>100 000 lignes)

4️⃣ Méthode 4 — Mise en forme conditionnelle

Pour colorer visuellement les doublons sans les analyser un par un.

Mode d'emploi

  1. Sélectionnez votre plage
  2. Accueil → Mise en forme conditionnelle → Règles de mise en surbrillance → Valeurs en double
  3. Choisissez la couleur

En 5 secondes, tous les doublons sont surlignés.

Mise en forme conditionnelle → Valeurs en double A B C 1 Dupont dupont@mail.fr Paris 2 Martin martin@mail.fr Lyon 3 Bernard bernard@mail.fr Nantes 4 Martin martin@mail.fr Lyon 5 Lefèvre lefevre@mail.fr Bordeaux 6 Bernard bernard@mail.fr Nantes Doublons détectés automatiquement
Excel surligne en rose les cellules dont la valeur apparaît plus d'une fois — le texte passe en rouge pour renforcer le repérage visuel.

Variante puissante avec formule

Pour souligner les doublons SUR UNE COMBINAISON de colonnes (Nom + Date de naissance par exemple) :

=NB.SI.ENS($A:$A; $A2; $B:$B; $B2)>1

Appliquez cette formule en mise en forme conditionnelle sur la plage A:B. Seules les vraies combinaisons doubles sont surlignées.

Cas d'usage

Visualisation rapide avant un nettoyage. Idéal pour les revues de données en réunion : on partage l'écran, on voit immédiatement où sont les anomalies.

5️⃣ Méthode 5 — Power Query

La méthode reine pour les imports répétés ou les jeux de données complexes.

Mode d'emploi

  1. Données → Obtenir des données → À partir d'un fichier (ou autre source)
  2. Dans l'éditeur Power Query, sélectionnez la (les) colonne(s) clés
  3. Clic droit → Supprimer les doublons
  4. Fermer et charger

Avantages décisifs

  • Reproductible : à chaque actualisation, le dédoublonnage se refait automatiquement
  • Audit trail : chaque étape est tracée et modifiable
  • Performance : excellent sur de très gros volumes (centaines de milliers de lignes)
  • Multi-sources : dédoubonnage entre fichiers de plusieurs sources

Cas d'usage typique

Chaque matin, vous importez un CSV de ventes. Vous voulez éliminer les doublons (mêmes commandes apparaissant plusieurs fois). Avec Power Query : configuré une fois, le dédoublonnage se refait à chaque import sans intervention.

🤔 Quelle méthode choisir ? Tableau de décision

BesoinMéthode recommandée
Suppression rapide ponctuelleDonnées → Supprimer les doublons
Liste unique dynamiqueUNIQUE (365/2021)
Identifier sans supprimerNB.SI
Visualiser rapidementMise en forme conditionnelle
Process récurrent automatiséPower Query
>100 000 lignesPower Query
Doublons partiels (combinaisons)NB.SI.ENS + mise en forme

⚡ Doublons approximatifs : le cas piégeux

« Jean Dupont » et « jean dupont » sont visuellement très proches mais Excel les voit comme distincts. La solution :

Normaliser avant de dédoubonner

Colonne auxiliaire : =SUPPRESPACE(MAJUSCULE(A2))
→ Normalise casse et espaces

Puis Supprimer les doublons sur cette colonne auxiliaire

Combiner SUPPRESPACE, MAJUSCULE, SUBSTITUE

=SUBSTITUE(SUPPRESPACE(MAJUSCULE(A2)); "-"; " ")
→ Élimine espaces, casse, tirets

⚠️ Erreurs fréquentes

1. Supprimer sans avoir une copie

Erreur fatale. Une fois supprimés, vos doublons sont perdus. Sauvegardez systématiquement avant.

2. Considérer doublon strict alors qu'il s'agit d'une clé

Deux lignes avec le même ID client mais des dates de commande différentes ne sont PAS des doublons à supprimer. Réfléchissez à la définition métier.

3. Oublier de nettoyer avant

Des espaces invisibles, des casses différentes font passer des doublons à travers les mailles. Nettoyez d'abord.

4. Utiliser Supprimer les doublons sur un tableau croisé dynamique

Ne fonctionne pas. Le TCD est une vue agrégée des données. Pour dédoubonner, travaillez sur la source.

5. Compter les lignes uniques avec SOMMEPROD(1/NB.SI...) sur de gros volumes

Cette formule classique devient extrêmement lente au-delà de 10 000 lignes. Préférez UNIQUE ou Power Query.

✅ Bonnes pratiques avancées

Tester sur un échantillon

Avant de lancer un nettoyage sur 100 000 lignes, testez sur 1000. Vérifiez visuellement que le résultat correspond à ce que vous attendiez.

Documenter le critère

« Doublons éliminés sur la combinaison Mail + Date de naissance, le 15 mars 2026 ». Une note dans le fichier ou dans un mail interne évite les surprises 6 mois plus tard.

Conserver la trace des doublons supprimés

Avant suppression, copiez les doublons dans une feuille « Archive ». En cas de bug détecté plus tard, vous pourrez restaurer.

Automatiser avec Power Query

Si l'opération est récurrente (chaque semaine, chaque mois), configurez-la en Power Query. Le dédoublonnage devient un processus automatique et reproductible.

❓ FAQ : supprimer les doublons Excel

Excel garde-t-il la première ou la dernière occurrence ?

Réponse : la PREMIÈRE occurrence. Pour garder la dernière, triez d'abord vos données en sens inverse.

Peut-on annuler après suppression ?

Réponse : oui via Ctrl + Z, mais uniquement tant que le fichier n'est pas fermé. Après sauvegarde et fermeture, c'est perdu.

Comment supprimer les doublons sur 2 fichiers différents ?

Réponse : Power Query est la solution. Importez les deux fichiers, fusionnez les requêtes, puis supprimez les doublons sur la combinaison.

Comment compter le nombre de valeurs uniques ?

Réponse : sur Excel 365, =NBVAL(UNIQUE(A2:A1000)). Sinon, =SOMMEPROD(1/NB.SI(A2:A1000;A2:A1000)) (attention aux cellules vides).

Comment supprimer uniquement les doublons et garder les uniques ?

Réponse : c'est exactement ce que fait « Supprimer les doublons ». Si vous voulez l'inverse (supprimer les uniques et garder uniquement les valeurs en double), utilisez un filtre avec NB.SI>1.

La fonction UNIQUE garde-t-elle l'ordre original ?

Réponse : oui, par défaut. UNIQUE conserve l'ordre d'apparition. Pour trier, encapsulez : =TRIER(UNIQUE(...)).

Comment dédoubonner en ignorant la casse ?

Réponse : ajoutez une colonne auxiliaire avec MAJUSCULE, puis dédoubonnez sur cette colonne.

Y a-t-il une limite de lignes pour Supprimer les doublons ?

Réponse : non, sinon la limite Excel (1 048 576 lignes). Au-delà de 500 000 lignes, c'est lent : préférez Power Query.

🏁 Conclusion

Supprimer des doublons paraît simple, mais c'est l'une des opérations les plus risquées en data : un mauvais critère et vous détruisez de l'information précieuse. Le bon réflexe : copie de sauvegarde, identifier visuellement d'abord, supprimer en dernier.

Pour les processus récurrents, investissez 30 minutes dans une requête Power Query. Le temps gagné se compte ensuite en heures, semaine après semaine. Pour le ponctuel, l'outil natif suffit largement.

Tutoriel NB.SI Power Query : 10 automatisations