Supprimer les doublons dans Excel : 5 méthodes complètes
Une liste de clients en double, des références produits qui apparaissent deux fois, des mails qui se répètent dans une newsletter… les doublons sont la plaie des données. Excel propose plusieurs méthodes pour les détecter, les marquer ou les supprimer. Chacune a son cas d'usage. Ce guide vous présente les 5 approches qui couvrent 100 % des besoins.
💡 Qu'est-ce qu'un doublon dans Excel ?
Un doublon, c'est une ligne (ou une valeur) qui apparaît plus d'une fois dans une plage de données. La définition exacte dépend du contexte :
- Doublon strict : toutes les colonnes sont identiques
- Doublon sur une clé : seule la colonne ID est identique (le reste peut varier)
- Doublon approximatif : « Jean Dupont » vs « jean dupont » vs « Jean DUPONT » — même personne mais Excel les voit comme distincts
Avant de supprimer, il faut clarifier ce qu'on entend par « doublon ». La plupart des bugs viennent d'une mauvaise définition.
À retenir : supprimer des doublons est destructif. Faites TOUJOURS une copie de votre fichier avant l'opération.
1️⃣ Méthode 1 — Outil natif « Supprimer les doublons »
La méthode la plus rapide pour les cas simples.
Mode d'emploi
- Sélectionnez votre plage de données (ou cliquez n'importe où dans un tableau structuré)
- Données → Supprimer les doublons
- Une fenêtre liste vos colonnes. Cochez celles qui définissent un doublon (toutes par défaut)
- Cliquez OK
Excel vous indique « X doublons trouvés et supprimés, Y valeurs uniques conservées ».
Cas d'usage typique
Une liste de mails newsletter de 5000 contacts importés depuis 3 sources. Vous voulez ne garder qu'une fois chaque mail.
- Sélectionnez la colonne Mail
- Données → Supprimer les doublons
- Cochez « Mail » uniquement
- OK → 1200 doublons supprimés
Avantages et limites
- ✅ Très rapide
- ✅ Pas de formule à apprendre
- ❌ Destructif (les doublons sont supprimés définitivement)
- ❌ Ne dit pas QUI était en double
- ❌ Ne se met pas à jour si les données changent
2️⃣ Méthode 2 — Fonction UNIQUE (Excel 365 / 2021)
Pour une liste de valeurs uniques DYNAMIQUE, mise à jour automatique.
Mode d'emploi
=UNIQUE(A2:A1000)
Cette formule renvoie la liste des valeurs distinctes de la plage A2:A1000. Elle se met à jour si vous ajoutez/supprimez des lignes.
Variantes
=UNIQUE(A2:C1000)
→ Lignes uniques (combinaison des 3 colonnes)
=TRIER(UNIQUE(A2:A1000))
→ Liste unique triée
=UNIQUE(FILTRE(A2:A1000; B2:B1000>1000))
→ Valeurs uniques de A pour les lignes où B > 1000
Cas d'usage typique
Alimenter une liste déroulante dynamique qui présente toutes les villes existantes dans votre base, sans avoir à la maintenir manuellement.
=TRIER(UNIQUE(Ventes[Ville]))
Référencée dans une validation de données, cette formule garantit que la liste reste à jour quand vous ajoutez des ventes dans une nouvelle ville.
Avantages et limites
- ✅ Dynamique, mise à jour automatique
- ✅ Non destructive (les données originales restent)
- ✅ Combinable avec FILTRE et TRIER
- ❌ Nécessite Excel 365 ou 2021
3️⃣ Méthode 3 — Repérer les doublons avec NB.SI
Pour identifier QUI est en double sans rien supprimer.
Mode d'emploi
Dans une colonne adjacente à vos données :
=NB.SI(A:A; A2)>1
→ VRAI si A2 a au moins un doublon dans la colonne A
Variante pour numéroter les occurrences :
=NB.SI(A$2:A2; A2)
→ Donne 1, 2, 3... pour la 1ère, 2ème, 3ème apparition
Cas d'usage typique
Vous voulez voir tous les clients en double mais sans les supprimer immédiatement (parce qu'ils ont peut-être des commandes différentes).
En colonne C : =NB.SI(A:A; A2)
→ Vous voyez 1 pour les uniques, 2 ou 3 pour les doublons
Vous pouvez ensuite filtrer sur « > 1 » et investiguer manuellement.
Avantages et limites
- ✅ Non destructif
- ✅ Fonctionne sur toutes les versions Excel
- ✅ Permet d'investiguer avant de supprimer
- ❌ Lent sur de très grandes plages (>100 000 lignes)
4️⃣ Méthode 4 — Mise en forme conditionnelle
Pour colorer visuellement les doublons sans les analyser un par un.
Mode d'emploi
- Sélectionnez votre plage
- Accueil → Mise en forme conditionnelle → Règles de mise en surbrillance → Valeurs en double
- Choisissez la couleur
En 5 secondes, tous les doublons sont surlignés.
Variante puissante avec formule
Pour souligner les doublons SUR UNE COMBINAISON de colonnes (Nom + Date de naissance par exemple) :
=NB.SI.ENS($A:$A; $A2; $B:$B; $B2)>1
Appliquez cette formule en mise en forme conditionnelle sur la plage A:B. Seules les vraies combinaisons doubles sont surlignées.
Cas d'usage
Visualisation rapide avant un nettoyage. Idéal pour les revues de données en réunion : on partage l'écran, on voit immédiatement où sont les anomalies.
5️⃣ Méthode 5 — Power Query
La méthode reine pour les imports répétés ou les jeux de données complexes.
Mode d'emploi
- Données → Obtenir des données → À partir d'un fichier (ou autre source)
- Dans l'éditeur Power Query, sélectionnez la (les) colonne(s) clés
- Clic droit → Supprimer les doublons
- Fermer et charger
Avantages décisifs
- Reproductible : à chaque actualisation, le dédoublonnage se refait automatiquement
- Audit trail : chaque étape est tracée et modifiable
- Performance : excellent sur de très gros volumes (centaines de milliers de lignes)
- Multi-sources : dédoubonnage entre fichiers de plusieurs sources
Cas d'usage typique
Chaque matin, vous importez un CSV de ventes. Vous voulez éliminer les doublons (mêmes commandes apparaissant plusieurs fois). Avec Power Query : configuré une fois, le dédoublonnage se refait à chaque import sans intervention.
🤔 Quelle méthode choisir ? Tableau de décision
| Besoin | Méthode recommandée |
|---|---|
| Suppression rapide ponctuelle | Données → Supprimer les doublons |
| Liste unique dynamique | UNIQUE (365/2021) |
| Identifier sans supprimer | NB.SI |
| Visualiser rapidement | Mise en forme conditionnelle |
| Process récurrent automatisé | Power Query |
| >100 000 lignes | Power Query |
| Doublons partiels (combinaisons) | NB.SI.ENS + mise en forme |
⚡ Doublons approximatifs : le cas piégeux
« Jean Dupont » et « jean dupont » sont visuellement très proches mais Excel les voit comme distincts. La solution :
Normaliser avant de dédoubonner
Colonne auxiliaire : =SUPPRESPACE(MAJUSCULE(A2))
→ Normalise casse et espaces
Puis Supprimer les doublons sur cette colonne auxiliaire
Combiner SUPPRESPACE, MAJUSCULE, SUBSTITUE
=SUBSTITUE(SUPPRESPACE(MAJUSCULE(A2)); "-"; " ")
→ Élimine espaces, casse, tirets
⚠️ Erreurs fréquentes
1. Supprimer sans avoir une copie
Erreur fatale. Une fois supprimés, vos doublons sont perdus. Sauvegardez systématiquement avant.
2. Considérer doublon strict alors qu'il s'agit d'une clé
Deux lignes avec le même ID client mais des dates de commande différentes ne sont PAS des doublons à supprimer. Réfléchissez à la définition métier.
3. Oublier de nettoyer avant
Des espaces invisibles, des casses différentes font passer des doublons à travers les mailles. Nettoyez d'abord.
4. Utiliser Supprimer les doublons sur un tableau croisé dynamique
Ne fonctionne pas. Le TCD est une vue agrégée des données. Pour dédoubonner, travaillez sur la source.
5. Compter les lignes uniques avec SOMMEPROD(1/NB.SI...) sur de gros volumes
Cette formule classique devient extrêmement lente au-delà de 10 000 lignes. Préférez UNIQUE ou Power Query.
✅ Bonnes pratiques avancées
Tester sur un échantillon
Avant de lancer un nettoyage sur 100 000 lignes, testez sur 1000. Vérifiez visuellement que le résultat correspond à ce que vous attendiez.
Documenter le critère
« Doublons éliminés sur la combinaison Mail + Date de naissance, le 15 mars 2026 ». Une note dans le fichier ou dans un mail interne évite les surprises 6 mois plus tard.
Conserver la trace des doublons supprimés
Avant suppression, copiez les doublons dans une feuille « Archive ». En cas de bug détecté plus tard, vous pourrez restaurer.
Automatiser avec Power Query
Si l'opération est récurrente (chaque semaine, chaque mois), configurez-la en Power Query. Le dédoublonnage devient un processus automatique et reproductible.
❓ FAQ : supprimer les doublons Excel
Excel garde-t-il la première ou la dernière occurrence ?
Réponse : la PREMIÈRE occurrence. Pour garder la dernière, triez d'abord vos données en sens inverse.
Peut-on annuler après suppression ?
Réponse : oui via Ctrl + Z, mais uniquement tant que le fichier n'est pas fermé. Après sauvegarde et fermeture, c'est perdu.
Comment supprimer les doublons sur 2 fichiers différents ?
Réponse : Power Query est la solution. Importez les deux fichiers, fusionnez les requêtes, puis supprimez les doublons sur la combinaison.
Comment compter le nombre de valeurs uniques ?
Réponse : sur Excel 365, =NBVAL(UNIQUE(A2:A1000)). Sinon, =SOMMEPROD(1/NB.SI(A2:A1000;A2:A1000)) (attention aux cellules vides).
Comment supprimer uniquement les doublons et garder les uniques ?
Réponse : c'est exactement ce que fait « Supprimer les doublons ». Si vous voulez l'inverse (supprimer les uniques et garder uniquement les valeurs en double), utilisez un filtre avec NB.SI>1.
La fonction UNIQUE garde-t-elle l'ordre original ?
Réponse : oui, par défaut. UNIQUE conserve l'ordre d'apparition. Pour trier, encapsulez : =TRIER(UNIQUE(...)).
Comment dédoubonner en ignorant la casse ?
Réponse : ajoutez une colonne auxiliaire avec MAJUSCULE, puis dédoubonnez sur cette colonne.
Y a-t-il une limite de lignes pour Supprimer les doublons ?
Réponse : non, sinon la limite Excel (1 048 576 lignes). Au-delà de 500 000 lignes, c'est lent : préférez Power Query.
🏁 Conclusion
Supprimer des doublons paraît simple, mais c'est l'une des opérations les plus risquées en data : un mauvais critère et vous détruisez de l'information précieuse. Le bon réflexe : copie de sauvegarde, identifier visuellement d'abord, supprimer en dernier.
Pour les processus récurrents, investissez 30 minutes dans une requête Power Query. Le temps gagné se compte ensuite en heures, semaine après semaine. Pour le ponctuel, l'outil natif suffit largement.