Détecter et supprimer vos doublons grâce à Docker
On a tous des quantités de fichiers relativement importantes chez soi, sur ses serveurs ou même dans le Cloud.
Dans ces fichiers, on a probablement des doublons, qu’il peut être parfois difficile de retrouver en vue de les supprimer.
J’ai trouvé une petite technique bien sympathique pour identifier les doublons, et les supprimer en quelques secondes (ou quelques minutes en fonction du nombre de fichiers à scanner.
Pour se faire, il faut avoir Docker, un dossier où scanner ses fichiers, et un petit peu de temps.
On lance la commande via un terminal de commande Linux
docker run -v le-dossier-de-vos-fichiers:/duplicates -it --rm chajr/duplicate-detector detector -ipS -t 4
Le container se lance, et scanne le dossier contenant tous nos fichiers.
Pour chaque doublon détecté, on coche les fichiers à supprimer et on appuie sur entrée pour les supprimer.
On répète l’opération pour chaque doublon identifié.