Hoy les comparto una herramienta que descubrí hará 9 meses como mínimo y que desde entonces uso a diario. Se trata de fdupes. Esta es una herramienta escrita en C y liberada bajo la licencia MIT, que permite escanear directorios en busca de ficheros duplicados, con opciones para listarlos y borrarlos. Fdupes primeramente compara los tamaños de los ficheros y firmas MD5, y después realiza una verificación byte-a-byte.

fdupes-tool

Instalación

La instalación de fdupes es muy sencilla debido a que se encuentra en los repositorios de debian, centos y ubuntu (no se si opensuse también). Los que no lo tengan en sus repos pueden descargar su código fuente aquí y compilarlo.

#Debian/Ubuntu
sudo aptitude install fdupes

# Centos
sudo yum install fdupes

Uso

Para usar fdupes basicamente basta con ejecutar:  fdupes [opciones] DIRECTORIOS… pero antes usarlo primero veamos cuáles son las principales opciones que nos brinda fdupes:

-r   Indica que a partir de directorio especificado hará una búsqueda recursiva.

-A  Indica a fdupes que ignore los archivos ocultos.

-m Indica que se haga un resumen, muy cuando quieres saber el espacio ocupado por todos los archivos duplicados.

-d  Esta opción le muestra al usuario un prompt para que tome la desición de si quiere borrar o no.

-N  Esta opción indica a fdupes que no muestre ningún prompt. En combinación con -d, fdupes preserva el primer fichero de cada conjunto de duplicados y borra los demás sin preguntarle al usuario.

Si queremos saber los archivos duplicados que tenemos en la carpeta de descargas en nuestro home ejecutamos:

fdupes -r -A ~/Downloads

Si queremos saber cuanto espacio en disco ocupan los archivos duplicados agregamos la opción -m al comando anterior quedando como sigue:

fdupes -r -A -m ~/Downloads

Si queremos eliminar los archivos duplicados quedaría como sigue:

fdupes -r -A -d ~/Downloads

Si queremos eliminar los archivos duplicados pero no queremos responder a ninguna pregunta agregamos al comando anterior la opción -N:

fdupes -r -A -d -N ~/Downloads

Si queremos saber los archivos duplicados que tenemos en la carpeta de descargas que ya tenemos en la carpeta de documentos ponemos:

fdupes -r -A -d -N ~/Documents ~/Downloads

De la forma anterior si tenemos en descargas el libro “La-Culpa-es-de-la-Vaca.pdf” y ya lo teníamos en documentos, fdupes como se le especificó en las opciones, listará los dos ficheros (el orginal y los duplicados), preservará el primero (el que está en documentos) y eliminará el segundo (el que está en descargas).

Cómo pueden apreciar esta es una herramienta muy útil para gente regada como yo :) Para ver más detalles acerca del uso de fdupes ejecuten man fdupes y bon voyage!!!