Suchen und Entfernen doppelter Dateien in Linux

Wenn Sie über Terabyte an Speicherplatz verfügen, erscheint es vielleicht unnötig, sich über doppelte Dateien Gedanken zu machen. Wenn Ihnen die Dateiorganisation jedoch wichtig ist, sollten Sie Duplikate auf Ihrem Linux-System vermeiden. Sie können doppelte Dateien entweder über die Befehlszeile oder mit einer speziellen Desktop-App finden und entfernen.

Verwenden Sie den Befehl „Suchen“

Falls Sie mit diesem leistungsstarken Befehl nicht vertraut sind, können Sie sich in unserem Handbuch darüber informieren. Indem wir find mit anderen wichtigen Linux-Befehlen wie xargs kombinieren, können wir eine Liste doppelter Dateien in einem Ordner (und allen seinen Unterordnern) erhalten. Der Befehl vergleicht die Dateien zunächst nach Größe und überprüft dann ihre MD5-Hashes, die eindeutige Informationen zu jeder Datei sind. Um nach doppelten Dateien zu suchen, öffnen Sie Ihre Konsole, navigieren Sie zum gewünschten Ordner und geben Sie Folgendes ein:

finden -nicht -leer -Typ f -printf "%s\n" | sortieren -rn | uniq -d | xargs -I{} -n1 finden -Typ f -Größe {}c -print0 | xargs -0 md5sum | sortieren | uniq -w32 --all-repeated=separate

Dieser Einzeiler bewirkt Folgendes:

find -not -empty -type f -printf "%s\n" – sucht nach regulären Dateien, die nicht leer sind, und gibt deren Größe aus. Wenn Ihnen die Dateiorganisation wichtig ist, können Sie doppelte Dateien entweder über die Befehlszeile oder mit einer speziellen Desktop-App ganz einfach finden und entfernen.

sort -rn – sortiert die Dateigrößen in umgekehrter Reihenfolge.

[enlazatom_show_links]

uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 – druckt nur doppelte Zeilen. In diesem Fall die Namen doppelter Dateien.

xargs -0 md5sum | sort | – sortiert die MD5-Hashes der gescannten Dateien.

uniq -w32 --all-repeated=separate – vergleicht die ersten 32 Zeichen von MD5-Hashes und druckt diejenigen aus, die Duplikate sind.

Beachten Sie, dass dieser Befehl Duplikate nicht automatisch entfernt – er gibt nur eine Liste aus und Sie können Dateien bei Bedarf manuell löschen. Wenn Sie Ihre Dateien lieber in einer Anwendung verwalten möchten, die mehr Optionen gleichzeitig bietet, ist die nächste Lösung möglicherweise das Richtige für Sie.

Beschäftige dupeGuru

DupeGuru ist eine plattformübergreifende Anwendung, die in drei Editionen erhältlich ist: Standard (SE), Music und Picture. Sie wurde entwickelt, um doppelte Dateien anhand mehrerer Kriterien (Dateinamen, Dateigröße, MD5-Hashes) zu finden und verwendet Fuzzy-Matching, um ähnliche Dateien zu erkennen. Windows- und OS X-Benutzer können die Installationsdateien von herunterladen die offizielle Websiteund Ubuntu-Benutzer können dupeGuru aus dem Repository ziehen:

sudo add-apt-repository ppa:hsoft/ppa sudo apt-get update sudo apt-get install dupeguru

Um nach Duplikaten zu suchen, fügen Sie zunächst einige Ordner hinzu, indem Sie auf die Schaltfläche „+“ klicken. Wenn Sie den Ordnerstatus auf „Referenz“ setzen, werden die Inhalte anderer Ordner damit verglichen. Bevor Sie auf „Scannen“ klicken, überprüfen Sie im Dialogfeld „Ansicht -> Einstellungen“, ob alles richtig eingerichtet ist.

Wenn Ihnen die Dateiorganisation wichtig ist, können Sie doppelte Dateien einfach über die Befehlszeile oder mit einer speziellen Desktop-App finden und entfernen.

„Scantyp“ variiert zwischen den dupeGuru-Editionen; in der Standard-Editionsversion können Sie Dateien und Ordner nach Inhalt und Dateinamen vergleichen. Die Bilder-Editionsversion bietet einen Vergleich nach EXIF-Zeitstempel und „Bildblöcken“ – eine zeitaufwändige Option, die jedes Bild in ein Raster unterteilt und die durchschnittliche Farbe für jede Kachel berechnet. In der Musik-Editionsversion können Sie „Felder“, „Tags“ und „Audioinhalte“ analysieren. Einige Einstellungen hängen vom Scantyp ab: „Wortgewichtung“ und „Ähnliche Wörter abgleichen“ funktionieren nur, wenn Sie nach Dateinamen suchen. Umgekehrt gilt „Filterhärte“ nicht, wenn Sie einen „Inhalts“-Scan durchführen.

DupeGuru kann kleine Dateien und Links (Verknüpfungen) zu einer Datei ignorieren und ermöglicht Ihnen die Verwendung regulärer Ausdrücke, um Ihre Abfrage weiter anzupassen. Sie können Suchergebnisse auch speichern, um später daran zu arbeiten. Apple-Fans werden die Tatsache lieben, dass dupeGuru iPhoto- und Aperture-Bibliotheken unterstützt und iTunes-Bibliotheken verwalten kann.

Wenn dupeGuru Duplikate findet, öffnet sich ein neues Fenster mit blau markierten Referenzdateien und deren Duplikaten darunter. In der Symbolleiste werden grundlegende Informationen angezeigt. Wenn Sie jede Datei auswählen und auf die Schaltfläche „Details“ klicken, können Sie mehr über sie erfahren.

Sie können doppelte Dateien direkt von dupeGuru aus verwalten – das Menü „Aktionen“ zeigt alles, was Sie tun können. Wählen Sie Dateien aus, indem Sie das Kontrollkästchen aktivieren oder auf ihren Namen klicken. Sie können alle oder mehrere Dateien mithilfe von Tastaturkürzeln auswählen (halten Sie Umschalt/Strg gedrückt und klicken Sie auf die gewünschten Dateien). Wenn Sie an Unterschieden zwischen doppelten Dateien interessiert sind, schalten Sie die Deltawerte um. Die Ergebnisse können neu priorisiert werden (sodass die als Duplikate aufgelisteten Dateien zu Referenzen werden) und nach verschiedenen Kriterien wie Änderungsdatum und Größe sortiert werden. Die offizielles dupeGuru-Benutzerhandbuch ist hilfreich und klar geschrieben, sodass Sie sich darauf verlassen können, wenn Sie einmal nicht weiterkommen.

Natürlich wäre es praktischer, wenn dupeGuru nicht in drei Editionen aufgeteilt wäre – schließlich lieben die meisten Benutzer Komplettlösungen. Wenn Sie den Befehl „find“ jedoch nicht verwenden möchten, bietet dupeGuru eine übersichtliche und schnelle Möglichkeit, Duplikate aus Ihrem Dateisystem zu entfernen. Können Sie andere Tools zum Entfernen doppelter Dateien empfehlen? Bevorzugen Sie für diese Aufgabe die Befehlszeile? Sagen Sie es uns in den Kommentaren.

Index
  1. Verwenden Sie den Befehl „Suchen“
  2. Beschäftige dupeGuru

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Go up