Czy ktoś może zasugerować dobre narzędzie do wykrywania powielania zdjęć, które działa dobrze, gdy mam do czynienia z około 100 GB danych (gromadzonych przez lata)?
Wolałbym coś, co działa na Ubuntu.
Z góry dziękuję!
Edycja: Czy istnieje narzędzie, które pomoże mi zreorganizować moją kolekcję i usunąć duplikaty po ich wykryciu?
Edycja2: Trudność polega na zastanowieniu się, co zrobić, gdy mam dane wyjściowe składające się z tysięcy zduplikowanych plików (takich jak dane wyjściowe programu fdupes).
Nie jest oczywiste, czy nadal mogę bezpiecznie usunąć katalog (tj. Jeśli katalog może zawierać unikalne pliki), które to katalogi są podzestawami innych katalogów i tak dalej. Idealne narzędzie do rozwiązania tego problemu powinno być w stanie określić duplikację plików, a następnie zapewnić potężny sposób na restrukturyzację plików i folderów. Wykonanie fuzji przez hardlinkowanie (tak jak robi to fslint) rzeczywiście zwalnia miejsce na dysku, ale nie rozwiązuje problemu leżącego u podstaw duplikacji - tj. Złej organizacji pliku / katalogu.
źródło
Odpowiedzi:
ImageMagick na ratunek. Myślę, że pierwszym krokiem do każdego rozwiązania jest zmniejszenie wielkości kolekcji. Jeśli chcesz porównać zdjęcia pod względem zawartości , szczególnie gdy niektóre są nieco zmodyfikowanymi wersjami, bardzo dobrym początkiem jest zmniejszenie ich do miniatur, a następnie porównanie miniatur. Jest to szczególnie przydatne, gdy chcesz znaleźć prawie podobne zdjęcia i chcesz „zignorować” nieistotne różnice podczas porównywania.
Sugeruję na wysokim poziomie, że:
1- Użyj narzędzia do wyobraźni ImageMagick, aby zredukować zdjęcia do miniatur. To zajmie trochę czasu, ale sprawi, że rzeczywiste kroki porównania będą znacznie szybsze i dokładniejsze.
2- Użyj narzędzia porównywania ImageMagick, które pozwala ustawić próg dla porównania, tj. Pozwala znaleźć zdjęcia, które są w 85% podobne. Chciałbyś przeprowadzić kontrolowany eksperyment, aby znaleźć wartość progową, którą najbardziej lubisz.
źródło
Przeglądarka / organizer zdjęć open source Geeqie ma potężną funkcję Znajdź duplikaty . Może używać kilku różnych strategii wyszukiwania duplikatów:
Daje to listę wyników, która może zawierać miniatury, dzięki czemu można potwierdzić ręcznie.
To będzie prawdopodobnie powolny dla tysięcy plików, ale myślę, że po prostu używając go i pozwalając mu działać przez kilka dni lub co jest prawdopodobnie mniej niż ogólny wysiłek znalezienia lub zrobienie czegoś dostosowany do przypadku - chyba że suma kontrolna mecz jest wszystko, czego potrzebujemy.
źródło
Istnieje małe narzędzie o nazwie „fdupes”, które może robić, co chcesz?
Istnieje również inne narzędzie o nazwie „fslint”, które również możesz wypróbować. (Ten ma GUI).
źródło
fdupes
- istnieje możliwość usunięcia duplikatów. askubuntu.com/a/476732dupeGuru Picture Edition to konfigurowalna wyszukiwarka duplikatów obrazów dla systemów Windows, Mac OS X i Linux.
Istnieje kilka wersji dupeGuru (wersje standardowe, muzyczne i graficzne), a edycja obrazkowa pozwala znaleźć podobne wizualnie obrazy za pomocą algorytmu porównującego blokowanie bitmapy , między innymi metodami (np. Znacznik czasu oryginalnego obrazu EXIF lub pliki są po prostu identyczne) .
Posiada szereg innych przydatnych funkcji, takich jak wykluczone foldery, wsparcie dla bibliotek iPhoto / Aperture oraz znaczną personalizację sposobu wykrywania duplikatów i ich działania.
źródło
Co rozumiesz przez zduplikowane zdjęcia? Czy masz na myśli pliki, które są identyczne, powiedzmy, że skopiowałem dodatkowy czas lub dwa? czy masz na myśli zdjęcia, które „wyglądają” tak samo.
Jeśli masz na myśli identyczne pliki, możesz użyć „shasum” na wszystkich plikach, następnie uporządkuj wyniki i znajdź unikalne linie za pomocą „uniq” i uruchom „diff”, aby zobaczyć, co zostało wyeliminowane. Wszystko jest łatwe w powłoce Ubuntu.
źródło
Istnieje aplikacja o nazwie „bleachbit”, która wyszukuje duplikaty plików według rozmiaru, nazwy i innych filtrów. Możesz zainstalować go z menedżera pakietów synapctic w Ubuntu.
źródło