Jak znaleźć duplikaty utworów?

Odpowiedzi:

24

dupeGuru Music Edition jest tym, czego chcesz. Ustaw typ skanowania na „Treść audio” w Preferencjach. Należy pamiętać, że program jest fairware, więc proszę wnieść wkład, jeśli możesz.

alternatywny tekst

Sugeruję, aby połączyć to z MusicBrainz Picard, który może automatycznie oznaczać twoje pliki muzyczne.

alternatywny tekst

Li Lo
źródło
DOSKONAŁY! Wreszcie odpowiedź, która działała jak urok :). Wtyczka Banshee lub cokolwiek byłoby jeszcze lepsze, ale działa świetnie! Naprawdę usunąłem około 8 GB duplikatów, na zdrowie!
Ingo
2
Szkoda, że ​​dupeGuru może wykonać tylko 10 operacji usuwania naraz, bez odkładania pieniędzy.
John McKean Pruitt
PPA nie działa w przypadku najnowszych wersji Ubuntu. Udało mi się zainstalować .deb bezpośrednio z launchpad.net/~hsoft/+archive/ubuntu/ppa/+build/9735351, a następnie uruchomiłem dupeguru_me.
rjh
Najnowsza wersja nie ma ograniczeń dotyczących usuwania. Jednak nie wydaje się odcisków palców muzyki, po prostu porównuje nazwy plików / informacje ID3. Jeśli najpierw użyjesz narzędzia takiego jak Picard, aby oznaczyć swoją muzykę, powinno to zrobić dobrą robotę :)
rjh
10

Istnieje wtyczka, która została stworzona jakiś czas temu. Użyłem go ostatnio, ale wciąż pozostawia trochę do życzenia. Jest do tego „ PPA ” - ale jeszcze nie ma wbudowanych pakietów, tylko gałąź Bazaar. Instrukcje instalacji wyglądają mniej więcej tak:

wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz

Jeśli chcesz użyć kodu źródłowego bazaru, wykonaj następujące czynności:

mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source

Po zainstalowaniu uruchom ponownie Rhythmbox i powinieneś mieć teraz Duplicates Finder na liście wtyczek.

lista wtyczek

Po aktywacji - dostępne są dodatkowe opcje konfiguracji.

okno konfiguracji

Po włączeniu wtyczki i znalezieniu duplikatów doda ona dodatkową opcję do listy bibliotek:

lista

Kilka ustawień, które uznałem za „nieparzyste” - wypróbowałem to w bibliotece multimediów zawierającej ponad 120 000 utworów (ponad 1000 duplikatów) oraz bibliotece zawierającej około 1000 utworów i może 30 duplikatów. Na tym pierwszym zajęło BARDZO długi czas i rozbił Rhythmbox kilka razy podczas wyszukiwania. Ostatecznie zdecydowałem się na opcję „Usuń z biblioteki”, aby uniknąć konieczności przebudowywania listy. W mniejszych bibliotekach wszystko działa jednak świetnie.

Po znalezieniu duplikatu - jeśli masz wybrane domyślne opcje - wersja listy o niższej jakości zostanie dodana do listy. Dlatego można bezpiecznie wybrać wszystkie utwory z listy Duplikaty i „Usuń” (Usuń z dysku lub usuń z biblioteki).

Marco Ceppi
źródło
Wielkie dzięki za udzielenie tej wskazówki! Wydaje się jednak, że nic się nie dzieje, gdy go aktywuję. Nie mogę znaleźć nowej karty ani niczego, w którym wskazane byłyby duplikaty.
Ingo
Konieczne może być przesunięcie progu do 0,5, aby pomóc uporządkować duplikaty. Będzie wyświetlany jako dodatkowy element na liście bibliotek. Zaktualizowałem odpowiedź, aby to pokazać.
Marco Ceppi
Próbowałem tego również. Bez powodzenia.
Ingo
5

Możesz użyć do tego fdupes :

$ fdupes -r ~/Music

która daje listę wszystkich zduplikowanych plików.

Możesz go łatwo zainstalować za pomocą

sudo apt-get install fdupes
Johann
źródło
4
Działa to lepiej niż inne opcje. Jednak tak naprawdę nie wydaje się odpowiedni dla plików audio. Oprogramowanie nie porównuje znaczników itp., Co prowadzi do bardzo krótkiej listy plików, podczas gdy w rzeczywistości istnieje wiele wielu duplikatów, jednak może nie mieć dokładnie tego samego rozmiaru (ponieważ mogą pochodzić z różnych źródeł).
Ingo
3

Podobny problem spotkałem, gdy miałem kilka zduplikowanych plików obrazów. W moim przypadku właśnie użyłem md5sumplików i posortowałem wyniki:

for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort

Pliki o tej samej zawartości generowały ten sam skrót, dzięki czemu można łatwo znaleźć duplikaty. Stamtąd ręcznie usunąłem duplikaty, chociaż mogłem rozszerzyć skrypt, aby usunąć wszystko oprócz pierwszego wystąpienia, ale zawsze mam paranoję na punkcie robienia tego w skrypcie ad-hoc.

Pamiętaj, że działa to tylko w przypadku duplikatów plików o identycznej zawartości.

John Bode
źródło
Szybciej:find $rootdir -name '*.jpg' -exec md5sum {} + | sort
Robert Vila,
1

Spróbuj FSlint lub dupe gredtter

Aby zainstalować FSlint wpisz w terminalu (Ctrl-Alt-T)

sudo apt-get install fslint

mam nadzieję, że jest to przydatne ..

DIVERSER FOSS
źródło
-2

Użyłem FSlinta, aby ogólnie znaleźć duplikaty plików. FSlint to „narzędzie do wyszukiwania i czyszczenia różnych form kłaczków w systemie plików”.

Aputsiak
źródło
To jest dziwne. FSlint nie znajduje żadnej z moich zduplikowanych piosenek!
Ingo
FSlint ma domyślne ustawienia, które mogą znaleźć duplikaty plików mierzone według nazwy i rozmiaru pliku, ale nie duplikują utworów, jeśli są to różne nagrania o innym rozmiarze i nazwie.
Aputsiak
Różne nagrania (remiksy?) Nie są bezpieczne do usunięcia. Mogą mieć własną wartość.
Extender
Użyłem również fslint do audio (z rozsądnym sukcesem) - chociaż biorąc pod uwagę niektóre alternatywy w tym wątku, prawdopodobnie spróbuję jednego z nich następnym razem.
belacqua