Mam 2 stare podobne drzewa katalogów z plikami MP3. Z przyjemnością używam narzędzi takich jak diff i Rsync do identyfikowania i łączenia plików, które są obecne tylko z jednej strony lub są identyczne, pozostało mi kilka plików, które są bitowo różne.
Po uruchomieniu diff nad parą faktycznie różne pliki (z tagiem -a wymuszającym analizę tekstu) tworzy niezrozumiały bełkot. Słuchałem plików z obu stron i oba wydają się grać dobrze (ale przy prawie 10 minutach na utwór, słuchając ich dwa razy, nie zrobiłem wielu)
Podejrzewam, że różnice wynikają z tego, że jakiś gracz w przeszłości „ulepszał” moją kolekcję, bawiąc się tagami ID3, ale nie mogę być tego pewien. Nawet jeśli zidentyfikuję różnice w znacznikach ID3, chciałbym potwierdzić, że żadne problemy związane z promieniowaniem kosmicznym lub kopiowaniem plików nie uszkodziły żadnego z plików.
Jedną z metod, które się pojawiają, jest znajdowanie lokalizacji bajtów różnic i ignorowanie wszystkich zmian w pierwszym ~ 10kb każdego pliku, ale nie wiem jak to zrobić.
Mam w kolejności około stu plików, które różnią się w drzewie katalogów.
znalazłem Jak porównać pliki mp3, flac audio w pliku, ignorując dane nagłówka (tag ID3) itp.? - ale nie mogę uruchomić alldup z powodu bycia tylko Linuksem, a z jego dźwięków i tak częściowo rozwiązałoby moje problemy.
źródło