Mam kilka zduplikowanych wiadomości w Maildir mojego serwera IMAP. Jaki jest najlepszy sposób na ich usunięcie?
Niektóre istotne punkty:
- Współdzielony identyfikator wiadomości jest zwykle wystarczającą definicją duplikatu. Mały skrypt, który usuwa wszystkie zduplikowane wiadomości oprócz jednego, działałby.
- Czasami konieczne jest znalezienie duplikatów na podstawie udostępnionych treści wiadomości. Jaka jest rozsądna definicja udostępnionego tutaj? Odpowiednik bitowy? Co z dziwnymi różnicami w zawijaniu wiersza, ucieczce, kodowaniu znaków?
- Czasami istnieje pewna znacząca różnica między „zduplikowanymi” wiadomościami. Jaki jest najlepszy sposób na sprawdzenie różnic w zestawach „zduplikowanych” wiadomości? Różnice?
dla plików ogólnych w systemie Linux używam narzędzi fdupes do usuwania duplikatów plików. Odkryłem, że działa również w przypadku wiadomości Maildir.
źródło
.forward
lub cokolwiek będzie miała nieco inne nagłówki, więc chociaż sama wiadomość jest duplikatem, dwa pliki zawierające dwie kopie mogą nie być.Gnome's Evolution [graficzny agent użytkownika poczty] ma wbudowaną funkcję usuwania zduplikowanych wiadomości. Jak wyjaśniono na tej stronie pomocy , sprowadza się do:
Voilà.
PS Evolution może uzyskiwać dostęp do wiadomości lokalnie (MailDir, MH, Mbox) lub przez IMAP.
źródło
Najlepsze, co dzisiaj znalazłem, to deduplikat maildir Kevina Deldyckego .
X-MIMETrack
Domyślnie ignoruje nagłówek i porównuje nagłówki za pomocąSHA224
skrótu.Założę się, że ktoś może wymyślić coś fantazyjnego z delIMAPdups.pl Ricka Sandersa , który jest częścią jego narzędzi IMAP .
źródło
maildir-deduplicate
przeniósł się do nowej lokalizacji, więc zaktualizowałem link. Twoje informacje są jednak nieaktualne.