Usuń zduplikowane wiadomości z Maildir

10

Mam kilka zduplikowanych wiadomości w Maildir mojego serwera IMAP. Jaki jest najlepszy sposób na ich usunięcie?

Niektóre istotne punkty:

  • Współdzielony identyfikator wiadomości jest zwykle wystarczającą definicją duplikatu. Mały skrypt, który usuwa wszystkie zduplikowane wiadomości oprócz jednego, działałby.
  • Czasami konieczne jest znalezienie duplikatów na podstawie udostępnionych treści wiadomości. Jaka jest rozsądna definicja udostępnionego tutaj? Odpowiednik bitowy? Co z dziwnymi różnicami w zawijaniu wiersza, ucieczce, kodowaniu znaków?
  • Czasami istnieje pewna znacząca różnica między „zduplikowanymi” wiadomościami. Jaki jest najlepszy sposób na sprawdzenie różnic w zestawach „zduplikowanych” wiadomości? Różnice?
Joseph Holsten
źródło

Odpowiedzi:

3

dla plików ogólnych w systemie Linux używam narzędzi fdupes do usuwania duplikatów plików. Odkryłem, że działa również w przypadku wiadomości Maildir.

Sarabanda
źródło
1
fdupes wydaje się działać tylko dla dokładnych duplikatów, podczas gdy OP (domyślnie) pyta o bardziej złożone wzorce duplikacji. Wiadomość dostarczona dwukrotnie z powodu .forwardlub cokolwiek będzie miała nieco inne nagłówki, więc chociaż sama wiadomość jest duplikatem, dwa pliki zawierające dwie kopie mogą nie być.
tripleee
0

Gnome's Evolution [graficzny agent użytkownika poczty] ma wbudowaną funkcję usuwania zduplikowanych wiadomości. Jak wyjaśniono na tej stronie pomocy , sprowadza się do:

  1. Wybierz podejrzane wiadomości (lub tylko wszystkie wiadomości)
  2. Przejdź do menu Wiadomości , wybierz Usuń zduplikowane wiadomości .

Voilà.

PS Evolution może uzyskiwać dostęp do wiadomości lokalnie (MailDir, MH, Mbox) lub przez IMAP.

Franklin Piat
źródło
0

Najlepsze, co dzisiaj znalazłem, to deduplikat maildir Kevina Deldyckego .

  • X-MIMETrackDomyślnie ignoruje nagłówek i porównuje nagłówki za pomocą SHA224skrótu.
  • Automatycznie usuwa duplikaty bez pytania o potwierdzenie; istnieje jednak tryb próbny, który umożliwia podgląd duplikatów, które zostaną usunięte.

Założę się, że ktoś może wymyślić coś fantazyjnego z delIMAPdups.pl Ricka Sandersa , który jest częścią jego narzędzi IMAP .

Joseph Holsten
źródło
maildir-deduplicate przeniósł się do nowej lokalizacji, więc zaktualizowałem link. Twoje informacje są jednak nieaktualne.
Adam Spiers
Zaktualizowałem to, aby nie wprowadzać w błąd nieaktualnych informacji.
Adam Spiers,