Przeszukiwałem folder spamu (co rzadko robię, ponieważ Gmail rzadko ma fałszywe alarmy) i zauważyłem coś interesującego:
Coś w ponad połowie wiadomości zawiera co najmniej jedno animowane emoji w temacie.
Żaden z moich przyjaciół nie użyłby tego gówna. Żadna ważna firma, z którą prowadziłbym interesy, też by tego nie zrobiła.
Jak mogę utworzyć filtr do automatycznego usuwania wiadomości z animowanymi emoji w temacie?
Korzystanie jamesmstone „s wskazówka poniżej starałem wyszukiwania z subject:=?UTF-8?
i subject:"=?UTF-8?"
i kilku innych permutacji, ale nie działało.
Oto przykładowy zestaw nagłówków z jednego z tych par:
Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <[email protected]>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
for <[redacted]@gmail.com>;
Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
spf=pass (google.com: domain of [email protected] designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) [email protected];
dkim=pass [email protected];
dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz;
[email protected]; q=dns/txt; s=default; t=1453691229;
bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version :
Content-Type : Content-Transfer-Encoding : To : From : Subject : Date :
Message-ID : From : Subject : Date;
b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <[email protected]>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <[email protected]>
goomoji
...Odpowiedzi:
Krótka odpowiedź
Zamiast używać filtrów Gmaila zależnych od funkcji wyszukiwania Gmaila do wyszukiwania zakodowanych emoji w wiadomościach oryginalnych, utwórz skrypt, używając metody GmailMessage :: getRawContent () Google Apps Script do przetwarzania wiadomości.
Powiązane pytania
Poniżej znajdują się łącza do odpowiedzi na podobne pytania w tej witrynie, w tym skrypty wykorzystujące wskazaną metodę.
źródło
Do takich celów utworzyłem skrypt Google Apps.
Jest na Github: https://github.com/spamzero/spamzero
Umożliwia tworzenie różnego rodzaju zaawansowanych reguł, które można dopasować do folderu ze spamem, dzięki czemu wiadomości stanowiące spam będą automatycznie usuwane.
źródło
Nie jest to dokładnie to, o co prosisz (odfiltrowując same emoji zamiast wiadomości z emoji), ale niektóre treści mogą być przydatne do zbudowania lepszego filtra wiadomości.
Obecnie dostępny jest skrypt użytkownika Greasemonkey / Tampermonkey / Violentmonkey o otwartym kodzie źródłowym, aby pozbyć się tych irytujących karaluchów wizualnych (tylko postacie, a nie same wiadomości):
Gmail Temat Emoji Roach Motel
Patrząc na źródło tego skryptu , zobaczysz, że istnieją dwa ogólne typy karaluchów emoji, które znajdziesz w wiadomościach e-mail od agresywnych sprzedawców (obecnie m.in. eBay i Amazon):
Karaluchy oparte na obrazach HTML (w tym te straszne animowane) aka goomoji
Karaluchy Unicode: Nadal istnieje wiele wielu emoji (i innych sekwencji Unicode generujących zdjęcia), których spamerzy i inni niegdyś marketerzy zaczynają używać w wierszach tematycznych wiadomości e-mail, a Gmail nie konwertuje na obrazy HTML. W niektórych przeglądarkach są one odważne i kolorowe, co jest prawie tak złe, jak animacja. Przeglądarki mogą również wybrać animację, ale nie wiem, czy to zrobić. Te sekwencje Unicode są wyświetlane przez przeglądarkę jako tekst Unicode, więc dokładny wygląd (kolorowy lub nie, animowany lub nie, ...) zależy od tego, jakiego systemu renderowania tekstu używa przeglądarka. Wygląd danego emoji Unicode zależy również od dowolnych selektorów odmian Unicode i modyfikatorów emojiktóre pojawiają się w pobliżu w sekwencji punktów kodowych Unicode. W przeciwieństwie do spamu emoji opartego na obrazach, sekwencje te można skopiować i wkleić z przeglądarki i do innych aplikacji jako tekst Unicode.
W przypadku tego drugiego typu skrypt użytkownika zawiera wyrażenie regularne zaprojektowane do przechwytywania sekwencji Unicode, które mogą być wykorzystywane przez marketerów. Wyrażenie regularne wygląda tak w JavaScript ES6 (skrypt użytkownika tłumaczy to na szeroko obsługiwany wyrażenie regularne sprzed ES6 przy użyciu niesamowitego ES6 Regex Transpiler ):
źródło