Jak zwalczyć spamerów polecających Google Analytics?

43

W ostatnich miesiącach w statystykach GA mam wielu spamerów odsyłających. Ich liczba jest ~ 10-krotnie wyższa niż liczba legalnych użytkowników (moja strona nie jest jeszcze bardzo popularna). Włączyłem opcję ukrywania znanych spamerów w ustawieniach GA, ale to wcale nie pomogło. Wygląda na to, że spamerzy używają skryptów do spamowania bezpośrednio do GA (tzn. Nie są zalogowani w moich IIS).

Czy mogę coś zrobić, aby powstrzymać tych spamerów?

UPD 10 miesięcy później i zaczęli spamować przy użyciu fałszywych nazw stron docelowych ... a Google nadal nic nie robi.

użytkownik626528
źródło
1
Sprawdź, czy w plikach dziennika nie ma trafień ze spamem odsyłającym, i daj nam znać, jeśli takie są. Jeśli możesz, edytuj pytanie i dołącz odnośny spam. Podejrzewam, że już znam odpowiedź. Robię badania i ostatnio jest sporo działań odsyłających, z których część sama doświadczyłam. Ponadto, jeśli masz zainstalowany WordPress, upewnij się, że jest aktualny. Wydaje się, że jedna ze stron działa także na luki w zabezpieczeniach WP. Nie odwiedzaj też żadnej z tych witryn, chyba że używasz przeglądarki tekstowej, takiej jak Curl.
closetnoc,
@closetnoc, spamerzy ci nie są zalogowani na moim serwerze. Jak napisałem, spamują bezpośrednio do GA. Nie używam WP. „uwzględnij odnośny spam odsyłający” - co masz na myśli?
user626528,
Wiem, kim oni są, i opublikowałem odpowiedź.
closetnoc,
Zdecydowanie najlepszym i najłatwiejszym sposobem, aby temu zapobiec, jest użycie: referrerspamblocker.com To zautomatyzowana konfiguracja filtrów w Google Analytics. Używam go od miesięcy.
Rody van Sambeek
Czy ustawienie „filtrowania botów” na „prawda” w ustawieniach Google Analytics pomaga rozwiązać problem? - lunametrics.com/blog/2014/08/07/…
sam

Odpowiedzi:

7

Spam wymyka się spod kontroli. Lista rośnie i jest czasochłonna, a nawet nieefektywna, aby dodać filtr dla każdego ze spamerów, ponieważ większość z nich pojawia się na kilka dni, a następnie znika i pojawia się nowa.

Istnieje wiele dezinformacji, najczęstszym błędem jest zalecenie użycia pliku .htaccess , ten plik blokuje dostęp do strony internetowej, chociaż istnieje kilka robotów indeksujących (5 lub 6), które można zablokować, zdecydowana większość spamu nigdy nie uzyskuj dostępu do Twojej witryny to Ghost Spam.

Najlepszym sposobem , aby zatrzymać ten rodzaj spamu (duchów), jest stworzenie ważnego filtr hostname , korzystanie spamu ducha albo fałszywe lub nie nastawioną hosta, więc z tego filtra nie trzeba dodawać filtry nieskończone, jeden filtr odbędzie opieka nad starym i nowym spamem. . Korzystam z tego rozwiązania z powodzeniem od 3 miesięcy

Więcej informacji o tej metodzie tutaj:

https://stackoverflow.com/a/28354319/3197362

Carlos Escalera Alonso
źródło
Cieszę się, że jest to zaakceptowana odpowiedź, którą naprawdę należy docenić. Zdecydowana większość osób odsyłających spam w usłudze Analytics to osoby odsyłające do ducha. Jest kilka .htaccessrzeczy, z którymi musisz się zablokować , ale jest to ciągła walka, aby powstrzymać ich od wypaczania postaci (Semalt jest głównym winowajcą tego - legalny bot mojej cioci Fanny).
GeoffAtkins
Oh Carlos, mam zamiar polecić przewodnik dotyczący walki ze spamem w Twojej witrynie . Wiem, że ten komentarz będzie postrzegany jako sposób na SEO / sprzedaż, ale tak nie jest. Naprawdę podziwiam twój wkład w ten przewodnik.
Ooker,
35

W porządku. Nie znając stron, o których mowa, postaram się wyjaśnić, co się dzieje i podam tylko kilka linków.

Od: http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

Otrzymuję następujące nazwy domen związane z nową metodą odsyłania spamu, którą ludzie widzą ostatnio.

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • Econom.co
  • Darodar.com
  • ILoveVitaly.Com
  • Priceg.com
  • Hulfingtonpost.com (nowy - dodano 16 stycznia 2015)
  • Bestwebsitesawards.com (nowo dodane 3 lutego 2015)
  • Ranksonic.info (nowy - dodano 3 lutego 2015)
  • Cenoval.ru (nowo dodane 6 lutego 2015)
  • oo-6-oo.com (nowy - dodano 25 lutego 2015 r.)
  • Humanorightswatch.org (nowy - dodano 4 marca 2015)
  • S.click.aliexpress.com (nowy - dodany 17 marca 2015 - podejrzany)
  • www1.social-buttons.com (nowy - dodano 23 marca 2015 - podejrzewany)
  • 4webmasters.org (nowy - dodany 26 marca 2015 - podejrzany)
  • Googlsucks.com (nowy - dodano 07 kwietnia 2015)
  • Addons.mozilla.org (nowy - dodano 07 kwietnia 2015 - podejrzewany)
  • Smallseotools.com (nowy - dodano 13 kwietnia 2015 r. - podejrzewany)
  • Theguardlan.com (nowy - dodano 14 kwietnia 2015 r.)
  • Buy-cheap-online.info (nowy - dodano 16 kwietnia 2015 - podejrzewany)
  • Site1.free-share-buttons.com (nowy - dodano 29 kwietnia 2015 - podejrzewany)
  • Sanjosestartups.com (nowy - dodano 25 maja 2015 r.)
  • Trafficmonetize.org (nowy - dodano 03 czerwca 2015 - podejrzany)
  • Howtostopreferralspam.eu (nowy - dodano 09 czerwca 2015 - podejrzany)
  • Www10.free-social-buttons.com (nowy - dodano 16 czerwca 2015 - podejrzany)
  • Getitfree.us (Nowość - dodano 18 czerwca 2015 r. Nie można ustalić własności. Dziękujemy - Trey Copeland)
  • Www6.free-social-buttons.com (nowy - dodano 18 czerwca 2015 r. - podejrzewany)
  • Erot.co (nowy - dodano 26 czerwca 2015 r. - podejrzewany)
  • 3g2upl4pq6kufc4m.onion (nowy - dodano 04 lipca 2015 - podejrzewany)
  • Traffic2money.com (nowy - dodano 28 lipca 2015 r. - podejrzewany)

Uwaga: Podejrzane przedmioty - wydają się być zgodne z tym samym wzorem własności i mogą nie być powiązane z tym samym sprawcą.

Wyczerpującą listę stron odsyłających do spamu obsługiwanych przez Piwik można znaleźć tutaj: https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt (Dziękujemy - użytkownik2428118)

Cytować:

BlackHatWorth.com to stosunkowo nowa domena utworzona dopiero 7 stycznia 2015 r., Która jest obecnie używana do spamowania stron odsyłających. W rzeczywistości ta witryna odsyłająca do spamu jest ukrywana za nazwą wyszukiwarki zakupów i pięknymi obrazami scenerii.

... adres IP BlackHatWorth.com, którym jest 78.110.60.230, jest taki sam, jak adres powiązany z innymi stronami ze spamem polecającym ...

W rzeczywistości domena BlackHatWorth.com jest własnością tego samego Rosjanina, który jest właścicielem innych domen ze spamem polecającym, takich jak ILoveVitaly.com, Econom.co i Darodar.com. Nazwą właściciela domeny jest prawdopodobnie Witalij A Popow z Samary (miasto), obwód samaraski (Rosja).

Nie możesz tego zablokować!

Od: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

Cytować:

Oto krótki opis działania Google Analytics.

Otrzymujesz więc konfigurację GA i otrzymujesz od nich kod. Kod wygląda jak UA-numer-1 lub coś w tym rodzaju. Ten numer jest Twoim „numerem konta” w GA. Teraz ten kod i trochę javascript trafiają na twoją stronę. Teraz ktoś odwiedza twoją stronę, a jego przeglądarka uruchamia ten kod javascript.

Ten kod javascript „rejestruje” ich wizytę. Sprawia, że ​​ich przeglądarka rozmawia z Google Analytics. W szczególności wysyła określone typy żądań HTTP, o których Google rejestruje informacje, a następnie GA wyświetla podsumowania tych informacji.

Całkiem proste, prawda? Nadal ze mną? Okej, teraz, jeśli to wszystko to Javascript wysyła im „wizytę”, to każdy może to sfałszować. W ogóle ktokolwiek. Wszystko, co muszę zrobić, aby Twoje GA wyświetlało fałszywe informacje, to wysłać moje fałszywe informacje bezpośrednio do GA.

W ogóle nie muszę odwiedzać Twojej witryny. W ogóle nie muszę uruchamiać javascript. Muszę tylko odtworzyć te żądania HTTP, które są publiczne, aby każdy mógł je zobaczyć i jak działają. Są nawet dość dobrze udokumentowane, publicznie, przez same Google.

Powiedzmy teraz, że jestem palantem spamera. Chcę, aby ludzie widzieli moją spamerską stronę. Więc co mam zrobić? Piszę trochę kodu, aby wysłać tysiące fałszywych próśb do GA, i po prostu przeglądam wszystkie numery UA, w kolejności losowej, cokolwiek. Wysyłam fałszywą wizytę z fałszywym polecającym i moją spamerską nazwą domeny. I zgadnij co? Jest wyświetlany na ekranach Google Analytics.

Ten spam widzisz jak każdą inną normalną wizytę. Bo jeśli chodzi o GA, to była normalna wizyta. Nagrywają tylko żądania HTTP, które zwykle pochodzą z kodu javascript GA. Ale prośba jest prośbą, a zrobienie fałszywej jest bardzo, bardzo łatwe.

Tak się dzieje. Potrzebuję tylko twojego numeru UA i przy niewielkim wysiłku mogę sfałszować wizytę na twojej stronie, bez łączenia się z nią w ogóle. Ta fałszywa wizyta może zawierać dowolną nazwę domeny i dowolnego polecającego, który wybiorę.

Jest to atak na Google Analytics, mający na celu promocję wyświetlanej witryny. Nie możesz zablokować go na swoim serwerze, ponieważ twój serwer w ogóle nie jest zaangażowany.

Możesz zrobić dwie rzeczy: po pierwsze, skonfigurować filtr, jak sugeruje John Conde; i dwa, sprawdź, czy istnieje sposób na poinformowanie Google. Na to nie mam odpowiedzi, ale mam pomysł.

[Aktualizacja]

To zaczyna osiągać oburzające proporcje, od setek spamów dziennie do pełnych reklam, takich jak ta:

wprowadź opis zdjęcia tutaj

closetnoc
źródło
2
@JohnMueller To nie jest moje królestwo, ale czy możesz wysłać jakieś e-maile, aby sprawdzić, czy G ma wiedzę na ten temat? Z góry dziękuję!!
closetnoc,
2
@JohnConde Thanks! John Mueller może nie wiedzieć o tym, ale ktoś w G. powinien. Nawet jeśli nie ma odpowiedzi, przynajmniej G powinien mieć głowę do góry, jeśli jeszcze nie ma. To jest dobra rzecz dla nas wszystkich. Twoje zdrowie!
closetnoc,
1
@JohnConde BTW- Widziałem pytania na innych stronach SE (i prawdopodobnie powiązanych). Nie robiłem notatek, ale czy istnieje dobry sposób na przekazanie notatki innym modom? A może powinienem po prostu wyszukać te nazwy domen w Google i poszukać odpowiedzi i opublikować?
closetnoc,
1
@joelmdev Przegapiłeś punkt, że nie można ich zablokować. Jest to bezpośredni atak na Google. Nikt nie ma żadnej kontroli poza Google. Zostali powiadomieni i większość z nich została zatrzymana.
closetnoc
2
@ Steve Nie widzę dużej wypłaty, jednak musi być gdzieś taka. Jedna osoba wymieniona w odpowiedzi nienawidzi Google i prawdopodobnie chce przynajmniej zawstydzić Google. Ale wyraźnie wykorzystują ten spam do kierowania ruchu do różnych stron internetowych, które są rejestrowane. Za pomocą tej metody widziałem nawet coś w rodzaju reklamy. To irytujące jak diabli !! Naprawdę krzywdzi niewinnych ludzi bardziej niż Google. Zakładam, że to działa ... bardzo smutne.
closetnoc
5

Możesz je wykluczyć, tworząc filtr . Musisz znaleźć coś wystarczająco konkretnego, aby nie przypadkowo zablokować dobrych gości i jest to uciążliwe, ponieważ musisz ręcznie dodawać każdego spamera, ale to załatwi sprawę.

John Conde
źródło
Czy masz jakieś porady dotyczące IIS, które mogą pomóc? Mogę pomóc z Apache, ale OP wydaje się mieć IIS.
closetnoc
2
Jeśli nie odwiedzają swojej witryny, co, jak sądzę, powiedzieli, nie byłaby to skuteczna metoda ich blokowania. A może źle przeczytałem pytanie?
John Conde
Przeczytałem to, gdy OP otrzymuje trafienia ze spamem odsyłającym.
closetnoc
2
Rzeczywiście, ale najwyraźniej trafiają bezpośrednio na GA zamiast na swoją stronę. It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
John Conde
W porządku. Masz rację. Mój błąd!! Nie jestem pewien, dlaczego tego nie podjąłem, ponieważ czytałem o tym trochę przed tym pytaniem. Spotyka mnie również spam odsyłający i jeden artykuł wspomina (krótko), że w ich plikach dziennika nie ma wpisów. Ciekawa nowa metoda.
closetnoc,
4

Aby odpowiedzieć bezpośrednio na pytanie tytułowe „Jak zwalczyć spamerów odsyłających”, najprostszą odpowiedzią jest upuszczenie Google Analytics i przejście na Piwik , który automatycznie blokuje cały spam odsyłający .

Zdaję sobie sprawę, że prawdopodobnie przyzwyczaiłeś się do Google Analytics i nadal chcesz go używać, ale jeśli spojrzysz na większy obraz, masz inną opcję, która działa bardzo dobrze. Piwik można również skonfigurować do rejestrowania adresów IP odwiedzających, jeśli chcesz, i nie przesyła danych odwiedzających do zewnętrznych firm reklamowych, które mogą odwoływać się do niektórych użytkowników.

Tom Brossman
źródło
2
Przy okazji Blacklist spam wywołującej że Piwik wykorzystuje open source: github.com/piwik/referrer-spam-blacklist
Matthieu Napoli
ich baza spamu jest dość mała. nie dotyczy to nawet domen odnotowanych w moim raporcie analitycznym.
Don Dilanga,
1

Oto reguła, która działa w IIS:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>
Flo
źródło
2
Ta odpowiedź nie ma nic wspólnego z pytaniem OP, ponieważ spamerzy spamują bezpośrednio przez Google Analytics, omijając serwer WWW OP.
Alfred Myers
@AlfredMyers Twój komentarz jest częściowo prawdziwy, ponieważ niektórzy spamerzy NIE używają metody webserver, inni używają metody bezpośredniej, jak wspomniałeś. W tym drugim przypadku jedynym rozwiązaniem jest dodanie filtrów w Google Analytics, aby uzyskać czyste raportowanie. Aby temu zapobiec, wolałbym, aby Google użył dłuższego, zaszyfrowanego, unikalnego identyfikatora dla kont GA, aby spamerzy nie mogli po prostu przeglądać dostępnych numerów i odpalać zapytania.
Flo,
PO w szczególności stwierdza „... ci spamerzy używają skryptów do spamowania bezpośrednio do GA (tzn. Nie są zalogowani w moich IIS).”. W związku z tym konkretnym pytaniem nie mają dostępu do jego serwera internetowego.
Alfred Myers,
1

Jeśli nadal szukasz rozwiązania i nie rozumiesz poczynionych odniesień, oto definitywny przewodnik po usuwaniu spamu polecającego, teraz w 133 wersji od 28 grudnia 2014 r .: http://www.analyticsedge.com/2014 / 12 / remove-referral-spam-google-analytics /

TL; DR:

  • poprawny filtr nazw hostów usunie wszystkie odesłania duchów (Uwzględnij nazwę hosta mojadomena.com)

  • konkretny filtr wykluczający (lub blokowanie strony) usunie znacznie krótszą listę robotów spamujących (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | button-for -website.com | przyciski-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • segmentu zaawansowanego można użyć do usunięcia ich z raportów historycznych.

Segment zaawansowany można zaimportować z Galerii rozwiązań Google Analytics: https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT % 26_.viewId% 3DGjpPQhFgS9aVzniXH4MTIg /

Mike Sullivan
źródło
0

Na początku ubiegłego roku otrzymałem zadanie znalezienia najlepszego możliwego rozwiązania dla spamu Google Analytics. Jak wszyscy, próbowałem zalecanych metod, ale nic nie działało tak dobrze. Następnie zwróciłem się do Menedżera tagów Google, ale to też nie pomogło. Sfrustrowany i zirytowany postanowiłem odbudować skrypt śledzenia Google Analytics, wprowadzając środki zaradcze przeciwko najczęstszym i irytującym formom spamu.

Chociaż nie jest to idealne, po ~ 1,5 roku konsekwentnego budowania, testowania, debugowania i refaktoryzacji, teraz mam dość niezawodny skrypt śledzenia Google Analytics, który działa dobrze od razu i można go łatwo dostosować. Dla tych, którzy chcą spełniać metryki, działa to jak urok.

https://github.com/nickolasburr/intelligent-ga-tracking

nburr
źródło