Inna strona jest dublowana i zajmuje pozycję nad moją stroną w wynikach wyszukiwania

55

Istnieje strona o nieposzlakowanej opinii, znana jako thedirty, która całkowicie odzwierciedlała moją stronę i teraz ma linki pojawiające się w Google na pierwszym miejscu, w którym używam moich treści. Sprawdziłem moje pliki dziennika i zauważyłem, że ta strona od pewnego czasu indeksuje moje, a także ma 10 000 linków z ich witryn do moich.

Zablokowałem dostęp użytkowników, o którym mowa w tej witrynie, i zgłosiłem je Google jako spam internetowy. Zrzekłem się również domeny.

Jak zdobywają najlepsze linki w Google (nawet wyprzedzając moje) za tak nikczemną taktykę? Jakie są kroki do całkowitego wyeliminowania takiego problemu?

AKTUALIZACJA 28.08.2014:

Myślałem, że przedstawię aktualizację na ten temat, ponieważ mam teraz więcej informacji. Więc thedirty wskazali swoje subdomeny na mój ip, co spowodowało, że ich subdomeny wyglądały jak moja strona internetowa.

Przez kilka dni nie miało to większego znaczenia, ponieważ za pomocą htaccess przekierowałem wszystkie HOSTY nie z mojej domeny, z powrotem do mojej domeny, co w zasadzie oznaczało, że otrzymywałem linki do ich subdomen w Google. Po kilku dniach Thedirty zmienili swoje subdomeny, aby skierować je z powrotem na swoją stronę internetową, aby nie korzystać z tego.

Chodzi o to, że wykorzystali moje treści, aby uzyskać najwyższe pozycje w Google, i teraz kierują te linki z powrotem do swojej witryny, aby zwiększyć ruch do nich.

To brudna taktyka brudnej strony internetowej. Mam nadzieję, że Google karze takie zachowanie.

Marlboro Goodluck
źródło
3
Zredagowałem część, w której kwestionujesz ich motyw, ponieważ jest to poza tematem. Ale dobre pytanie inaczej.
John Conde
1
Klonowanie stron internetowych wydaje się być nową sztuczką, wiele stron internetowych jest obecnie niewłaściwie wykorzystywanych. W Heise (niemiecki) są wiadomości na ten temat. Wydaje się, że zwykłym rozwiązaniem (oprócz zgłaszania fałszywej witryny) jest podawanie specjalnej zawartości na adresy IP robotów, aby na przykład pokazywały link do Twojej prawdziwej witryny.
martinstoeckli
1
Kolejnym zmartwieniem na przyszłość - teraz, gdy Google zajął tak surowe stanowisko wobec spamu internetowego - jest to, że konkurenci celowo opublikują moje treści na stronach o złej reputacji, aby zaszkodzić mojej reputacji. Lub zamieści spamerskie blogi prowadzące do mojej witryny bez mojej wiedzy.
Marlboro Goodluck,
3
@Jarrod Roberson: tak naprawdę, nikt nie wie o pozwie, ale ile z tych technicznych rozwiązań ?!
machineaddict
1
@JarrodRoberson Jest to jednak problem, z którym borykają się wyłącznie webmasterzy, i dlatego jest bardzo tematyczny dla tej witryny, ponieważ zadając ją tutaj, otrzymamy odpowiedzi od osób, które również miały do ​​czynienia z nią. Wygląda również na to, że ludzie przedstawili kilka rozwiązań technicznych obok prawnych.
niż do

Odpowiedzi:

45

Jeśli po prostu odbijają kopię witryny, karmiąc ją za pomocą skryptu proxy lub zwracając słowo kluczowe HTML, możesz dodać kanoniczne adresy URL do swoich stron. Dzięki temu Google dowie się, że Twoje treści są oryginalnym źródłem, i pokaże URL w wynikach wyszukiwania, a nie ich.

Prześlij żądanie DMCA do Google. Są z nimi trochę powolni, ale ostatecznie usuną te strony z indeksu.

Zrzeczenie się linków to sprytny ruch.

Nie wiem jednak, czy blokowanie użytkowników jest pomocne. Być może lepszym rozwiązaniem może być umieszczenie dla nich wiadomości na górze strony z informacją, że jesteś oryginalną witryną, a druga to oszustwo.

John Conde
źródło
2
Kanoniczne adresy URL nie zawsze pomagają. Skrypt, który odzwierciedlał moją witrynę, zmienił kanoniczny adres URL, tak aby wskazywał również na fałszywą witrynę; więc to nie miało sensu.
CaptainCodeman
28

Możesz złożyć skargę DMCA, a jeśli jesteś w Stanach Zjednoczonych, możesz złożyć pozew cywilnoprawny dotyczący praw autorskich.

Oto link do krótkiej odpowiedzi wyjaśniającej, w jaki sposób skarga DMCA może pomóc każdemu:

Czy musisz być w Stanach Zjednoczonych, aby złożyć skargę DMCA?

... i kolejny wyjaśnia więcej ...

Ile treści trzeba skopiować, aby móc złożyć skargę DMCA?

Jeśli mieszkasz w USA, możesz zatrudnić prawnika, który zna się na zagadnieniach związanych z prawami autorskimi i poprosić ich o przesłanie pisma o zaprzestaniu działalności i rezygnacji. Daj im 10 dni (dni rzeczywiste, a nie dni robocze, choć dni robocze też byłyby w porządku) na usunięcie treści. Chcesz uchwycić migawki strony naruszającej prawo jako dowód i migawki swojej witryny. Jeśli sprawdzisz, czy strona została usunięta, sprawdź bezpośrednio witrynę, a nie wyniki wyszukiwania.

Jeśli strona nie zostanie usunięta w wyznaczonym terminie, możesz złożyć federalną sprawę cywilną, której obrona zajmie co najmniej 10 000 USD i nic cię nie kosztuje. Będziesz na miejscu kierowcy. Jest prawdopodobne, że ugoda może być zawarta za co najmniej 10 000 USD i być może więcej. Możesz także odzyskać swoje koszty. Ważne jest zaoferowanie bezpłatnej opcji rozwiązania problemu, stąd list o zaprzestaniu działalności. Następnie możesz złożyć skargę bez odpowiedzialności pozwanego.

Inna uwaga jest taka, że ​​będziesz musiał wykazać szkody, jeśli pójdziesz do sądu. Utrata ruchu związanego z wyszukiwaniem jest szkodą. Tutaj będziesz współpracować ze swoim adwokatem w celu zebrania wskaźników obrazujących utratę ruchu i będziesz musiał zarabiać na wartości tego ruchu. Oczywiście możesz założyć tutaj wyższe liczby nawet przy współczynniku konwersji 100%. Na wszelki wypadek zbieram dane dotyczące utraty ruchu za pomocą Google Analytics i oprogramowania do analizy plików dziennika dzisiaj i w przyszłości.

Pamiętaj, że zgłoszenie sprawy nie jest trudne ani bardzo kosztowne, szczególnie w porównaniu do szkód, których doświadczasz teraz i w przyszłości. Liczba naruszeń praw autorskich ostatnio spada, ale tych nielicznych, którzy naruszają prawa autorskie, są dziś znacznie odważniejsze. Musimy powstrzymać tych ludzi, a jedynym prawdziwym sposobem jest uwzględnienie czynnika kosztowego w strategii biznesowej, która sprawia, że ​​naruszenie praw autorskich jest nieopłacalne.

closetnoc
źródło
2
Cały problem, który omijasz, polega na tym, że odkrycie, kto stoi za stroną, jest praktycznie niemożliwe. To znaczy, musieliby być idiotami, aby ułatwić prześledzenie strony z powrotem do konkretnej osoby.
David Mulder
1
@DavidMulder Brak bocznicy. Prawnik może wezwać firmy do uzyskania potrzebnych informacji. Wystarczy nawet miły list. Jeśli informacje nie zostaną dostarczone, adwokat może wymagać złożenia zeznań przed sądem z karą pozbawienia wolności, jeżeli się nie pojawią, lub podania wymaganych informacji. W USA nie ma ukrywania się przed prawem - cywilnym lub innym. To nadal działa na arenie międzynarodowej z pewnym wyjątkiem.
closetnoc
@closetnoc: Firma może nie chcieć udzielać informacji swobodnie, a nawet może to robić. Nie ma pewności, że sąd wyda wezwanie do sądu lub że szlak pozostanie pod jego jurysdykcją. Możesz znaleźć się w bardzo kosztownej i długiej walce prawnej z osobą trzecią, która może nawet nie znać prawdziwego nazwiska przestępcy. Sądząc po twojej dokładnej odpowiedzi, niewątpliwie zdajesz sobie sprawę z tych przeszkód, ale muszę stanąć po stronie Davida Muldera: Myślę, że rozumiesz, jak trudno jest prześledzić stronę z powrotem do konkretnej osoby.
Marcks Thomas
@closetnoc: Tak, ale dostawca hostingu nie ma poprawnych informacji. I płatność została prawdopodobnie dokonana za pomocą przedpłaconej karty kredytowej lub innej karty przedpłaconej, skradzionej karty kredytowej, bitcoin lub innego niewykrywalnego mechanizmu transakcji. Aha, a dostawca hostingu może nawet nie być w USA. Nazywa się to internetem, czy mu się to podoba, czy nie.
David Mulder,
@DavidMulder Doceniam to, co mówisz. Zajmuję się ochroną, szczególnie w dziedzinie badań nad tym, jak znaleźć złych facetów. Większość tego, o czym mówisz, to chiński, rosyjski lub polski. Nadal istnieją sposoby określania, kim są ci ludzie, poprzez wzorce i tym podobne. Oddają się. Właśnie to robię. Musisz spróbować. Nie możesz po prostu przejść. Dobry prawnik internetowy wie, jak ludzie tacy jak ja i jak uzyskać informacje. Jeden wątek jest wszystkim, czego potrzebuję i zwykle go otrzymuję. Ale to może być prawdziwy wysiłek. Ale to najgorszy scenariusz.
closetnoc
27

Możesz śledzić ich adresy IP (lub adresy IP) i zwracać im zupełnie inną zawartość, aby mogli wykonać kopię lustrzaną - cokolwiek zechcesz. W ten sposób zyskujesz wolne miejsce na reklamę i możesz wykorzystać ich wysoką pozycję w Google na swoją korzyść.

Kiedyś użyłem tego, aby po prostu wyjaśnić użytkownikom w lustrzanej witrynie, że jest to niewłaściwa domena. Możesz także opublikować prosty nagłówek przekierowania HTTP.

Igor R.
źródło
8
Z jakiegoś powodu uważam to za dość zabawne. +1
Mehrdad
1
prawdopodobnie nie sklonują nagłówków HTTP, ale możesz przesłać im animacje javascript i śmieszne banery w stylu markizy, krzyczące „to zdzierstwo” i stare dobre animowane gify: P
Florian Fida
może również używać metatagów i przekierowań javascript, jeden z trzech prawie na pewno zadziała. w każdym razie nie jest to stabilne rozwiązanie i będzie działać tylko, dopóki się nie dowiedzą i nie zaczną działać przeciwko niemu. @ Mehrdad, myślę, że to zabawne, ponieważ jest hacky :)
Igor R
zdało mi się również, że to zabawne, ponieważ atakujący faktycznie otwiera na siebie lukę, pozwalając ofierze na swoje (atakujące) boisko, nawet jeśli może ją zatrzymać w dowolnym momencie. co sprawia, że ​​atakujący wygląda dość głupio.
Igor R
Ich wysoka pozycja w Google zastępuje wysoką pozycję oryginalnej strony, więc nie jest to tak naprawdę „darmowa reklama”.
CaptainCodeman
12

Trochę za późno, ale najlepszym pomysłem na ochronę witryny (w przyszłości) byłoby: https://www.youtube.com/watch?v=I3pNLB3Cq24 (defcon 21, obrona liczbowa) sfałszowanie kodu powrotu, aby użytkownicy zobaczy treść, ale boty

  • wyrzucić zawartość
  • czołgać się w kręgach
  • przestać działać

inne możliwe pomysły - upewnij się, że użytkownicy nie widzą żadnego z tych:

  • pozwól im zapisać GB informacji (podczas gdy na twoim serwerze jest tylko kilka KB)
  • sprawiają, że boty zalewają własną pamięć fałszywymi linkami
  • wysyłaj fałszywe treści (100% boolsh * t - musisz pisać takie rzeczy - jak „Obama w ciąży”, „Spider-Man 5 - przyszłego lata”, ... aby złodzieje mogli go hostować ...)
  • wysyłać fałszywe pliki (np. 42.zip, jeśli nie sprawdzą skopiowanej zawartości, ich użytkownicy będą się dobrze bawić -> narzędzia AV pokażą, że coś jest nie tak -> użytkownicy będą p * ss * d ...)
  • pozwól im poczekać na więcej danych (rozmiar pliku = 1-10 MB i wysłać losowe cr * p z 1 bajtem / s lub mniej)

inne pomysły:

  • linki chronione przez Javascript (stary, nie ma już sensu? ale jeśli pozostaną niezmienione, użytkownicy zostaną do Ciebie wysłani (przez chwilę))
  • dynamiczne śmieci (użyj komentarzy lub niewidzialnych elementów, aby roboty pobierały rzeczy, których użytkownicy nie widzą - dobre boty na to nie wpadną)
  • blokuj adresy IP, które pobierają za dużo / za szybko / w niewłaściwy sposób (boty nie zachowują się jak ludzie 1) każdy link na każdej stronie 2) istnieje wzorzec lub całkowity chaos w sposobie wybierania kolejnych linków
  • użyj Javascript, aby przekierować na twój serwer, jeśli pliki nie są hostowane przez twój serwer (bez pomocy przeciwko kradzieży, ale złodzieje muszą go usunąć lub ich użytkownicy nie pozostaną na swojej stronie - możesz zakodować go w różnych procedurach (takich jak deszyfrowanie zawartości ))
MurksVomOrk
źródło
Mam własny kod, który wciąż wymaga dostrojenia niektórych blokujących pająki. Sprawdzę twoje pomysły, bo taki właśnie jestem! ;-) Świetne wskazówki!
closetnoc
4
Problem z blokowaniem pająków i botów polega na tym, że prawdopodobnie nie chcesz, aby wszystkie były blokowane. Google jest dość ważne, na przykład, jeśli chcesz, aby ludzie mogli znaleźć Twoją witrynę. (A ponieważ Google ma twoją witrynę w pamięci podręcznej, robot indeksujący tak naprawdę nie musi indeksować witryny, aby ją zduplikować).
trlkly
Jeśli masz zamiar celowo dać im coś alternatywnego - wolę odpowiedź Igora, aby uczynić ją korzystną dla ciebie (przekierowanie / powiedzenie, że to źle / reklama hosta) niż walkę.
OJFord
2

Nazywa się to Google Proxy Hack i zdarzyło mi się to również.

Po pierwsze:

  • Prześlij skargę DMCA do usługodawcy hostingowego. Użyj tego linku, aby utworzyć poprawnie sformułowaną skargę i wysłać ją na adres e-mail wsparcia lub nadużycia hosta. Jeśli host znajduje się w USA, musi usunąć witrynę. Nawet jeśli nie mają siedziby w Stanach Zjednoczonych, mogą mimo to usunąć stronę. (To mi się kiedyś zdarzyło.)
  • Użyj narzędzia Google DMCA, aby zażądać usunięcia dublowanego adresu URL z wyników wyszukiwania.
  • Skorzystaj z Raportu zgarniającego Google, aby zgłosić awarię algorytmu Google.

Zasadniczo jest to jednak błąd ze strony Google. Mimo wszystko, co mówią o tym, że ranking opiera się na „wysokiej jakości oryginalnej treści”, jest to absurdalnie prosty kontrprzykład, który szczerze mówiąc jest po prostu zawstydzający.

Mamy nadzieję, że jeśli wystarczająco dużo osób narzeka na to, w końcu Google zbierze swoje działania i napisze 10 linii kodu potrzebnych do sprawdzenia, czy witryna jest dokładnym odzwierciedleniem wcześniej utworzonej witryny.

Należy również pamiętać, że użycie kanonicznych adresów URL nie zawsze działa w tym przypadku. Wiele z tych skryptów proxy zmienia kanoniczne adresy URL tak, aby wskazywały na stronę lustrzaną, czyniąc je bezużytecznymi.

Na koniec pamiętaj, że mogą również spamować twoją główną stronę śmieciowymi linkami, aby zaszkodzić twojemu rankingowi. (To też mi się przydarzyło.)

Jeśli zaczniesz poszukiwania i kreatywne myślenie, istnieje kilka sposobów na walkę. Naprawdę nie sądzę, że dobrym pomysłem jest opublikowanie tutaj pełnej listy, ponieważ to tylko ułatwia życie hakerów.

CaptainCodeman
źródło
1

Jak wspomnieli inni, najlepszym rozwiązaniem może być złożenie skargi DMCA i pozwu cywilnego w sprawie praw autorskich.

W przypadku nowych treści, które publikujesz, możesz rozważyć powiadamianie o aktualizacjach witryny w mediach społecznościowych (Twitter, Facebook itp.) Zaraz po opublikowaniu. Zarejestrowana tam sygnatura czasowa może być dobrym wskaźnikiem, który napisałeś jako pierwszy, na wypadek, gdybyś musiał to udowodnić. Za pomocą Narzędzi Google dla webmasterów możesz wymusić ustawienie, aby Googlebot często indeksował Twoją witrynę . Zakładając, że popularne wyszukiwarki regularnie indeksują strony internetowe (aby dowiedzieć się, skorzystaj z operatora witryny, witryny: przyklad.com), datę w zbuforowanej kopii można wykorzystać jako przybliżony wskaźnik tego, kiedy treść została opublikowana.

Również w przypadku publikowanej nowej zawartości możesz osadzać znaki wodne w obrazach i umieszczać komentarze w plikach JS wskazujące, że jesteś pierwotnym właścicielem tych plików.

mvark
źródło
Jeśli bot kopiuje treść, może po prostu dołączyć informacje o autorze na stronie, aby skopiowana treść zawierała coś w rodzaju „To zostało utworzone przez Foo, wszelkie prawa zastrzeżone”, co stanowi naprawdę jasny przypadek (możesz np. Ukryć że w akrostyce, ale będąc botem, będzie działał jako zwykły tekst i sprawi, że twoja sprawa będzie silniejsza).
Ángel