Dlaczego te witryny klonują moje treści i jak je zatrzymać?

14

Tak więc szukałem jednej z moich stron internetowych w Google: http://www.botlibre.com

i ku mojemu zaskoczeniu znalazłem kilka klonów mojej witryny, takich jak:

http://83waystowasteyourtime.adidas.com

i:

http:// mediaiq.astral.comm

Moje pytanie brzmi:

  1. Dlaczego tworzą klony mojej witryny? Jakiś schemat SEO czy co? Jaki zysk mogliby uzyskać?
  2. Jak mają adres URL w adidas.comi astral.comm? Zakładam, że to nie Adidas buduje moją zawartość.
  3. Jak zamknąć te witryny i powstrzymać ludzi przed kradzieżą moich treści? (na Tomcat)
James
źródło
copyscape.com Wydaje się być dobrym źródłem do znalezienia zduplikowanych treści, w ten sposób znalazłem kilka kopii mojej witryny.
Kzqai,

Odpowiedzi:

17

W porządku. To dość dziwne, ale nie tak tragiczne, jak mogłoby się wydawać.

Nie jestem pewien, jaka byłaby wypłata. Nie ma dla mnie absolutnie żadnego sensu, dlaczego ktoś miałby to zrobić. Nie widzę żadnej korzyści dla hakera. Dobra wiadomość jest taka, że ​​odwiedzający dociera do Twojej witryny. Będzie jednak hit z punktu widzenia SEO, więc chcesz to naprawić szybko.

Zakładam, że Twoja witryna nie znajduje się na wspólnym serwerze, więc jeśli uzyskasz dostęp do witryny za pomocą adresu IP, nadal będzie działać. Testowałem to i to robi.

83waystowasteyourtime.adidas.com i mediaiq.astral.com są subdomenami używającymi starego hacka, który pozwala każdemu na utworzenie subdomeny dla każdej niczego niepodejrzewającej domeny. Możesz przeczytać o tym tutaj: http://www.techrepublic.com/blog/it-security/watch-out-for-dns-sub-domain-hijacking/ Istnieje więcej stron, jeśli włamujesz się do subdomeny Google .

Dobra wiadomość jest taka. To nie są klony ani kopie Twojej witryny, to Twoja witryna. Każda subdomena wskazuje konkretnie Twój adres IP.

Możesz zrobić:

> dig 83waystowasteyourtime.adidas.com any

i

> dig mediaiq.astral.comm any

na dowolnym komputerze z systemem Linux, aby zobaczyć.

Prawdopodobnie możesz z tym walczyć, ale nie jestem pewien, która metoda zadziała:

Zakładając, że masz zainstalowany Apache, możesz edytować plik .htaccess w katalogu głównym i wstawić następujący kod.

Dodaj następujące u góry pliku, aby włączyć silnik przepisywania.

RewriteEngine On

Blokowanie według hosta:

RewriteCond %{HTTP_HOST} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

--lub--

Blokowanie przez polecającego:

RewriteCond %{HTTP_REFERER} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

Będziesz chciał je przetestować i powiedzieć nam, który z nich działa. Proszę. Być może będziemy musieli rozejrzeć się za inną metodą.

Oczywiście możesz zmienić regułę przepisywania i przekierować ją bezpośrednio na swoją stronę za pomocą:

RewriteRule .* http://www.botlibre.com [R=301,L]

--lub--

Wyślij ich do piekła (humor) z:

RewriteRule .* http://www.hell.com [R=301,L]

... która jest prawdziwą witryną. Ale przekażesz im problem.

Polecam je zablokować.

Jak wspomniał @Martijn w swoim komentarzu i warto go zachować, możesz mieć kanoniczne linki na stronę, które pomogą Ci chronić. W takim przypadku link prowadziłby do strony, na której znajduje się link. To więcej pracy, ale w dzisiejszych czasach wydaje się dobrym pomysłem.

<link rel="canonical" href="http://www.example.com/booger-eating-tyrants" />

Możesz także dotrzeć do właścicieli domen nadrzędnych i pozwolić im dołączyć do bitwy:

Adidas.com

Admin Name: Albert Pedraz
Admin Organization: adidas AG
Admin Street: Adi-Dassler-Strasse 1
Admin City: Herzogenaurach
Admin State/Province:
Admin Postal Code: 91074
Admin Country: DE
Admin Phone: +49.9132844584
Admin Email: [email protected]

Tech Name: noris.net Hostmaster
Tech Organization: noris network AG
Tech Street: Thomas-Mann-Str. 16-20
Tech City: Nuernberg
Tech State/Province:
Tech Postal Code: 90471
Tech Country: DE
Tech Phone: +49.91193520
Tech Fax: +49.9119352100
Tech Email: [email protected]

Astral.com

Admin Name: Van Tu Duong
Admin Organization: Bell Media Inc.
Admin Street: 9 Channel Nine Court,
Admin City: Scarborough
Admin State/Province: Ontario
Admin Postal Code: M1S 4B5
Admin Country: CA
Admin Phone: +1.5148702477
Admin Phone Ext:
Admin Fax:
Admin Fax Ext:
Admin Email: [email protected]

Tech Name: Van Tu Duong
Tech Organization: Bell Media Inc.
Tech Street: 9 Channel Nine Court,
Tech City: Scarborough
Tech State/Province: Ontario
Tech Postal Code: M1S 4B5
Tech Country: CA
Tech Phone: +1.5148702477
Tech Phone Ext:
Tech Fax:
Tech Fax Ext:
Tech Email: [email protected]
closetnoc
źródło
3
Dodaj nagłówek 301 do swojej witryny i dodaj znacznik kanoniczny do swoich stron, aby wyszukiwarka znała oryginał. Mógłbym również wziąć to na swoją korzyść :)
Martijn
@Martijn Dzięki za komentarz! Zaktualizowałem odpowiedź kanonicznym przykładem linku. To powinno pomóc ludziom w przyszłości.
closetnoc,
Dzięki za wspaniałe informacje. W jakim pliku mam dokładnie wpisać „RewriteCond”? Także jakakolwiek odpowiedź na pytanie nr 1, dlaczego? jakie czerpią z tego korzyści?
James
1
@James Zaktualizowałem odpowiedź. Odpowiedziałem na pytanie 1, ale odpowiedź była niższa i prawdopodobnie łatwo ją przeoczyłem. Przeniosłem go na górę i nieco rozszerzyłem. Dodałem również, jaki plik i gdzie go znaleźć - przy założeniu, że Apache (jest to kod Apache). W ogóle nie znam IIS. Mam ponad dziesięć lat, odkąd zrobiłem cokolwiek z IIS. Pamiętaj, nie jestem pewien, który zestaw kodu działa, ale raczej podejrzewam, że wersja% {HTTP_REFERER} jest poprawna. Testuj i daj nam znać, jakie są wyniki. Ponownie, zakładając, że Apache.
closetnoc
Przepraszam, używam Tomcat. Masz pomysł, jak to zrobić na Tomcat?
James