Czego NIE możesz znaleźć w Google? [Zamknięte]

18

Google twierdzi, że jest uczciwy i w interesie firmy (przez większość czasu) jest przeszukiwanie Internetu w poszukiwaniu czegokolwiek i wszystkiego, do czego jego pająki mają dostęp. Chcę wiedzieć:

  • Jakiego rodzaju (publicznie dostępnych) treści Google nie dostarcza?
  • Czy istnieje określony rodzaj treści, których Google nie może pobrać?

Odniesienia, zwłaszcza do własnej dokumentacji Google, byłyby szczególnie niesamowite.

samthebrand
źródło
Teraz, kiedy UE wprowadziła „Prawo do bycia zapomnianym”, jest wiele rzeczy, których już nie będziemy w stanie znaleźć. Oto kilka rzeczy, które zostały „zapomniane”.
samthebrand

Odpowiedzi:

21

Kilka pomysłów na rodzaj rzeczy:

  1. Treść wyraźnie niedozwolona przez plik domeny robots.txtjest wykluczona z indeksu Google.
  2. Witryny, które nie są powiązane z innymi witrynami, które Google już zna. Oznacza to, że prawdopodobnie istnieje wiele witryn, które nie są połączone z widocznymi stronami, takie strony nigdy nie zostaną znalezione przez pająka Google, chyba że zostaną ręcznie przesłane do Google za pomocą Narzędzi dla webmasterów .
  3. Witryny za formularzami internetowymi, które musisz wypełnić.
  4. Obrazy ze spisu powszechnego. Ponieważ treść to obrazy, które często są indeksowane ręcznie, zwykle znajdują się w płatnych witrynach, takich jak ancestry.com.

Dowiedz się więcej o Deep Web

amh
źródło
2
Punkt 2 to nieprawda. Możesz przesłać witrynę do Google za pomocą Narzędzi dla webmasterów , a zostanie ona zaindeksowana, nawet jeśli nie będzie połączona z innymi witrynami.
Alex
To prawda. Dobre wyjaśnienie.
amh
3
Właściwie nie będę się zgadzać z drugim punktem. Miałem testowy serwer WWW na komputerze i był on indeksowany. Znalazłem to, sprawdzając dziennik dostępu.
Bakudan
2
Zarejestrowałem nowe domeny, zacząłem je rozwijać i znalazłem, że Googlebot indeksuje je zaledwie kilka dni później. Myślałem, że to trochę przerażające, dopóki nie zdałem sobie sprawy - być może nie jestem pierwszą osobą, która jest właścicielem tej domeny :) Nie ujawniają szczegółów, ale jestem pewien, że śledzą domeny, które ludzie uważali za wystarczająco ważne, aby się zarejestrować i co najmniej kilka odwiedzało w pewnym momencie, przynajmniej przez pewien okres czasu.
Tim Post
6

Oprócz Twittera Google nie indeksuje Tumblr aż tak dobrze. Wpisy na blogu na Tumblr są łatwiejsze do znalezienia przy użyciu wyszukiwania Tumblr. Również wszystko w Witrynach Google nie jest (lub jest prawie) indeksowane. Jeśli założysz witrynę Google, załóż własną domenę.

Mniejsze blogi, które nie są regularnie aktualizowane, są często usuwane z wyników wyszukiwania. Plus wszystko, co uważają za splog .

David
źródło
5

Cóż, większość treści na Twitterze nie jest indeksowana przez Google, nawet jeśli jest publiczna. Kiedyś był dostępny dla Google, ale nie jest tak już od czasu wygaśnięcia ich umowy.

Źródło .

Alex
źródło
Chociaż prawda, pytanie dotyczy tego, które „treści wysokiej jakości” nie są dostępne w Google. Większość Twittera nie spełniałaby tych kryteriów :) Widzę jednak dziwny tweet pojawiający się w wyszukiwarce Google.
HappyTimeGopher
4

To zależy w jakim kraju jesteś. W Niemczech nie wyświetla się tysiące stron, które według rządu nie są dla ciebie dobre, a lista rośnie o tysiące z każdym rokiem.

Google jest motorem cenzury internetowej. Jeśli chcesz mieć darmowy Internet, skorzystaj z nie-złych firm, takich jak DuckDuckGo lub innych.

Hellagot
źródło
1

Witryny z tak dużą zawartością, że Google po prostu nie miało czasu (ani skłonności) do indeksowania tego wszystkiego.

Witryny, które nie mają przeszukiwalnej mapy witryny i wymagają od Google podania wyszukiwanych haseł w celu uzyskania dostępu do wyników dostępnych w witrynie, mogą nie zostać w pełni zindeksowane.

Josephine Bonaparte
źródło