To rodzaj rekurencyjnej wyszukiwarki Google, która powinna być zrozumiała. Dopracowanie zdania zajęło mi trochę czasu i próba znalezienia numeru, który dokładnie odpowiadałby, dlatego zamiast tego zmieniłem go na „ setki ”! : P
Jeśli korzystasz z Google wystarczająco długo, z pewnością natknąłeś się na sytuacje podobne do tego, wiele razy. Ilekroć pokazuje mniej niż 10 stron, dość łatwo go zobaczyć. Chodzi o to, że liczba wyników na dowolnej stronie z wyjątkiem ostatniej wydaje się okropnym szacunkiem .
Co dziwniejsze, czasami losowe oszacowanie nagle staje się znacznie lepsze i prawie dokładnie takie samo na wszystkich stronach niż na ostatniej stronie - jedyna strona, która zawsze jest poprawna.
Więc ktoś wie dlaczego?
google-search
Cregox
źródło
źródło
Odpowiedzi:
Nie znam dokładnej odpowiedzi - być może nikt poza Google nie wie. Ale mam dwa punkty danych, które mogą być przydatne.
Pierwszym jest podejście XKCD do problemu:
Drugi punkt danych pochodzi od mojego profesora informatyki, który był dość ciekawy tego problemu i niepokoił go niektórym znajomym z Google. Powiedzieli mu, że czasami ustalenie, ile wyników naprawdę zostało zwróconych z wyszukiwania, czasami staje się bardzo kosztowne, więc po prostu najlepiej zgadują i zwracają pierwszą stronę wyników, na której wszystkim zależy. Tylko wtedy, gdy faktycznie zaczynasz przeglądać strony, Google stara się w pełni obliczyć pozostałe strony.
Żadna z tych odpowiedzi nie jest ostateczna, ale mam nadzieję, że przydadzą się w wyjaśnieniu rodzajów problemów, które mogą powodować niedokładności Google.
EDYTOWAĆ:
Odpowiedź Sathya na tej stronie zawiera odpowiedź od webmastera Google KB.
źródło
Nie - liczba jest tylko przybliżeniem .
źródło
Liczby wyników Google są nieistotnym wskaźnikiem . Oprócz zwijania duplikatów masz również wyliczanie, sposób obliczania liczby w pierwszej kolejności przez pomnożenie częstotliwości oraz fakt, że Google nakłada ograniczenie określające maksymalną liczbę wyników, które kiedykolwiek zostaną zwrócone.
źródło
Żadna z powyższych odpowiedzi nie jest poprawna.
Szacunki Google muszą być bliższe rzeczywistej liczbie wyników niż podane.
Można to zilustrować prostym przykładem. Wybierz dość częste słowo, takie jak „Rosja” lub „Michał”. W rzeczywistości muszą istnieć tysiące, jeśli nie setki tysięcy stron internetowych, które zawierają te słowa gdzieś na swojej stronie. Ale wyniki Google mogą dać ci, powiedzmy, 700.
Prawda nie jest taka, że Google przesadza, ale teraz Google znacznie ogranicza liczbę wyników, które ci da. Obciąża wyniki poważnie, z naszą wielką szkodą dla osób fizycznych. Jest to niefortunne, ponieważ w niektórych przypadkach chcę czytać tysiące stron z moimi warunkami.
Wiem o tym, ponieważ korzystam z Google od dłuższego czasu, być może 10-15 lat, i zauważyłem, że co do zasady wyniki dla warunków uległy skróceniu, nie dłużej, nawet jeśli liczba witryn z tymi samymi warunkami na ogół musi wzrosły w czasie, gdy korzystam z Google.
Podczas gdy w przeszłości lata temu mogłem uzyskać 1000 wyników dla niektórych terminów, teraz otrzymuję 500 wyników dla tych samych warunków, dla których uzyskałbym 1000 wyników.
źródło
Problem z wyszukiwarką Google (Image) polega na tym, że ma ona znaczenie dla porzucenia wariancji. Po pierwsze, ważne jest, aby zrozumieć, jak to działa. Obraz przesłany do Internetu musi zostać zindeksowany na dwa sposoby:
Po zakończeniu indeksowania obraz odziedziczy „słowa kluczowe” w wyniku rozpoznania, aby uniknąć pokazywania użytkownikowi wyników nie na temat. Chodzi o to, że każde słowo kluczowe jest samodzielną frazą z przypisaną wartością w% na podstawie siły trafności (dlatego grupowanie większej liczby słów w polu wyszukiwania powoduje mniej wyników, a także podczas wyszukiwania obrazu przez przesłanie go lub wpisanie adresu URL, Google przypisze „zgadnij” tylko z najlepszymi słowami kluczowymi, co oznacza, że wyszukiwanie nigdy nie pokaże wszystkich zdjęć tylko dlatego, że wyszukiwanie nie jest do tego przeznaczone)
Tak więc pod koniec dnia, kiedy przeprowadzasz wyszukiwanie obrazów i zaraz pod polem wyszukiwania zobaczysz ogromną liczbę z napisem „25 270 000 000 wyników (0,55 sekundy)”, to zazwyczaj zawsze jest to fałszywa liczba, ponieważ nie dostaniesz więcej niż 200 (maksymalnie 500, ale tylko na żądanie użytkownika) wyników, które są również filtrowane, aby wykluczyć:
Podsumowując: wyniki wyszukiwania obrazu nigdy nie są w pełni trafne. Czasami otrzymasz pożądany wynik z wyszukiwaną frazą „brama plakat”, w przeciwnym razie może to być „brama osłona”, „brama rozmycie”, „brama dvd”, „brama 2015” lub nawet „自衛隊 彼 の 地 に て 斯 斯 く 戦え り ”- po prostu nie można uzyskać wyników„ WSZYSTKIEGO ”, ponieważ nie ma niczego, co jest„ WSZYSTKIE ”, dlatego trzeba się nim bawić, aby się tam dostać. Warto również wspomnieć, że istnieją inne wyszukiwarki obrazów, które mogą wykonywać tę pracę znacznie inaczej, ponieważ działają według różnych standardów i kryteriów. To nie jest i nigdy nie było „Google” tylko ... >> https://www.yandex.com/images/
znaczące rozszerzenia:
źródło
Na górze jest napisane strona 70 z 7000 wyników (przykład). Podaje numer strony i liczbę wyników. Nie ma 70 wyników, ale 70 stron. Mam nadzieję że to pomoże.
źródło