Zastanawiałem się tylko, w jaki sposób usługi GeoIP gromadzą dane o lokalizacji geograficznej adresów IP, oprócz sprawdzania informacji o adresie WHOIS. Na przykład natknąłem się na tę stronę internetową, która mówi, że adres IP 74.207.244.221 znajduje się w Fremont w Kalifornii: https://ipinfo.io/74.207.244.221
Ale nie mogę znaleźć tych informacji w tej informacji whois IP. ipinfo.io stwierdza, że:
Początkowo nasz interfejs API korzystał z danych MaxMind, ale byliśmy bardzo zajęci pracą nad tworzeniem własnych danych geolokalizacyjnych. Poczyniliśmy duże postępy i teraz wykorzystujemy własne dane do obsługi około połowy wszystkich wniosków. Nadal jednak cofamy się do danych MaxMind
Zainteresowało mnie to, w jaki sposób usługi takie jak ipinfo.io i MaxMind zbierają dane GeoIP?
Jestem założycielem IPinfo , więc zdecydowanie mogę podać kilka szczegółów na ten temat! Nie ma ani jednej metody, której używamy, ani jednego źródła danych, aby stworzyć własną bazę danych geolokalizacji (ani żadnego z naszych innych zestawów danych, takich jak adres IP do firmy lub adres IP do przewoźnika). Jest to mieszanka różnych zestawów danych, technik przetwarzania danych i wniosków wyciągniętych z tego od kilku lat!
Niektóre źródła danych i techniki, które nie są często wymieniane, obejmują:
Bezpośrednie kanały od dostawców usług internetowych. Nasza usługa obsługuje około 500 milionów żądań API dziennie i jest używana na wielu popularnych popularnych stronach internetowych. Dlatego zachęca się dostawców usług internetowych do dostarczania nam dokładnych aktualnych danych geolokalizacyjnych, aby ich klienci mogli cieszyć się wspaniałymi wrażeniami w sieci. Cały czas współpracujemy bezpośrednio z coraz większą liczbą dostawców usług internetowych.
Dane lokalizacji GPS. Możliwe jest zbieranie dokładnych informacji o lokalizacji za pomocą GPS na urządzeniach mobilnych. Możesz sparować go z adresem IP i wnioskami o topologię sieci, aby ustalić lokalizację zakresów IP, biorąc pod uwagę tylko kilka pomiarów.
Poprawki przesłane przez użytkownika. Kiedy źle ustalimy lokalizację (lub nie została zaktualizowana po zmianie), często szybko otrzymamy opinie od użytkowników i możemy ręcznie naprawić lokalizację lub zmodyfikować nasz algorytm, aby upewnić się, że jest poprawnie zlokalizowany przy następnym uruchomieniu nasz potok przetwarzania danych.
W przypadku naszego zbioru danych IP do firmy faktycznie usuwamy każdą nazwę domeny co miesiąc i odsyłamy do danych, które tam wyodrębniamy, z informacjami o własności IP, zapisami rwhois i nie tylko. Następnie używamy również danych skrobania domen, aby pokazać, które domeny są hostowane na jakich adresach IP, a także w naszym klasyfikatorze typu IP, a także w wielu innych źródłach danych, w celu ustalenia prawdopodobieństwa, że adres IP będzie używany głównie jako prywatny dostawca usług internetowych, firma lub dostawca hostingu. My także przeanalizować strukturę linków tych stron, i pokazać niektóre z tych danych na host.io .
źródło