Jakie są metody wykorzystywane przez usługi GeoIP oprócz informacji WHOIS? [Zamknięte]

11

Zastanawiałem się tylko, w jaki sposób usługi GeoIP gromadzą dane o lokalizacji geograficznej adresów IP, oprócz sprawdzania informacji o adresie WHOIS. Na przykład natknąłem się na tę stronę internetową, która mówi, że adres IP 74.207.244.221 znajduje się w Fremont w Kalifornii: https://ipinfo.io/74.207.244.221

Ale nie mogę znaleźć tych informacji w tej informacji whois IP. ipinfo.io stwierdza, że:

Początkowo nasz interfejs API korzystał z danych MaxMind, ale byliśmy bardzo zajęci pracą nad tworzeniem własnych danych geolokalizacyjnych. Poczyniliśmy duże postępy i teraz wykorzystujemy własne dane do obsługi około połowy wszystkich wniosków. Nadal jednak cofamy się do danych MaxMind

Zainteresowało mnie to, w jaki sposób usługi takie jak ipinfo.io i MaxMind zbierają dane GeoIP?

Uczeń
źródło

Odpowiedzi:

11

Takie usługi zazwyczaj wykorzystują 3 sposoby geolokalizacji adresu IP:

  1. Przechodzenie przez bazy danych Whois w celu znalezienia adresu;
  2. Śledzenie zwrotnych zapytań DNS w celu znalezienia wskazówek na podstawie rekordów nazw domen lub śledzenie ścieżki pakietu wysyłanego do miejsca docelowego, co może również dawać wskazówki (na przykład za pomocą traceroute).
  3. I na koniec używają triangulacji RTT.

Triangulacja w obie strony (RTT) to metoda stosowana do uzyskania przybliżonej geolokalizacji adresu IP poprzez pomiar opóźnienia ping z trzech różnych lokalizacji.

Na przykład, jeśli masz trzy serwery rozproszone po całym świecie w kształcie trójkąta, a jeśli pingujesz adres IP ze wszystkich trzech i uzyskujesz te same wyniki dla opóźnienia, oznacza to, że adres IP znajduje się dokładnie w środek tego trójkąta. Jest to sposób, w jaki działa triangulacja, jednak w tym przypadku jest on używany z pingami ICMP.

Zasoby, które możesz przeczytać:
Co to jest ping? @ Wikipedia
Artykuł SIGCOMM o triangulacji RTT

Fanatyczna
źródło
5
Wow, nigdy bym nie pomyślał, że istnieje triangulacja oparta na RTT. Ciekawy. Jeśli więc jakiś serwer chce uniknąć geolokalizacji, może wprowadzić losowe opóźnienie w odpowiedziach ICMP.
Uczeń
Chciałbym dodać, że pomocne może być spojrzenie na tracert / traceroute, jak napisano na iplocation.net: „Możesz użyć polecenia„ traceroute ”, aby znaleźć wskazówki dotyczące lokalizacji adresu IP. Nazwy routerów, przez które pakiety przepływające z hosta do hosta docelowego mogą wskazywać na ścieżkę geograficzną ostatecznej lokalizacji. ”
Uczeń
1
@ Uczeń to fajny dodatek, który jednak jest już w mojej odpowiedzi w postaci „śledzenia zapytań zwrotnych DNS”. Chociaż traceroute tak naprawdę tego nie robi, pokazuje wszystkie domeny / adresy, przez które przechodzi zapytanie. Dodam notatkę, aby była bardziej przejrzysta :)
Fanatique
5

Jestem założycielem IPinfo , więc zdecydowanie mogę podać kilka szczegółów na ten temat! Nie ma ani jednej metody, której używamy, ani jednego źródła danych, aby stworzyć własną bazę danych geolokalizacji (ani żadnego z naszych innych zestawów danych, takich jak adres IP do firmy lub adres IP do przewoźnika). Jest to mieszanka różnych zestawów danych, technik przetwarzania danych i wniosków wyciągniętych z tego od kilku lat!

Niektóre źródła danych i techniki, które nie są często wymieniane, obejmują:

  • Bezpośrednie kanały od dostawców usług internetowych. Nasza usługa obsługuje około 500 milionów żądań API dziennie i jest używana na wielu popularnych popularnych stronach internetowych. Dlatego zachęca się dostawców usług internetowych do dostarczania nam dokładnych aktualnych danych geolokalizacyjnych, aby ich klienci mogli cieszyć się wspaniałymi wrażeniami w sieci. Cały czas współpracujemy bezpośrednio z coraz większą liczbą dostawców usług internetowych.

  • Dane lokalizacji GPS. Możliwe jest zbieranie dokładnych informacji o lokalizacji za pomocą GPS na urządzeniach mobilnych. Możesz sparować go z adresem IP i wnioskami o topologię sieci, aby ustalić lokalizację zakresów IP, biorąc pod uwagę tylko kilka pomiarów.

  • Poprawki przesłane przez użytkownika. Kiedy źle ustalimy lokalizację (lub nie została zaktualizowana po zmianie), często szybko otrzymamy opinie od użytkowników i możemy ręcznie naprawić lokalizację lub zmodyfikować nasz algorytm, aby upewnić się, że jest poprawnie zlokalizowany przy następnym uruchomieniu nasz potok przetwarzania danych.

W przypadku naszego zbioru danych IP do firmy faktycznie usuwamy każdą nazwę domeny co miesiąc i odsyłamy do danych, które tam wyodrębniamy, z informacjami o własności IP, zapisami rwhois i nie tylko. Następnie używamy również danych skrobania domen, aby pokazać, które domeny są hostowane na jakich adresach IP, a także w naszym klasyfikatorze typu IP, a także w wielu innych źródłach danych, w celu ustalenia prawdopodobieństwa, że ​​adres IP będzie używany głównie jako prywatny dostawca usług internetowych, firma lub dostawca hostingu. My także przeanalizować strukturę linków tych stron, i pokazać niektóre z tych danych na host.io .

Ben Dowling
źródło
Dzięki! Nie spodziewałem się, że założyciel tej strony odpowie na moje pytanie :) To było bardzo interesujące.
Uczeń