Opcje standaryzatora adresów

9

Ok, więc dzięki ArcGIS 10, ESRI obniżyło „Standaryzację adresu” w nowych lokalizatorach, wiem, że nadal możesz użyć do tego lokalizatorów 9.3.1; ale mocno podejrzewam, że po wersji 10.1 będzie to coraz mniej dostępne. FGDC Adresowanie Standardowy kładzie ciężką wagę dobrych adresów mających przedrostek, prefiks kierunku, Street-Name, sufiks, wartości Suffic kierunku dobrego czystej postaci. I moja agencja potrzebuje tego samego. Czy istnieją inne narzędzia, których ludzie używają do pobierania adresów strukturalnych i analizowania ich w sposób niezawodny, aby można je było przechowywać? Czy któryś z nich jest bezpłatny?






* Aktualizacja: * Natknąłem się na to na CodePlex (parser adresów USA) i dało mi to naprawdę dobry punkt wyjścia. To naprawdę miłe, ponieważ zarządzany przeze mnie kod, którego mogę używać wszędzie, i jak dotąd ma bardzo wysoki wskaźnik skuteczności w rozkładaniu części, które mają być recenzowane linia po linii i część po części.

DEWright
źródło
1
Moja instalacja ArcGIS v10 ma ArcToolBox, Geocoding Tools, Standaryzuj adresy. Dane wejściowe mogą być tabelą lub klasą obiektów, więc powinno to działać z danymi odniesienia przestrzennego i / lub surowymi adresami. Czy tego szukasz?
klewis
1
Tak, ale gdy masz długą zdolność do przekazywania adresu do geokodera, a następnie odzyskaj wynik ze znormalizowaną odpowiedzią, wówczas możesz wykonać połączenie poziomu SOAP dla pojedynczego rekordu na raz. Teraz; jesteś w stanie zbudować usługę geoprzetwarzania, która jest hostem oddzielnym od reszty systemu geokodowania. Sprawili więc, że proces stał się bardziej złożony, a obecny system ma takie problemy; to nie jest wiarygodne.
DEWright

Odpowiedzi:

6

Analiza adresu jest skomplikowanym procesem, ponieważ jestem pewien, że dobrze o tym wiesz.

Korzystając z danych ZIP + 4 z USPS, możesz ustalić, czy ulica istnieje w danym mieście / stanie / kodzie pocztowym. Możesz nawet sprawdzić, czy numer podstawowy (numer domu) mieści się w prawidłowym zakresie ZIP + 4. Dostosowywanie nazw miast i ulic w celu poprawienia problemów z pisownią jest również możliwe przy użyciu list pisowni, a także dopasowania „brzmi jak”. Pobieranie adresu i parsowanie go w poszczególnych komponentach, a następnie porównywanie go z bazą danych znanych adresów jest jedynym sposobem, aby wiedzieć, że parsowanie zostało wykonane poprawnie.

Wiedza, że ​​adres mieści się w wyznaczonym obszarze, oraz świadomość, że jest to adres rzeczywisty i możliwy do dostarczenia, są odrębnymi celami. Pierwszy, przybliżenie adresu, jest czymś, co Google Goaps robi bardzo dobrze. Jest to jednak tylko przybliżenie. Googlemaps nie informuje Cię, czy adres jest rzeczywiście możliwy do dostarczenia, ale pokazuje, gdzie byłby na mapie, gdyby był prawdziwy. Jest to niezwykle cenne z punktu widzenia mapowania i mają one różny stopień dokładności.

Z pewnością baza danych USPS ma wady (wiele z nich), ale są one z pewnością bardziej dokładne i poprawne niż jakakolwiek inna pojedyncza baza danych adresów w USA i to na tym stopniu dokładności (i na tym, że jest stale aktualizowana), na których polegamy.

Pracuję również w SmartyStreets i chciałem dodać do rozmowy. Jeśli musisz zweryfikować mniej niż 250 adresów miesięcznie, interfejs API jest bezpłatny. Jeśli Twoja organizacja jest grupą non-profit , usługa jest całkowicie bezpłatna i bez ograniczeń.

Jeffrey
źródło
W mojej agencji budujemy oddzielną usługę do pracy nad częściami do geokodowania; gdzie zgromadzi dane hrabstwa i / lub miasta dla pierwszej warstwy walidacji; następnie przejdź do komercyjnych źródeł takich jak TomTom lub NavTeq przed Tygrysem. Gdzie bazujemy na złożonym geokoderze ESRI i dodajemy dodatkowe kroki lub gałęzie, aby porównać wynik źródłowy z innym i zwrócić wyższy wynik z dwóch lub trzech. Nasze wykorzystanie DB AIS / AMS z USPS pomaga w części „Dostarczalne” w połączeniu z danymi hrabstwa.
DEWright
Dziękuję za dzielenie się, Jeffrey. Wkrótce zmodyfikuję twoją odpowiedź, aby była zgodna z naszymi wytycznymi dotyczącymi witryny; przejrzyj nasze FAQ, aby uzyskać więcej informacji.
whuber
1

Tak, są narzędzia, darmowe zależą od tego, gdzie znajdują się twoje adresy. Istnieje wiele nie darmowych skruberów adresów licencjonowanych przez USPS. Jednym z nich jest ZP4 . Uważam, że dane wejściowe i wyjściowe są elastyczne w zależności od tego, jak obecnie przechowujesz dane i jak chcesz je przechowywać w przyszłości. Możesz wybrać wyjście danych dla adresów, które pasują do adresów możliwych do dostarczenia w danych USPS, na 7 fragmentów. Fragmenty te odpowiadają numerowi domu, kierunkowi, nazwie ulicy, sufiksowi ulicy, kierunkowi, skrótowi jednostki mieszkaniowej i numerowi mieszkania. Jest to drogie rozwiązanie najmu, które znalazłem.

ktreiche
źródło
1
Chociaż ZP4 jest bardzo tani (600 USD rocznie), warunki te sprawiają, że jestem trochę ostrożny i wygląda na to, że musisz uważać, jak go używasz.
blord-castillo
1

Pracuję w polu weryfikacji adresu, w rzeczywistości (firma o nazwie SmartyStreets) - gdzie dokonujemy weryfikacji adresu pocztowego (w Stanach Zjednoczonych).

Będziesz potrzebował certyfikowanego przez CASS dostawcy danych adresowych. Oprogramowanie tych firm zostało zatwierdzone przez USPS do dodawania brakujących informacji na adres i zwracania dokładnych wyników. Jedną z takich usług jest LiveAddress - lub jeśli masz listę adresów, jest Smartylist - która zapewni ci potrzebne informacje. Oba są do pewnego stopnia bezpłatne, ale potem dość przystępne.

W ArcGIS uważam, że interfejs API LiveAddress można zaimplementować programowo. Alternatywnie listę adresów można wyeksportować do arkusza kalkulacyjnego lub pliku CSV i przesłać do usługi czyszczenia listy.

Matt
źródło
Naprawdę nie szukam korekty lub certyfikatów luzem, do czego dąży CASS; więcej za lepsze analizowanie i wyszukiwanie w celu poprawienia złych adresów. Mam już bazy danych USPS AIS i AMS i teraz zaczynam budować logikę do analizowania i przeszukiwania rekordu z tych źródeł, jeśli nie są w pełni dopasowane. Spojrzę na linki, do których się odwołujesz; ale dążę do zbudowania rozwiązania, które można udostępnić dla większości popularnych adresów w USA po niższych kosztach. Tylko dlatego, że USPS AIS / AMS nie znajduje, nie oznacza to, że jest niepoprawny.
DEWright
@DEWright Masz rację. Istnieją adresy, które istnieją poza domeną USPS, ale zdecydowana większość z nich znajduje się w bazie danych USPS adresów dostarczalnych. Zarówno Fedex, jak i UPS mają niektóre adresy (zwykle zdalne), które dostarczają, a USPS nie dostarczy. Byłoby miło mieć wiarygodne źródło, które połączyłoby wszystkie te adresy. Trudność polega na tym, że USPS nie udostępnia dokładnie całej swojej bazy danych, ani Fedex, ani UPS. W przeważającej części są to dane zastrzeżone. Weryfikacja adresu służy nie tylko do wysyłania wiadomości.
Jeffrey
1

Odniosłem wielki sukces, korzystając z biblioteki parsera adresów us. Zbudowałem narzędzie python, które wykorzystuje bibliotekę do utworzenia przeanalizowanych pól adresowych. https://github.com/datamade/usaddress

ketar
źródło
0

Inną opcją dla adresów z USA jest YAddress . Poprawia również i weryfikuje adres przed podzieleniem go na komponenty. (Pracuję dla firmy, która to robi.)

Michael Diomin
źródło