Wykrywanie typu danych podczas ładowania tabeli ArcGIS

10

Podczas dodawania warstw tabel z plików Excel ArcGIS próbuje odgadnąć typy danych :

Microsoft Excel nie wymusza typów pól dla wartości podczas wprowadzania danych, tak jak robią to standardowe bazy danych. Dlatego typ pola określony w programie Excel nie jest używany do określania typu pola ujawnionego w ArcGIS. Zamiast tego typ pola w ArcGIS jest określany przez skanowanie wartości w pierwszych ośmiu wierszach dla tego pola. Jeśli skanowanie znajdzie mieszane typy danych w jednym polu, pole to zostanie zwrócone jako pole ciągu, a wartości zostaną przekonwertowane na ciągi.

Czy ktoś wie, jakie reguły heurystyczne są tutaj stosowane?

fmark
źródło
2
W przeszłości, kiedy musiałem pracować z danymi Excela, często byłem w stanie skłonić klienta do wyrażenia zgody na używanie plików .csv (które obsługują zarówno arcgis, jak i excel).
Kirk Kuykendall

Odpowiedzi:

4

Nie jestem pewien, czy to pomaga w konkretnym pytaniu i być może już je widziałeś, ale zobacz te linki z bloga Esri ArcGIS i dokumentów pomocy, z których oba zatytułowane są „Formatowanie tabeli Excela do użycia w ArcGIS” :

najważniejsze:

Excel workbook and worksheet names should not contain spaces.

Field names must:
   - start with a letter.
   - contain only letters, numbers, and underscores.
   - not exceed 64 characters.

ArcMap scans first eight rows to determine field type. 
If mixed types encountered field is converted to text.

Numeric fields are converted to the double data type.
ArcMap can only read the first 255 characters of a cell. 
PolyGeo
źródło
2

Ostatnie dwa zdania dostarczają całkiem niezłego pomysłu na używaną heurystykę: skanuj tylko pierwsze osiem wierszy w poszukiwaniu mieszanych typów danych, wszystko zmieszane jest przekształcane na ciągi. Bez dalszych informacji z ESRI lub poprzez wiele testów nie możemy nic więcej na ten temat powiedzieć, ponieważ nie mamy niestety kodu źródłowego.

Problem z używaniem programu Excel do pracy z „prawdziwą analizą” polega na tym, że zasadniczo jest to dwuwymiarowy program układu: typy danych nie są wymuszane, a rozróżnienie między danymi a ich prezentacją nie jest wyraźnie określone.

scw
źródło