Czy istnieje sposób na określenie zestawu znaków używanego dla danego pliku kształtu?
25
Próba i błąd. Spróbuj otworzyć plik .dbf za pomocą Ms Excel lub OpenOffice przy użyciu różnych ustawień, aż wszystko będzie dobrze.
Spójrz na ten post, aby uzyskać więcej wskazówek: /programming/319095/how-do-i-determine-the-character-set-of-a-string
Istnieją dwa sposoby określania zestawu znaków dla pliku kształtu przez programy.
źródło
file
Narzędzie jest w stanie odgadnąć, kodowanie pliku tekstowego. Użyjogr2ogr
do konwersji, która zachowuje oryginalne kodowanie, jeśli nie ma.cpg
pliku :Przykładowe dane wyjściowe:
Przetestowałem to przy użyciu dwóch najczęstszych kodowań, UTF-8 i Latin1. Działa w systemie Ubuntu od razu po instalacji, nie jestem pewien co do systemu OS X. Nie znam
file
narzędzia w systemie Windows.UWAGA : Gdy tylko pojawi się odpowiedni
.cpg
plik, który wskazuje kodowanie,ogr2ogr
honoruje go, a wyjście będzie w UTF-8. Ale jeśli wyjście CSV wygląda poprawnie, wiesz, że informacje w.cpg
pliku są dokładne.źródło
Kolejna tabela do konwersji 29. bajtu * .dbf na stronę kodową: http://webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm
źródło