Jakie są zalety i wady różnych formatów danych (wydajność, rozmiar pliku itp.) W przypadku otwartej dystrybucji danych?
Nasza organizacja chce publikować dane jako dane otwarte. Nie ma jednak jasnego pojęcia, jakich formatów danych użyć. Oczywiście im bardziej „otwarty” jest format danych, tym łatwiej jest z niego korzystać.
Które formaty danych są najbardziej „otwarte”, a zatem najbardziej przydatne do dystrybucji otwartych danych, biorąc pod uwagę następujące typy ?:
- dane rastrowe (myślę: GeoTIFF, Erdas Wyobraź sobie IMG?)
- dane wektorowe (myślę: GML, CSV, ESRI Shapefile, DXF?)
- dane tabelaryczne (myślę: CSV?)
- Dane 3D (Myślę: CityGML?)
- Punkt 3D mógł / LIDAR (Myślę: LAS?)
- czy coś tutaj zapominam?
Ponadto, jeśli istnieje dokumentacja dotycząca otwartych formatów danych, jestem bardzo zainteresowany, jeśli chcesz się nimi podzielić.
data
file-formats
Mark Verschuur
źródło
źródło
Odpowiedzi:
Wiedeńska inicjatywa otwartych danych ( http://data.wien.gv.at ) korzysta z Geoservera, aby zapewnić dostęp do geodanych rastrowych i wektorowych za pośrednictwem usług WMS i WFS Geoserver . Ma to wiele zalet: użytkownicy mogą pobierać dane w różnych formatach do użytku offline (np. Geojson, KML lub spakowane pliki Shapefiles) lub korzystać z usług na żywo, osadzając je w mapach internetowych lub projektach GIS.
źródło
Dla tabelarycznego pliku csv. Excel jest w najlepszym razie zbyt skomplikowany, aw najgorszym całkowicie niedostępny. Dostęp nie jest dostępny, a PDF to policzek.
W przypadku geojsonów, geojson, jego tekst jest dobrze obsługiwany i nie ma technicznych ograniczeń, które ma jedyny inny możliwy format (plik kształtu). Również chyba, że masz bardzo dobry powód, powinien to być WGS84, pamiętając, że większość użytkowników będzie w innym stanie i nie będzie chciała stanu płaszczyzny.
źródło
Bardzo lubię NetCDF dla danych ciągłych / macierzowych (tj. Rastrów). Plusy dla NetCDF to:
Jedynym minusem NetCDF4, który widzę, jest niezbyt dobra obsługa standardowych pakietów GIS, takich jak ArcGIS i QGIS (choć bardzo chciałbym być naprawiony!).
EDYCJA Niektóre inne pakiety obsługujące NetCDF
Niektóre standardowe języki programowania obsługujące NetCDF (choć uczciwie, wszystko, co potrafi czytać HDF, może czytać NetCDF4):
Użytkownicy matematyki i statystyk mają:
W szczególności w GIS:
Jeśli chcesz szybko przejrzeć plik NetCDF, skorzystałbym z wieloplatformowej platformy Panoply z NASA. A jeśli interesuje Cię więcej, UCAR Unidata ma listę oprogramowania .
źródło
Powiedziałbym:
Formaty te są łatwe do odczytania przez oprogramowanie Open Source i można je łatwo przekształcić na dowolny inny format wymagany dla określonych aplikacji.
Również +1 za otwarcie danych!
źródło
Praktycznie to samo pytanie pojawiło się na opendata.SE: Jakie są najbardziej przydatne formaty do publikowania danych geoprzestrzennych?
Mam nadzieję, że nie naruszam żadnych zasad, cytując tam swoją odpowiedź:
Moje doświadczenie w tworzeniu map z kilku rządowych zbiorów danych:
W przypadku danych punktowych CSV jest najlepszy, z kolumnami „lat” i „lon”. Bardzo łatwa w obsłudze w szerokim zakresie narzędzi, w tym edytorach tekstu, arkuszach kalkulacyjnych itp. Istnieją dwie wady:
.vrt
pliku towarzyszącego.lat
ilon
nie są całkowicie standardowe. Wiele narzędzi jest dość liberalnych pod względem akceptacji.W przypadku linii i wielokątów w malejącej kolejności preferencji:
Szczerze mówiąc, najlepszą odpowiedzią jest prawdopodobnie „wszyscy”. Wyświadcz wszystkim przysługę i opublikuj dane w CSV (jeśli punkt), GeoJSON, skompresowanym pliku Shapefile i KMZ.
źródło