Używasz pyshp do konwersji pliku .csv na .shp?

10

Próbuję zrozumieć, w jaki sposób mogę użyć modułu csv w pythonie, aby otworzyć plik csv w tym samym folderze co skrypt Pythona, a następnie utworzyć plik shapefile przy użyciu pyshp modułu shapefile.

Plik csv wygląda tak, ale może zawierać kilka tysięcy wierszy rekordów:

id_nr;date;target;start_lat;start_lon
1;2012-05-21;navpoint 25x;55.123654;13.456954
1;2012-05-23;navpoint 11f;55.143654;12.456954
kogia
źródło

Odpowiedzi:

14

Moduł pyshp jest nieco trudny do zrozumienia, ale naprawdę przydatny, gdy go uruchomisz. Napisałem skrypt, który wczytuje w pliku CSV przykładowe dane i zapisuje plik kształtu z danymi przechowywanymi jako atrybuty prawidłowych typów danych. Tworzenie danych pyshp / xbase zawsze było dla mnie trudne, dopóki nie znalazłem tego podręcznika użytkownika dla formatu xbase i w wyniku tego pytania napisałem na moim blogu notatkę dotyczącą odpowiednich typów danych pyshp, z których część wkleiłem poniżej :

  • C to znaki ASCII
  • N jest liczbą całkowitą podwójnej precyzji ograniczoną do około 18 znaków
  • D jest datą w formacie RRRRMMDD, bez spacji i łączników między sekcjami.
  • F jest dla liczb zmiennoprzecinkowych o takich samych limitach długości jak N
  • L jest dla danych logicznych, które są przechowywane w tabeli atrybutów pliku kształtu jako krótka liczba całkowita jako 1 (prawda) lub 0 (fałsz). Wartości, które może otrzymać, to 1, 0, y, n, Y, N, T, F lub wbudowane python True i False

Pełny wykaz jest następujący:

import shapefile as shp
import csv

out_file = 'GPS_Pts.shp'

#Set up blank lists for data
x,y,id_no,date,target=[],[],[],[],[]

#read data from csv file and store in lists
with open('input.csv', 'rb') as csvfile:
    r = csv.reader(csvfile, delimiter=';')
    for i,row in enumerate(r):
        if i > 0: #skip header
            x.append(float(row[3]))
            y.append(float(row[4]))
            id_no.append(row[0])
            date.append(''.join(row[1].split('-')))#formats the date correctly
            target.append(row[2])

#Set up shapefile writer and create empty fields
w = shp.Writer(shp.POINT)
w.autoBalance = 1 #ensures gemoetry and attributes match
w.field('X','F',10,8)
w.field('Y','F',10,8)
w.field('Date','D')
w.field('Target','C',50)
w.field('ID','N')

#loop through the data and write the shapefile
for j,k in enumerate(x):
    w.point(k,y[j]) #write the geometry
    w.record(k,y[j],date[j], target[j], id_no[j]) #write the attributes

#Save shapefile
w.save(out_file)

Mam nadzieję, że to pomoże.

sgrieve
źródło
Bardzo fajny scenariusz. Wystąpił błąd, ponieważ nie odczytał go jako tekstu, więc zmieniłem ten wiersz: z otwartym ('input.csv', 'rt') jako csvfile:
againstflow
1
Myślę, że możesz poprawić wydajność, używając next (r) przed pętlą for, aby pominąć nagłówek zamiast sprawdzania za pomocą instrukcji if.
rovyko
@sgrieve - ten skrypt konwertuje plik csv z określonymi wcześniej określonymi polami. Chciałbym ogólny skrypt do konwersji dowolnego pliku csv w klasę funkcji. Być może istnieją przydatne funkcje Arcpy, aby to osiągnąć?
Waterman
2

Alternatywnie nie musisz przechowywać danych na listach.

# import libraries
import shapefile, csv

# create a point shapefile
output_shp = shapefile.Writer(shapefile.POINT)
# for every record there must be a corresponding geometry.
output_shp.autoBalance = 1
# create the field names and data type for each.
# you can insert or omit lat-long here
output_shp('Date','D')
output_shp('Target','C',50)
output_shp('ID','N')
# count the features
counter = 1
# access the CSV file
with open('input.csv', 'rb') as csvfile:
    reader = csv.reader(csvfile, delimiter=',')
    # skip the header
    next(reader, None)
    #loop through each of the rows and assign the attributes to variables
    for row in reader:
        id= row[0]
        target= row[1]
        date = row[2]
        # create the point geometry
        output_shp.point(float(longitude),float(latitude))
        # add attribute data
        output_shp.record(id, target, date)
        print "Feature " + str(counter) + " added to Shapefile."
        counter = counter + 1
# save the Shapefile
output_shp.save("output.shp")

Możesz znaleźć działający przykład tej implementacji tutaj .

Clubdebambos
źródło