Dwuliniowa interpolacja danych punktowych na rastrze w Pythonie?

12

Mam raster, z którym chciałbym wykonać interpolację punktową. Oto gdzie jestem:

from osgeo import gdal
from numpy import array

# Read raster
source = gdal.Open('my_raster.tif')
nx, ny = source.RasterXSize, source.RasterYSize
gt = source.GetGeoTransform()
band_array = source.GetRasterBand(1).ReadAsArray()
# Close raster
source = None

# Compute mid-point grid spacings
ax = array([gt[0] + ix*gt[1] + gt[1]/2.0 for ix in range(nx)])
ay = array([gt[3] + iy*gt[5] + gt[5]/2.0 for iy in range(ny)])

Do tej pory wypróbowałem funkcję interp2d SciPy :

from scipy import interpolate
bilinterp = interpolate.interp2d(ax, ay, band_array, kind='linear')

jednak pojawia się błąd pamięci w moim 32-bitowym systemie Windows z rastrem 317 × 301:

Traceback (most recent call last):
  File "<interactive input>", line 1, in <module>
  File "C:\Python25\Lib\site-packages\scipy\interpolate\interpolate.py", line 125, in __init__
    self.tck = fitpack.bisplrep(self.x, self.y, self.z, kx=kx, ky=ky, s=0.)
  File "C:\Python25\Lib\site-packages\scipy\interpolate\fitpack.py", line 873, in bisplrep
tx,ty,nxest,nyest,wrk,lwrk1,lwrk2)
MemoryError

Przyznam, że mam ograniczone zaufanie do tej funkcji SciPy, ponieważ parametry bounds_errorlub fill_valuenie działają zgodnie z dokumentacją. Nie rozumiem, dlaczego powinienem mieć błąd pamięci, ponieważ mój raster ma wymiary 317 × 301, a algorytm dwuliniowy nie powinien być trudny.

Czy ktoś napotkał dobry algorytm interpolacji dwuliniowej, najlepiej w Pythonie, być może dostosowany do NumPy? Wszelkie wskazówki lub porady?


(Uwaga: algorytm interpolacji najbliższego sąsiada to łatwe ciasto:

from numpy import argmin, NAN

def nearest_neighbor(px, py, no_data=NAN):
    '''Nearest Neighbor point at (px, py) on band_array
    example: nearest_neighbor(2790501.920, 6338905.159)'''
    ix = int(round((px - (gt[0] + gt[1]/2.0))/gt[1]))
    iy = int(round((py - (gt[3] + gt[5]/2.0))/gt[5]))
    if (ix < 0) or (iy < 0) or (ix > nx - 1) or (iy > ny - 1):
        return no_data
    else:
        return band_array[iy, ix]

... ale zdecydowanie wolę metody interpolacji dwuliniowej)

Mike T.
źródło
1
Może dostajesz, MemoryErrorponieważ NumPy próbuje uzyskać dostęp poza twoim band_array? Powinieneś sprawdzić axi ay.
ol
1
ax, mogą mieć problem, jeśli siatka w ogóle zostanie obrócona. Lepiej byłoby przekształcić punkty interpolacji w punkty we współrzędne pikseli lub danych. Ponadto, jeśli występuje z nimi problem off-by-one, możesz wyjść poza rozmiar zespołu.
Dave X
Prawidłowe, obrócone siatki wymagają transformacji do przestrzeni siatki, a następnie z powrotem do przestrzeni współrzędnych. Wymaga to odwrotności współczynników transformacji afinicznej w gt.
Mike T

Odpowiedzi:

7

Przetłumaczyłem poniższy wzór (z Wikipedii ) na Python-speak, aby uzyskać następujący algorytm, który wydaje się działać.

from numpy import floor, NAN

def bilinear(px, py, no_data=NAN):
    '''Bilinear interpolated point at (px, py) on band_array
    example: bilinear(2790501.920, 6338905.159)'''
    ny, nx = band_array.shape
    # Half raster cell widths
    hx = gt[1]/2.0
    hy = gt[5]/2.0
    # Calculate raster lower bound indices from point
    fx = (px - (gt[0] + hx))/gt[1]
    fy = (py - (gt[3] + hy))/gt[5]
    ix1 = int(floor(fx))
    iy1 = int(floor(fy))
    # Special case where point is on upper bounds
    if fx == float(nx - 1):
        ix1 -= 1
    if fy == float(ny - 1):
        iy1 -= 1
    # Upper bound indices on raster
    ix2 = ix1 + 1
    iy2 = iy1 + 1
    # Test array bounds to ensure point is within raster midpoints
    if (ix1 < 0) or (iy1 < 0) or (ix2 > nx - 1) or (iy2 > ny - 1):
        return no_data
    # Calculate differences from point to bounding raster midpoints
    dx1 = px - (gt[0] + ix1*gt[1] + hx)
    dy1 = py - (gt[3] + iy1*gt[5] + hy)
    dx2 = (gt[0] + ix2*gt[1] + hx) - px
    dy2 = (gt[3] + iy2*gt[5] + hy) - py
    # Use the differences to weigh the four raster values
    div = gt[1]*gt[5]
    return (band_array[iy1,ix1]*dx2*dy2/div +
            band_array[iy1,ix2]*dx1*dy2/div +
            band_array[iy2,ix1]*dx2*dy1/div +
            band_array[iy2,ix2]*dx1*dy1/div)

Zauważ, że wynik zostanie zwrócony z pozornie większą precyzją niż dane źródłowe, ponieważ jest on klasyfikowany w górę do dtype('float64')typu danych NumPy . Można użyć wartości zwracanej za pomocą, .astype(band_array.dtype)aby typ danych wyjściowych był taki sam jak tablica wejściowa.

wzór interpolacji dwuliniowej

Mike T.
źródło
3

Próbowałem lokalnie, aby uzyskać podobne wyniki, ale jestem na platformie 64-bitowej, więc nie osiągnęło limitu pamięci. Być może zamiast tego spróbuj interpolować małe fragmenty tablicy na raz, tak jak w tym przykładzie .

Możesz to również zrobić za pomocą GDAL, z wiersza poleceń byłoby to:

gdalwarp -ts $XSIZE*2 0 -r bilinear input.tif interp.tif

Aby wykonać równoważną operację w Pythonie, użyj ReprojectImage () :

mem_drv = gdal.GetDriverByName('MEM')
dest = mem_drv.Create('', nx, ny, 1)

resample_by = 2
dt = (gt[0], gt[1] * resample_by, gt[2], gt[3], gt[4], gt[5] * resample_by)
dest.setGeoTransform(dt)

resampling_method = gdal.GRA_Bilinear    
res = gdal.ReprojectImage(source, dest, None, None, resampling_method)

# then, write the result to a file of your choice...    
scw
źródło
Moje dane punktowe, które chciałbym interpolować, nie są regularnie rozmieszczone, więc nie mogę użyć wbudowanej ReprojectImagetechniki GDAL .
Mike T
1

W przeszłości miałem dokładny problem i nigdy nie rozwiązałem go za pomocą interpolate.interp2d. Odniosłem sukces, używając scipy.ndimage.map_coordinates . Spróbuj wykonać następujące czynności:

scipy.ndimage.map_coordinates (tablica_pasów, [ax, ay]], kolejność = 1)

Wydaje się, że daje to taką samą wydajność jak dwuliniowa.

Matthew Snape
źródło
Byłem tym trochę zaskoczony, ponieważ nie jestem pewien, w jaki sposób wykorzystywane są źródłowe współrzędne rastrowe (zamiast używania współrzędnych pikselowych). Widzę, że jest „wektoryzowany” w celu rozwiązania wielu punktów.
Mike T
Zgadzam się, naprawdę nie rozumiem scipy. Twoje numpy rozwiązanie znacznie lepiej.
Matthew Snape
0

scipy.interpolate.interp2d () działa dobrze z bardziej nowoczesnym scipy. Myślę, że starsze wersje zakładają nieregularne siatki i nie wykorzystują zwykłych siatek. Otrzymuję ten sam błąd, co ty z Scipy. wersja = 0.11.0, ale na scipy. wersja = 0.14.0, na szczęście działa na niektórych modelach o rozdzielczości 1600 x 1600.

Dziękuję za wskazówki w twoim pytaniu.

#!/usr/bin/env python

from osgeo import gdal
from numpy import array
import argparse

parser = argparse.ArgumentParser()
parser.add_argument("filename",help='raster file from which to interpolate a (1/3,1/3) point from from')
args = parser.parse_args()

# Read raster
source = gdal.Open(args.filename)
nx, ny = source.RasterXSize, source.RasterYSize
gt = source.GetGeoTransform()
band_array = source.GetRasterBand(1).ReadAsArray()
# Close raster
source = None

# Compute mid-point grid spacings
ax = array([gt[0] + ix*gt[1] + gt[1]/2.0 for ix in range(nx)])
ay = array([gt[3] + iy*gt[5] + gt[5]/2.0 for iy in range(ny)])

from scipy import interpolate
bilinterp = interpolate.interp2d(ax, ay, band_array, kind='linear')

x1 = gt[0] + gt[1]*nx/3
y1 = gt[3] + gt[5]*ny/3.

print(nx, ny, x1,y1,bilinterp(x1,y1))

####################################

$ time ./interp2dTesting.py test.tif 
(1600, 1600, -76.322, 30.70889, array([-8609.27777778]))

real    0m4.086s
user    0m0.590s
sys 0m0.252s
Dave X
źródło