Tensorflow nie może pobrać `image.shape` z metody w` dataset.map (mapFn) `

10

Próbuję zrobić tensorflowodpowiednik torch.transforms.Resize(TRAIN_IMAGE_SIZE), który zmienia rozmiar najmniejszego wymiaru obrazu TRAIN_IMAGE_SIZE. Coś takiego

def transforms(filename):
  parts = tf.strings.split(filename, '/')
  label = parts[-2]

  image = tf.io.read_file(filename)
  image = tf.image.decode_jpeg(image)
  image = tf.image.convert_image_dtype(image, tf.float32)

  # this doesn't work with Dataset.map() because image.shape=(None,None,3) from Dataset.map()
  image = largest_sq_crop(image) 

  image = tf.image.resize(image, (256,256))
  return image, label

list_ds = tf.data.Dataset.list_files('{}/*/*'.format(DATASET_PATH))
images_ds = list_ds.map(transforms).batch(4)

Prosta odpowiedź jest tutaj: Tensorflow: Przytnij największy centralny kwadratowy obszar obrazu

Ale kiedy używam metody z tf.data.Dataset.map(transforms), dostaję się shape=(None,None,3)od środka largest_sq_crop(image). Metoda działa dobrze, gdy nazywam ją normalnie.

Michał
źródło
1
Uważam, że problem dotyczy tego, że EagerTensorsnie są one dostępne, Dataset.map()więc kształt jest nieznany. Czy jest w pobliżu praca?
Michael
Czy możesz podać definicję largest_sq_crop?
jakub

Odpowiedzi:

1

Znalazłem odpowiedź Miało to związek z faktem, że moja metoda zmiany rozmiaru działała dobrze przy szybkim wykonywaniu, np. tf.executing_eagerly()==TrueNie powiodła się, gdy została użyta wewnątrz dataset.map(). Najwyraźniej w tym środowisku wykonawczym tf.executing_eagerly()==False.

Mój błąd polegał na tym, że rozpakowywałem kształt obrazu, aby uzyskać wymiary do skalowania. Wydaje się, że wykonywanie wykresu Tensorflow nie zapewnia dostępu do tensor.shapekrotki.

  # wrong
  b,h,w,c = img.shape
  print("ERR> ", h,w,c)
  # ERR>  None None 3

  # also wrong
  b = img.shape[0]
  h = img.shape[1]
  w = img.shape[2]
  c = img.shape[3]
  print("ERR> ", h,w,c)
  # ERR>  None None 3

  # but this works!!!
  shape = tf.shape(img)
  b = shape[0]
  h = shape[1]
  w = shape[2]
  c = shape[3]
  img = tf.reshape( img, (-1,h,w,c))
  print("OK> ", h,w,c)
  # OK>  Tensor("strided_slice_2:0", shape=(), dtype=int32) Tensor("strided_slice_3:0", shape=(), dtype=int32) Tensor("strided_slice_4:0", shape=(), dtype=int32)

Korzystałem z wymiarów kształtu w dalszej części mojej dataset.map()funkcji i zwrócił on następujący wyjątek, ponieważ otrzymywał Nonezamiast wartości.

TypeError: Failed to convert object of type <class 'tuple'> to Tensor. Contents: (-1, None, None, 3). Consider casting elements to a supported type.

Kiedy przełączyłem się na ręczne rozpakowywanie kształtu tf.shape(), wszystko działało dobrze.

Michał
źródło