Zrozumienie teorii przestrzeni kosmicznej

10

W teorii skali przestrzeni reprezentacja skali przestrzeni sygnału (w przypadku obrazu , d = 2 ), jest wyrażony jako: L ( x , y ; t ) = g ( x , y ; t ) f ( x , y ) gdzie g ( x ,f(x),x=(x1,...,xd)d=2L(x,y;t)=g(x,y;t)f(x,y) jest jądrem gaussowskim o parametrze t, a jest splotem. Zmieniającparametr t otrzymujemy mniej lub bardziej wygładzony obraz. W rezultacie grubsza reprezentacja (parametr t ) nie będzie zawierać małych obiektów ani szumu.g(x,y;t)ttt

Chodzi przede wszystkim o znalezienie sposobu na wykrywanie funkcji niezmiennej w skali, prawda? W przypadku niektórych zdjęć w zmniejszonej kopii funkcje takie jak punkty kluczowe zostaną poprawnie wykryte, nawet jeśli rozmiar jest inny, bez znalezienia innych punktów kluczowych szumu.

  1. W pracy wykorzystują znormalizowane pochodne . δ ξ , γ - n o r m = t γ / 2 δ x . Jakie jest znaczenie użycia znormalizowanej pochodnej γ , w jaki sposób pomaga ona w niezmienności skali?γδξ,γnorm=tγ/2δxγ

  2. Z tego obrazu możemy zobaczyć, że w pobliżu tych samych pozycji znaleziono różne punkty kluczowe (różnej wielkości). Jak to możliwe?

Wykryte funkcje

Jeśli potrafisz wyjaśnić krok po kroku algorytm wykrywania funkcji niezmiennej w skali, byłoby to świetne. Co się właściwie dzieje? Pochodne mogą być przyjmowane przez lub t . Krople można wykryć, biorąc pochodną L przez zmienne ( x , y ) . W jaki sposób pomaga pochodna t ?x,ytL(x,y)t

Artykuł, który czytałem to: Wykrywanie funkcji z automatycznym wyborem skali

maximus
źródło

Odpowiedzi:

3
  1. γtt

  2. Można znaleźć punkty kluczowe w wielu skalach w tej samej lokalizacji. To dlatego, że szukasz lokalnych maksimów ponad skalami. Oto intuicja: pomyśl o wizerunku twarzy. W drobnej skali otrzymasz kroplę odpowiadającą nosowi. W skali kursu dostajesz kroplę odpowiadającą całej twarzy. Dwie plamy są wyśrodkowane w tym samym punkcie, ale mają różne skale.

  3. Oto cały algorytm:

    • Zdecyduj, które funkcje obrazu Cię interesują (np. Plamy, narożniki, krawędzie)
    • Zdefiniuj odpowiednią „funkcję detektora” pod względem pochodnych, np. Laplaciana dla obiektów blob.
    • Oblicz pochodne potrzebne do działania detektora w różnych skalach.
    • tmγ/2m
    • Oblicz funkcję detektora na całej przestrzeni skali.
    • x,y,t
    • To są twoje punkty zainteresowania lub kluczowe punkty.

Edytować:

  1. tγ/2
  2. txytxy
  3. Chcesz znaleźć lokalne maksima ponad skalami, ponieważ w tej samej lokalizacji możesz mieć funkcje obrazu o różnych rozmiarach. Pomyśl o obrazie koncentrycznych kręgów, jak byk. Zapewni to wysoką odpowiedź Laplaciana w kilku skalach. Albo wyobraź sobie obraz prawdziwego ludzkiego oka przefiltrowanego przez Laplaciana w różnych skalach. Otrzymasz wysoką odpowiedź w drobnej skali dla źrenicy, wysoką odpowiedź w średnim stopniu dla tęczówki i wysoką odpowiedź w grubej skali dla całego oka.

Chodzi o to, że nie wiesz, w jakiej skali cechy zainteresowania mogą wyprzedzić czas. Więc patrzysz na wszystkie skale.

Dima
źródło
tγ/2tttx,y
x,y,tt
@maximus Proszę zobaczyć edycję odpowiedzi.
Dima
@maximus, wcześniej się myliłem. gamma nie jest poziomem skali. Naprawiłem odpowiedź.
Dima