Algorytmy rejestracji obrazu są zwykle oparte na cechach punktowych, takich jak SIFT (Scale-Invariant Feature Transform).
Widziałem pewne odniesienia do elementów linii, ale zastanawiałem się, czy można dopasować segmenty obrazu zamiast punktów . Na przykład dane źródło i przekształcony obraz:
Na każdym z nich mogę wykonać wykrywanie krawędzi, rozmycie i transformację zalewową:
Niestety segmentacja okazała się zbyt różna dla każdego obrazu, aby pasowała do poszczególnych segmentów.
Widziałem kilka artykułów na temat pasujących kształtów i deskryptorów kształtów, które są niezmienne dla przekształceń afinicznych, więc ten obszar wydaje się obiecujący ...
Czy są jakieś metody segmentacji bardziej odporne na zniekształcenie (a nawet projekcję) deformacji obrazu?
Odpowiedzi:
MSER (Maksymalnie stabilne regiony ekstremalne) to regiony, a nie punkty. I są niezmienne w celu wywołania transformacji. Ale ściśle mówiąc, nie jest to metoda segmentacji
Mówiąc nieformalnie, chodzi o to, aby znaleźć obiekty BLOB o różnych progach, a następnie wybrać obiekty BLOB, które mają najmniejszą zmianę kształtu / obszaru w zakresie progów. Regiony te powinny być stabilne dla szerokiego zakresu przekształceń skali szarości i geometrycznych.
źródło
Obecnie pracuję nad CBIR przy użyciu Drzew Składowych , co powinno być stosunkowo nowym pomysłem. Niektóre spodziewane zalety używania drzew komponentów do opisywania obrazów to:
Gdy rozpocząłem badania związane z tym tematem, mam niejasne wyobrażenie o moich celach: reprezentuj obraz za pomocą drzewa komponentów, a następnie porównaj wspomniane drzewa komponentów, albo bezpośrednio, znajdując wektoryzację. Prawdopodobnie będę w stanie powiedzieć znacznie więcej za kilka tygodni (lub miesięcy), ale na razie mogę zaoferować tylko listę artykułów poleconych mi jako wstęp do drzew składowych (jeszcze ich nie przeczytałem):
Mogę zaktualizować odpowiedź, jeśli znajdę coś istotnego.
Ponadto, jeśli Twoim celem jest, w pewnym sensie, dokładniejsze dopasowanie regionów obrazu zamiast tylko punktów , ponieważ regiony mogą być bardziej dyskryminujące, pojawiła się miła sugestia w J. Sivic i A. Zisserman: „Wideo Google: pobieranie tekstu Podejście do dopasowywania obiektów w filmach ” .
Mam na myśli rozdział dotyczący spójności przestrzennej , w którym grupa dopasowań między punktami charakterystycznymi jest akceptowana tylko wtedy, gdy punkty charakterystyczne zachowują podobną konfigurację przestrzenną na obu obrazach. Zatem dopasowanie jest nie tylko zależne od typu wyodrębnionego elementu (DoG, MSER, ...) lub deskryptora (SIFT), ale także patrzy na szersze otoczenie punktu cechy, czyniąc go (przynajmniej trochę) zależny od regionu.
źródło