Zaimplementowałem detektor funkcji oparty na rogach Harrisa . Działa dobrze większość razy, ale są przypadki, w których działa słabo. Muszę sprawić, aby działał na wielu różnych obrazach bez konfigurowania go indywidualnie.
Problem dotyczy wartości progowej detektora. Przy zbyt niskim ustawieniu detektor strzela zbyt wiele razy, co powoduje ogromną liczbę funkcji. Jeśli zostanie ustawiony zbyt wysoko, będzie za mało funkcji.
Częściowo rozwiązałem to przez ANMS (Adaptive Non-Maximal Suppression) w celu zmniejszenia liczby funkcji przed przypisaniem im wektorów deskryptorów.
Jednak obrazy takie jak ten stanowią problem:
Mają niski kontrast i nie mogę sobie pozwolić na zbyt niski próg ustawienia dla wszystkich zdjęć. Spowodowałoby to, że detektor działałby na tych obrazach, ale inne obrazy zawierałyby setki tysięcy funkcji, które będą wolno filtrować za pomocą ANMS, a to pogorszy ogólną wydajność.
Myślałem o dostosowaniu obrazu przed wykryciem funkcji. Może wyrównanie histogramu wystarczy. Może to być poprawna operacja, ponieważ globalna zmiana kontrastu nie ma wpływu na deskryptory funkcji (są one niezmienne dla zmiany jasności i kontrastu).
Może praca z adaptacyjnym progiem lub jakąś heurystyką działałaby lepiej.
Jakieś inne sugestie?
Odpowiedzi:
Możliwe byłoby wykonanie prostego wykrywania krawędzi (takiego jak Laplace) i wykorzystanie średniej intensywności wyniku jako podstawy progu dla narożników Harrisa. Gdy masz niski kontrast, uzyskasz mniej krawędzi i przy mniejszej intensywności, przy wysokim kontraście uzyskasz więcej krawędzi i przy wyższych intensywnościach.
Nie tylko ty zmagasz się z tym problemem. Jeśli masz dostęp do papierowych baz danych, może to być interesujące:
Może warto szukać więcej (auto) adaptacyjnego wykrywania rogu harrisa.
źródło
Czy naprawdę musisz używać narożników Harrisa? Po narożnikach Harrisa opracowano wiele funkcji o lepszych właściwościach. Dobry przegląd można znaleźć w tym artykule:
Opierając się na tym artykule oraz na moich osobistych doświadczeniach, sugerowałbym przejście na MSER (Maksymalnie stabilne regiony zewnętrzne) , a nawet połączyć je z DoG (Różnica Gaussów) - funkcje przedstawione po raz pierwszy jako część potoku SIFT.
Jeśli problem naprawdę jest w niskim kontraście , funkcje MSER powinny naprawdę cię uszczęśliwić: są (dość) niezmienne dla zmian w oświetleniu. Krótko mówiąc, są one połączonymi regionami obrazu stabilnymi poprzez szereg różnych progresywnych binaryzacji.
Proces wyodrębniania funkcji jest niezależny od obliczania deskryptorów, dlatego integracja nowych sposobów ekstrakcji funkcji z procesem nie powinna być trudna.
Poza tym słyszałem (ale nigdy tak naprawdę nie pracowałem) na rogach Harris Multiscale jako rozszerzenie do rogów Harrisa. Niewiele o nich wiem i osobiście nie mogę polecić żadnych materiałów do czytania na ten temat, dlatego zostawiam wyszukiwanie artykułów i wybieranie najciekawszych materiałów.
Ponadto, czy mogę zasugerować, że opublikowany obraz może mieć inne problemy niż niski kontrast . Z mojego osobistego doświadczenia, roślinność podobna do krzaków lub ewentualnie pola, które masz, a także piękne bąbelkowe chmury zwykle wytwarzają „cechy ogólne” - cechy, które zwykle mają równie podobne (lub odmienne) deskryptory, jak wiele innych cech.
W praktyce oznacza to, że podczas dopasowywania elementów na dwóch obrazach z innej perspektywy elementy wyodrębnione z tego rodzaju powierzchni zwykle były fałszywie dopasowane. Zrobiłem pracę magisterską, która w dużej części dotyczy ekstrakcji cech do wykorzystania w dopasowywaniu cech, a następnie wykorzystywana do obliczania transformacji homografii między dwoma obrazami, kiedy natknąłem się na ten problem. W tym czasie nie znalazłem żadnych innych artykułów opisujących ten problem, ale moja teza może być pomocna w ogólnym podejściu.
Wreszcie, po ustawieniu, progi i techniki, które działają dobrze na większości obrazów, wyodrębniają małe cechy tego rodzaju obrazów, ze względu na ich w większości jednorodne obszary. Tego rodzaju obrazy stwarzają problemy z dopasowywaniem funkcji (które można rozszerzyć o łączenie obrazów), pobieranie obrazów w oparciu o treść, i zakładam śledzenie, a także podobne aplikacje. Żadna metoda obecnie nie działa na nich całkiem dobrze.
Metody, które działają dobrze na tego rodzaju obrazach, a także typowe przypadki są obecnie badane i badane, takie jak podejście, nad którym zacząłem krótko pracować w tej odpowiedzi .
źródło