Przyglądałem się algorytmom wykrywania markerów do zastosowania z aplikacją opartą na kinektach, a większość pracy, jaką udało mi się znaleźć, koncentruje się oczywiście na wykrywaniu cech na „normalnych” obrazach.
Jednak sprzęt kinect zapewnia (zasadniczo po dostosowaniu) 11-bitową głębokość na piksel.
Ten obraz głębokości zawiera również różne artefakty wizualne z cieni rzucanych wokół krawędzi obiektów (patrz na przykład mocna czarna ramka w tym filmie http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).
Podczas gdy niektóre tradycyjne techniki widzenia maszynowego (np. Wykrywanie krawędzi) działają dobrze, inne nie, i wydaje się, że w sieci jest niewiele informacji na ten temat.
Jako prosty przykład użycie wartości głębokości sprawia, że wykrycie orientacji bloku znacznika po jego zlokalizowaniu jest banalne.
Czy ktoś widział jakieś dyskusje / dokumenty / itp. Dotyczące przetwarzania obrazu głębi w celu wykrycia funkcji?
Czy ktoś może polecić dobry algorytm do wykrywania znaczników „głębokości” (efektywnie bloków origami zamiast drukowanych znaczników czarno-białych)?
Do tej pory robiłem eksperymenty adhoc przy użyciu opencv do przetwarzania obrazów, ale nie jest to wystarczająco stabilne ani wystarczająco szybkie.
Jeśli łączysz się z komercyjnym produktem do widzenia maszynowego bez jakiejś próby, w odpowiedzi podaj, dlaczego uważasz, że jest to właściwe.
źródło
Odpowiedzi:
Moim ulubionym deskryptorem funkcji 2.5D / 3D do rejestracji i rozpoznawania jest obraz wirowania (oryginalny papier + więcej szczegółów w pracy doktorskiej i oprogramowanie dostępne na CMU).
Inne najnowsze osiągnięcia (wszystkie przeszukiwalne on-line odpowiednie algorytmy) obejmują: 3D-Sift, Histogram cech szybkiego punktu, Normalne wyrównane cechy promieniowe (NARF), Deskryptory jądra głębokości. Starsze metody po prostu wykorzystywały właściwości powierzchni, takie jak krzywizna i krawędzie, do identyfikowania łat regionu.
Który jest najlepszy Zależy od tego, co chcesz znaleźć, niezmienności punktu widzenia, dodatkowego bałaganu itp.
źródło
Zrozumiałeś wszystkie kluczowe słowa, jestem zaskoczony, że tak naprawdę nie znalazłeś żadnych powiązanych artykułów podczas szukania materiału.
Na szczęście mam dostęp do biblioteki cyfrowej IEEE Xplore. Nie potrzebowałem wcześniej żadnego z tych konkretnych algorytmów, ale wygląda to bardzo interesująco, więc oto kilka wyników szybkiego wyszukiwania, które moim zdaniem mogą być odpowiednie (nie oceniaj ich według tytułów, spójrz na ich streszczenia):
Niestety nie sądzę, abyś mógł uzyskać dostęp do któregokolwiek z tych artykułów za darmo, przynajmniej nie poprzez bibliotekę IEEE Xplore. Jeśli nie masz dostępu, prawdopodobnie możesz poradzić sobie z Google Scholar , a istnieją pewne bezpłatne papierowe bazy danych (korzystałem z bazy danych Mendeley, gdy jeszcze nie miałem dostępu do IEEE). Ponadto, po prostu przeglądanie części abstrakcyjnych lub losowych części artykułu czasami przynosi pewne rezultaty (możesz natknąć się na prawie ukończone, wcześniej opublikowane wersje artykułu).
Zapytania użyłem znaleźć wspomniane dokumenty były: 3D obrazu , głębia obrazu , Kinect . Możesz także wrzucić przetwarzanie podczas wyszukiwania pierwszych dwóch zapytań.
Mam nadzieję, że to pomoże niektórym! Jest mi przykro, że nie mogę się bardziej zagłębić w temat, brzmi naprawdę interesująco.
źródło