Próbuję, dla własnych celów edukacyjnych, opracować implementację algorytmu, który wyświetlałby książki, biorąc pod uwagę obraz półki z książkami, taki jak poniżej:
Pierwszym krokiem jest podzielenie obrazu na pojedyncze książki.
Mój algorytm w Mathematica to:
img = ColorConvert[Import["http://i.stack.imgur.com/IaLQk.jpg"], "GrayScale"]
- wykonaj podstawowe wykrywanie krawędzi i
usuń tekst i staraj się zachować długie linie
edge = DeleteSmallComponents[EdgeDetect[img, 3],Last[ImageDimensions[img]]/5]
następnie usuń niechciane poziome linie
lines = Sort[ImageLines[img5] /. {{0., _}, {_, _}} -> Sequence[]] Show[img, Graphics[{Thick, Orange, Line /@ lines}]]
Wyniki są jednak niezbyt dobre:
Moje pytania to:
- Jak mogę to poprawić, aby uzyskać lepsze wyniki?
- Czy jest na to lepszy sposób?
- jak dalej przetwarzać obrazy, aby zwiększyć dokładność na (późniejszym) etapie OCR?
- Jak wykorzystać informacje o kolorze, aby poprawić segmentację?
opencv
computer-vision
image-segmentation
Oren Pinsky
źródło
źródło
Odpowiedzi:
Oto link do dokumentu badawczego, który próbuje zrobić to samo, co chciałeś. To może ci pomóc. Korzystanie z funkcji obrazu Również fajny film na youtube
źródło
Jakiej metody używasz do wykrywania linii? Czy próbowałeś eksperymentować z LSD ?
Oto wyniki szybkiego testu przeprowadzonego przy użyciu LSD:
Na tym pierwszym obrazie pokazałem tylko pionowe segmenty linii o kącie od 75 do 105 stopni i długości większej niż obrazu:0.1∗height
Drugi obraz to wyniki z tym samym ograniczeniem kąta, ale bez uwzględnienia długości segmentów:
Możesz spróbować trochę z tym pograć, dowiedzieć się, jak wybrać najlepsze segmenty linii, rozszerzyć je na linie i być może uzyskać nieco lepsze wyniki niż te, które opublikowałeś.
źródło
Możesz spróbować wykonać wykrywanie krawędzi na poszczególnych domenach kolorów, a następnie połączyć je, używając wybranej metody wykrywania krawędzi.
W porównaniu z wykrywaniem krawędzi bezpośrednio na kolorowym obrazie, może dawać lepsze wyniki.
źródło
Można znaleźć papier z niedziałającego linku dostarczony przez isrisha. Łączenie cech obrazu i tekstu: hybrydowe podejście do rozpoznawania kręgosłupa książki mobilnej , Proc. 19. międzynarodowa konferencja ACM na temat multimediów, 2011 r. Można również sprawdzić inne artykuły Davida Chen i in. , na przykład tanie śledzenie zasobów za pomocą telefonów z aparatem wspomagającym lokalizację , Proc. SPIE 2010.
źródło