Rozpoznawanie obrazu

11

Poszukuje systemu typu open source, który umożliwia komercyjne wykorzystanie rozpoznawania obrazów na ogromnej i organicznie rosnącej kolekcji obrazów 2D, gdzie jedynymi znanymi odmianami będą:

  • Skalowanie rozmiaru obrazu,
  • Kąt robienia zdjęcia,
  • Przesunięcia synchronizacji kolorów, co oznacza, że ​​z powodu nieregularności w przechwytywaniu i renderowaniu obrazu źródłowego kolor zmienia się w zależności od instancji,
  • Kadrowanie zdjęcia,
  • Dodanie znaku wodnego lub tekstu,
  • Możliwe warianty ostrości, co oznacza, że ​​przechwytywanie nie było ostre, a nie, że zastosowano filtr manipulacji obrazem.

Nie przeszkadza mi szkolenie aplikacji, pod warunkiem, że zwrot z tego się opłaci - co oznacza, że ​​w perspektywie długoterminowej spodziewam się, że liczba instancji 2-D wzrośnie powyżej początkowych kilku tysięcy do stu z tysięcy; ale jest to długoterminowe i chętnie skorzystam z rozwiązania, które dobrze się sprawdza dzięki zestawowi szkoleniowemu obejmującemu 1000 instancji i 10 przykładów na instancję.

AKTUALIZACJA: Licencja musi być możliwa do komercyjnego rozpowszechnienia wewnętrznego bez wydania kodu źródłowego, nawet wewnętrznego dla wszystkich posiadaczy pliku binarnego. Kod nigdy nie będzie sprzedawany, tylko używany wewnętrznie, ale nie każdy użytkownik będzie miał dostęp do kodu źródłowego, tylko interfejs.

błędy
źródło
2
Czy zastanawiałeś się nad OpenCV?
+1 @pwny: Dzięki - więc nie, nigdy nie próbowałem żadnego systemu wizyjnego (CV), po prostu próbuję dowiedzieć się, czy sposób, w jaki myślę o problemie jest prawidłowy. Powiedziałbym, jakie są obrazy, ale ponieważ odnosi się to do przedsięwzięcia biznesowego, a system CV byłby przeznaczony wyłącznie do użytku wewnętrznego, staram się nie określać, jaki system będzie przetwarzał, ale stoją przed nim wyzwania. Jeśli OpenCV spełnia bieżące wymagania, opublikuj je jako odpowiedź i, jeśli to możliwe, spróbuj połączyć się z powiązanymi dokumentami, które obejmują podane wymagania funkcjonalne. Jeszcze raz dzięki!
1
Zgodnie z prawem autorskim nie istnieje coś takiego jak „dystrybucja wewnętrzna”. Dlatego większość licencji (wszystko, o czym wiem) nie zawraca sobie głowy ograniczeniami w tym zakresie.
MSalters
+1 @MSalters: Dzięki, czy masz link do „zgodnie z prawem autorskim” - co oznacza, że ​​wydaje się, że mówisz, że jest to określone w amerykańskim prawie autorskim, chociaż może po prostu czytam twój komentarz.
1
@blunders: Technicznie rzecz biorąc, pochodzi z TRIPS (art. 1.3), który stanowi, że osobę prawną (np. korporację) należy traktować jak osobę fizyczną.
MSalters

Odpowiedzi:

10

Może to być trochę niski poziom, ale OpenCV może zapewnić narzędzia potrzebne do zbudowania takiego oprogramowania do rozpoznawania obrazów. Oczywiście OpenCV nie zapewnia wszystkiego, czego potrzebujesz od razu po wyjęciu z pudełka (myślę, że nie jestem zawodowcem), ale ma na celu zapewnienie tego, co jest potrzebne do wizji komputerowej w czasie rzeczywistym.

Możesz zacząć czytać dokumentację tutaj . Niektóre dobre książki są również wymienione na tej stronie.

Mam nadzięję, że to pomogło, powodzenia!

pwny
źródło
Czy licencja GPLV2 OpenCV oznacza, że ​​nie można jej dystrybuować wewnętrznie w systemie zamkniętego źródła? Dzięki!
Gdzie widzisz licencję GPLV2? W pierwszym akapicie na stronie głównej jest wymieniony jako licencja BSD.
@deterb: W stopce, na samym dole strony.
@deterb: Wyświetl link GPL dotyczy silnika Wiki MoinMoin używanego do wiki dla OpenCV, a nie OpenCV - dziękuję za zwrócenie uwagi na mój błąd!
+1 @pwny: Jak zaznaczono, OpenCV jest objęty licencją BSD, która jest podana na stronie głównej witryny (pojawia się stopka GPLV2 licencja nie dotyczy OpenCV), również próbował to potwierdzić, pobierając OpenCV i licencję na wyszukiwanie w obrębie wszystkie jego pliki; które zwracają się między innymi licencjami stron trzecich, licencją, która wydaje się być dla OpenCV w formie licencji BSD, chociaż nie określa, że ​​jest to licencja BSD. Tak więc, kontynuując, twoja odpowiedź jest ogromną pomocą i wydaje się wystarczająco dobra, aby iść do przodu. Dzięki!
2

Aby dodać do dyskusji, pracuję obecnie nad dopasowaniem obrazu i odkryłem, że ORB OpenCV jest bezpłatny; jednak SURF i SIFT nie są. Możesz spojrzeć na ten przykład jako możliwy punkt wyjścia.

motiur
źródło
1

Pastec http://www.pastec.io powinien spełniać wymagania pytania wstępnego.

Jest to indeks open source i wyszukiwarka rozpoznawania obrazów wydana na licencji LGPL. Umożliwia łatwe dodawanie, usuwanie i wyszukiwanie pasujących obrazów w indeksie za pomocą prostego interfejsu API HTTP. Opiera się na OpenCV i wykorzystuje deskryptor ORB, który jest wolny od patentów w przeciwieństwie do SURF i SIFT.

MagSoft
źródło