Pracuję i uczę się zarówno o wizji komputerowej, jak i przetwarzaniu obrazu od kilku lat i wierzę, że nie jestem już kompletnym początkującym.
Mimo to po tylu latach trudno mi powiedzieć w jakiejkolwiek części mojej pracy, czy jest to związane głównie z wizją komputerową, czy też z przetwarzaniem obrazu . Po prostu nie widzę linii - kiedy pracuję, studiuję i badam, czytam materiały referencyjne zawierające oba słowa kluczowe.
Tak więc interesuje mnie definicja pól widzenia komputerowego i przetwarzania obrazu, z naciskiem na porównanie (różnice i nakładanie się) pól .
Dodatkowo uważam, że warto mieć przykład (praktycznych lub istniejących) praktycznych aplikacji, projektów i prac dotyczących / wykorzystania:
- wyłącznie (lub głównie) komputerowe narzędzia i pomysły wizji
- wyłącznie (lub głównie) narzędzia i pomysły do przetwarzania obrazu
- połączenie narzędzi i pomysłów z obu dziedzin
ze zwróceniem szczególnej uwagi na to, co czyni je jednym, a nie drugim , lub co czyni oba te elementy .
Rozumiem, że te pola są ściśle powiązane i że „linia” może nie być tak jasna, jak to pytanie, ale mam nadzieję, że rozumiesz, że celem tego pytania nie było zaprojektowanie prostej reguły decyzyjnej do klasyfikacji (mojej) pracować, ale raczej lepiej zrozumieć cel i cele tych dziedzin. Ponadto wszelkie dodatkowe informacje, które wydają się dotyczyć mojego tematu, są mile widziane, nawet jeśli nie poprosiłem o nie.
Odpowiedzi:
Uważam, że Gonzalez i Woods są wystarczająco kompetentni, aby polegać na ich opinii:
Powiedziałbym więc, że podstawową różnicą są cele, a nie metody. Na przykład, jeśli celem jest ulepszenie obrazu do późniejszego wykorzystania przez ludzi, można to nazwać przetwarzaniem obrazu. A jeśli celem jest naśladowanie wzroku ludzkiego (rozpoznawanie obiektów, wykrywanie usterek lub automatyczne prowadzenie pojazdu), to jest on bliższy wizji komputerowej. Należy jednak pamiętać, że emulacja ludzkiego widzenia z definicji może również wymagać poprawy obrazu, więc w większości rzeczywistych przypadków widzenie komputerowe opiera się na przetwarzaniu obrazu .
Zrozumienie obrazu (ekstrakcja funkcji) może być równie dobrze wykorzystane zarówno w czystym przetwarzaniu obrazu, jak i wizyjnym.
źródło
W moim rozumieniu celem przetwarzania obrazu jest uzyskanie (w jakiś sposób przekształconego) obrazu. Celem wizji komputerowej jest dowiedzieć się czegoś o tym, co jest w środku obrazie (jak to facet na zdjęciu szczęśliwy lub smutny, ile samochodów istnieją w obrazie i w jaki sposób są one jazdy).
Nie sądzę, że jest to możliwe, nie w sposób, w jaki rozumiem warunki.
Weźmy na przykład Adobe Photoshop: może zrobić zdjęcie i przekształcić je w obraz szczuplejszej osoby o lepszej skórze. Ale nic nie „wie” o przedmiotach przedstawionych na obrazie.
źródło