Pomiar wielkości obiektu za pomocą Deep Neural Network

10

Mam duży zbiór danych o pojazdach z prawdą o ich długości (ponad 100 000 próbek). Czy można wytrenować głęboką sieć w celu pomiaru / oszacowania długości pojazdu? Nie widziałem żadnych prac związanych z szacowaniem wielkości obiektu za pomocą głębokiej sieci neuronowej.

Naji
źródło
1
Bardzo dobre pytanie. Witamy w AI!
DukeZhou
(Uwaga do moderatora) - jest to zastępcza odpowiedź na pytanie do OP, ponieważ nie mogę komentować. Czy twoje zestawy danych to obrazy lub tekst? hisairnessag3 jest na dobrej drodze, przenosząc piksele / metryczne podejście z OpenCV do detekcji obiektu DNN
Adnan S

Odpowiedzi:

4

Tak! Z pewnością można to zrobić. Ponieważ masz zestaw danych oznaczony etykietą, to czyni to jeszcze prostszym!

Rzuciłbym okiem na ten projekt i powinien on doprowadzić cię tam, gdzie musisz się udać.

Szczegóły implementacji powinny być dość proste. Daj mi znać, jeśli mogę pomóc.

hisairnessag3
źródło
1
Nie trzeba wyjaśniać, dlaczego ktoś nie głosuje. Wielu programistów nie ma wystarczająco dużo czasu, aby spojrzeć na komentarze, patrzą na głosy, aby sprawdzić, czy odpowiedź jest tego warta, czy nie. Jeśli przeczytasz to pytanie ponownie, okaże się, że pytanie dotyczy konkretnie używania DNN, a nie czegokolwiek innego. projekt, który udostępniasz dotyczy korzystania z Opencv ... jeśli czytasz komentarze pod udostępnionym postem, przekonasz się, że ludzie pytają o DNN, ale sam post nie używa DNN. Nawiasem mówiąc, nie jestem osobą, która przegłosowała twoją odpowiedź
BH85,
2
To nie jest konieczne, ale jest pomocne. Jeśli będziesz szukać na jakiejkolwiek głębokości, nie znajdziesz żadnych projektów ani dokumentów dotyczących tego konkretnego przypadku użycia dla DNN. Mówiąc to, odniosłem się do najbliższego możliwego projektu w nadziei na rozpoczęcie OP. Dodatkowo odpowiedziałem na pytanie. Pytanie brzmi, czy można to zrobić.
hisairnessag3
Dzięki za odpowiedź! Myślę, że można by to poprawić poprzez krótkie wyjaśnienie, w jaki sposób / dlaczego jest to możliwe. Przydałby się przynajmniej zarys architektury.
Ben N,
1

Tak, jest to możliwe, ale najpierw musisz rozpoznać jakiś obiekt na obrazie, albo 1) sam pojazd, a następnie zgłosić znany rozmiar tego pojazdu lub 2) znany obiekt, który jest w tej samej odległości od kamery, co samochód ( krawężnik, znak stopu, głowa kierowcy, kuc szetlandzki ... cokolwiek), a następnie użyj tego obiektu do kalibracji wielkości samochodu, który jest bardzo blisko niego.

Każdy samochód na zdjęciu będzie w nieznanej odległości od aparatu, dzięki czemu obiekt samochodu będzie wyglądał na większy lub mniejszy ze zdjęcia na zdjęcie. Jeśli nie rozpoznajesz samochodu lub przynajmniej obiektu referencyjnego o znanym rozmiarze, fizyczny rozmiar samochodu nie zostanie skalibrowany - nie będziesz mieć podstaw do oszacowania rozmiaru.

Jeśli samochód jest nieznany, to nawet jeśli masz wskazówki wizualne (istnieje obiekt odniesienia lub znana jest odległość od kamery do samochodu), nieznany zakres szerokiego kąta soczewki kamery może zniekształcić kształt nieznanego samochodu (wysokość vs szerokość), co dodatkowo komplikuje twoją zdolność do oszacowania jego pozornych wymiarów.

Niespokojny
źródło
Czy tablica rejestracyjna pojazdu może być tym znanym przedmiotem służącym do kalibracji wielkości samochodu? Tablice rejestracyjne są zwykle tego samego rozmiaru.
Naji
1
Trzeba być ostrożnym przy przyjmowaniu założeń, że tablice rejestracyjne są tego samego rozmiaru. Na przykład talerz australijski i amerykański mają różne rozmiary. Jeśli nie stanowi to problemu dla Twojej aplikacji (będzie działać tylko w jednym kraju), możesz założyć rozmiar referencyjny płyty. Trzeba jednak zachować ostrożność, ponieważ płyta może nie być skierowana normalnie do Ciebie. Jeśli samochód ma 45 stopni, szerokość tablicy zajmie mniej pikseli niż w 0, nawet w tej samej odległości.
pshlady
1

Myślę, że ten artykuł może ci pomóc: Szacowanie ramki 3D za pomocą głębokiego uczenia się i geometrii

Użył 1 VGG-19 (wstępnie przeszkolonego w ImageNet), aby poznać wielkość samochodów

Cryax dsa
źródło
Tak jak ty, założyłem, że chodzi o wnioskowanie o obwiedni 3D, w której dane są reprezentowane na obrazie 2D. Projekt wspomniany przez hisairnessag3 wydaje się dotyczyć jedynie obwiedni 2D bez wyuczonego wnioskowania na temat natury 3D, którą może zawierać obraz.
Jim
W tym artykule oszacowano rozmiar i orientację samochodu na podstawie przyciętego obrazu 2D (zawiera tylko żądany obiekt).
cryax dsa