Jakie trudności techniczne wiążą się z budowaniem czujnika o dużym zakresie dynamicznym, takim jak ludzkie oko?

17

Dlaczego nie mamy jeszcze czujników o wysokim zakresie dynamiki, które mają odpowiednią ekspozycję w każdej części obrazu?

Andreas Hartmann
źródło
2
Właściwie po odpowiedzi zobaczyłem, że zostało to już tutaj omówione . Jeśli to nie wszystko odpowiada, rozważ rozszerzenie pytania o więcej szczegółów.
mivilar
Kamera BlackMagic (wideo Full HD) ma EV równą 14 EV, nowoczesne profesjonalne kamery wideo (4K) mają 18 EV. Mamy więc te czujniki ...
TFuto,

Odpowiedzi:

20

Istnieją już kamery z DR większym niż ludzkie oko, zarówno natychmiast, jak i ogólnie. Zakres dynamiki ludzkiego oka nie jest tak duży, jak większość ludzi myśli. O ile pamiętam, jest to około 12 do 16 EV, co jest mniej więcej na poziomie współczesnej lustrzanki cyfrowej.

Podstawowa różnica polega na tym, że mamy niezwykle naturalną kontrolę przysłony, która dostosowuje się do różnych części obrazu. W efekcie nasze mózgi automatycznie układają obrazy w stosy. Kiedy patrzymy na jasną część sceny, nasze źrenice kurczą się i widzimy szczegóły jasnej części. Jeśli zmienimy ostrość na ciemniejszą część, nasze źrenice szybko się otworzą i zobaczymy szczegóły ciemnej części. Nasz mózg wie, jak wyglądała poprzednia część, więc nie zauważamy zmiany w naszym widzeniu peryferyjnym, ale tak naprawdę nie widzimy tylu szczegółów, w których nie jesteśmy już skupieni.

Podobnie, nawet dla ogólnego zakresu widzenia ludzkiego, istnieją wyspecjalizowane kamery, które mogą pójść znacznie ciemniej niż my i nadal widzieć, szczególnie kolory, są po prostu zbyt drogie, aby wyprodukować je dla ogółu społeczeństwa, ponieważ wymagają bardzo wysokiej jakości materiałów i konstrukcji, aby bardzo niski poziom hałasu. Istnieją również czujniki zdolne do patrzenia na bardzo jasne obiekty, na które patrzenie ludzi byłoby bolesne.

AJ Henderson
źródło
AJ, DSLR nie mają takiego samego zakresu dynamicznego jak oko. dla DSLR jest 2 przy sile 14, dla ludzkiego oka jest 10 przy sile 14
Romeo Ninov
@RomeoNinov - nie dla natychmiastowego DR, tylko dla pozornego. Czy masz źródło roszczenia? Moje źródło jest tutaj „gdybyśmy zamiast tego wzięli pod uwagę chwilowy zakres dynamiki oka (w którym otwarcie źrenicy jest niezmienione), wtedy kamery wypadają znacznie lepiej. To byłoby podobne do patrzenia na jeden region w scenie, pozwalając naszym oczom się dostosować, i nie patrząc nigdzie indziej. W takim przypadku większość szacuje, że nasze oczy widzą w dowolnym miejscu z zakresu 10-14 zakresów dynamicznych "
AJ Henderson
@RomeoNinov - nieco lepszy zasób . Warto więc zaznaczyć, że nasze oczy radzą sobie lepiej tam, gdzie aparaty słabo, ale nasze oczy gorzej, tam gdzie aparaty mają się lepiej. W cieniach mamy 20 EV, ponieważ aparaty mają zmniejszone EV. W jasności mamy około 10 EV, ale aparaty mają pełne 12 do 14 EV. 10 ^ 14 to całkowity zasięg, który możemy zobaczyć, gdy nasze oczy się dostosowują, a nie to, co widzimy w danym momencie. Pod tym względem kamery nie są ograniczone do 2 ^ 14.
AJ Henderson
tak, kamery są ograniczone do głębokości bitów surowego obrazu. Nie można uzyskać więcej bitów lub więcej informacji z obrazu. Zgadzam się, że obraz mózgu „widzi” nie pochodzi tylko z jednego ujęcia z oka, ponadto używamy dwojga oczu, które dodają wiele dodatkowych informacji do obrazu w mózgu. A w zasobie, o którym wspominasz w drugim komentarzu, widzisz dynamiczny zakres oka wyświetlany w sile 10. Które tylko potwierdzają moje słowa. Nawet jeśli DR wynosi tylko 12 EV, to jest 10 ^ 12, co stanowi milion milionów, w porównaniu do 2 ^ 14, czyli 16384
Romeo Ninov
1
Ale nawet czujnik poważnie ograniczony do, powiedzmy, sześciostopniowego DR w dowolnym momencie może być użyty do pomiaru szczegółów od bardzo ciemnych do bardzo jasnych wartości w kolejnych klatkach poprzez zmianę Tv i Av! Jeśli chodzi o aperturę, działa system oko / mózg.
Michael C
10

Widzenie jest procesem aktywnym

Dużym problemem jest to, że patrzenie oczami jest bardzo podobne do robienia zdjęcia - obraz musi zawierać wszystkie informacje, na które może patrzeć, ale normalne widzenie jest aktywnym procesem, który obejmuje ruch oczu, zmianę ostrości i rozszerzenie źrenic zgodnie z do obiektów, na które patrzymy. Tak więc, jeśli chcesz uchwycić „to, co widzi oko”, w istocie musisz uchwycić punkt widzenia we wszystkich ustawieniach, których może użyć oko.

Twoje pytanie dotyczy zakresu dynamicznego, ale ten sam problem pojawia się ze szczegółami wizualnymi i skupieniem. Obraz „ekwiwalent życia” potrzebuje znacznie więcej pikseli, niż może to uchwycić oko, ponieważ rozdzielczość oka jest bardzo nierówna, a gdy patrzysz tylko na jedno małe miejsce z środkową siatkówką o wysokiej rozdzielczości, obraz potrzebuje więcej szczegółów dostępnych, ponieważ poruszysz oczami. Filmy muszą wybrać jedno ogniskowanie, podczas gdy człowiek może zobaczyć „pojedynczy obraz” z większą głębią, szybko zmieniając ostrość oczu i / lub przesuwając je w celu uzyskania prawidłowego widzenia obuocznego z różnych zamierzonych odległości (np. Patrząc na powierzchnię okna lub przez niego ) itp.

Częścią rozwiązania jest to, że - przy użyciu jednej kamery wiele razy szybko (lub wielu kamer) do przechwytywania różnych zdjęć przy różnych ustawieniach i scalania ich później, HDR jest najbardziej rażącym przykładem - podobnie jak nasze oko, aktywnie wygląda w różnych miejscach z różnymi „ustawieniami”, a dopiero potem mózg łączy to wszystko w spójny obraz lub film. Rzeczywiste „zdjęcia” wykonane naszymi oczami są już gorsze niż dobre aparaty, po prostu ich mentalne połączenie jest fajne.

Piotr jest
źródło
1
+1 za punkt skupienia na filmowaniu. Jest to również związane z jednym z głównych powodów, dla których wiele osób odczuwa ból głowy podczas oglądania filmów 3D. Oko musi fizycznie skupić się na ekranie, ale obraz stereoskopowy powoduje, że mózg myśli, że niektóre części ekranu znajdują się bliżej lub dalej niż są w rzeczywistości, powodując zmęczenie oczu, gdy patrzysz na nie bezpośrednio. Studia starają się to zminimalizować, wyświetlając centralny punkt sceny w tym samym miejscu zarówno na lewym, jak i prawym obrazie. Jeśli więc chcesz rozejrzeć się po szczegółach w tle, nie zapomnij o ibuprofenie!
bcrist
Fakt, że widzenie jest procesem aktywnym, jest jednym z powodów, dla których naprawdę dobrzy artyści mogą tworzyć obrazy, które wyglądają lepiej niż zwykłe zdjęcia. Proste zdjęcie uchwyci wszystko na scenie z tym samym punktem widzenia, ostrością, ekspozycją i balansem bieli, podczas gdy oczy kogoś, kto faktycznie oglądał scenę, mogą stale się dostosowywać, gdy patrzą na różne części. Malarz, w przeciwieństwie do kamery, może stworzyć obraz, na którym każda część sceny wygląda tak, jak wyglądałaby osoba, która faktycznie była w tym miejscu i patrzyła na nią.
supercat
6

Twój obraz mentalny jest produktem nie tylko siatkówki, ale jej interakcji ze wszystkimi innymi elementami zaangażowanymi w widzenie, w tym źrenicą i, oczywiście, twoim mózgiem. To, co może się wydawać „jednym obrazem”, jest w rzeczywistości wynikiem szybkich dostosowań i przetwarzania informacji, a nie pojedynczą migawką.

Więcej informacji na ten temat można znaleźć tutaj .

mivilar
źródło
1

Całkowicie możliwe jest wykonanie czujnika światła o właściwościach logarytmicznych - taki czujnik miałby niesamowity zakres dynamiczny kosztem ograniczonej rozdzielczości dla określonej ekspozycji. Uzyskanie obu wymaga ADC o wysokiej rozdzielczości. Do obrazowania CT zwykle stosuje się 24 bity liniowe - a następnie logarytm jest brany po korekcji przesunięcia w celu utworzenia obrazu CT.

Czujnik, który zarówno kontroluje ekspozycję (czas integracji - pomyśl czas otwarcia migawki), może działać lepiej, a jeśli dopuścisz zmiany wydajności zbierania światła (pomyśl liczbę f), zyskasz jeszcze większą elastyczność.

Ostateczny zakres dynamiczny jest zwykle ograniczony przez szum odczytu - gdy odczytasz zakumulowany ładunek, wystąpi błąd - w porównaniu z największym sygnałem, który elektronika może obsłużyć. Jak powiedziałem - 24 bity są powszechne w obrazowaniu medycznym i jest to więcej niż 1 część na 10 milionów. To znacznie wyższy zakres dynamiczny niż siatkówka dla danej ekspozycji. Ale nie jest powszechnie stosowany w konwencjonalnych aparatach, ponieważ oko nie mogło docenić tych szczegółów na obrazie - a rozdzielczość odbywa się kosztem szybkości.

Floris
źródło