Jak aparat może mieć rozdzielczość 12 MP i 1080p, kiedy 1920 x 1080 to zaledwie 2 073 600?

10

W specyfikacjach przyszłego aparatu do smartfona (był to ten , tylko dla nagrania), aparat jest opisany jako „12MP, 1080p”.

Ale to nie ma większego sensu. Jeśli aparat ma rozdzielczość 1080p, tj. Jest w stanie FHD o rozdzielczości 1920x1080 pikseli, to jest to 2073600 pikseli, czyli około 2MP - o wiele mniej niż jest to technicznie możliwe do uzyskania przez aparat 12MP. A przy 12MP ten aparat byłby w stanie wykonywać zdjęcia znacznie powyżej UHD lub 4k (czyli około 4000 x 2000 pikseli ~ 8MP) - więc 12MP oznacza, że ​​możemy również robić zdjęcia w tej wysokiej rozdzielczości?

Więc moje pytanie, jak odczytać tę sprzeczną specyfikację 12MP i 1080p, a jeśli to nie znaczy, że najwyższa rozdzielczość obrazu to 1920x1080p, jakie są maksymalne wymiary?

StefanH
źródło
2
Nie ma sprzeczności. To są różne rzeczy.
Rafael
4
Dlaczego zignorowałeś „@ 30fps”?
MonkeyZeus
@MonkeyZeus Właśnie zobaczyłem duży obrazek powyżej.
StefanH
@MonkeyZeus Ponieważ zarówno „1920x1080 pikseli”, jak i „12MP” to stwierdzenia o tym, jak duże zdjęcie można zrobić, a nie stwierdzenia, ile zdjęć.
David Richerby

Odpowiedzi:

26

Oznaczenie 12MP jest zwykle używane w odniesieniu do fotografii, podczas gdy oznaczenie 1080p odnosi się do wideo.

Czujnik ma 12 megapikseli - czasem trochę więcej, co zostaje zamaskowane. Oznacza to, że zajmuje 12 megapikseli zdjęć. Najprawdopodobniej jest to obraz o proporcjach 4: 3, co oznacza około 4000 x 3000 pikseli.

Wideo to strumień obrazów, najczęściej przechwytywanych z 24 do 60 klatek na sekundę. Oznacza to, że dla czujnika 12 MP wyprowadzałby 12 MP (powiedzmy 8-bitowy RAW dla uproszczenia), który przy 24 FPS wynosi 12 x 24 = 288 MB / s. To naprawdę ogromna ilość danych, a to minimum, ponieważ głębia bitowa jest często 12-bitowa, a więc o 50% większa.

Istnieje kilka sposobów pracy z tym. Jednym z nich jest posiadanie procesora, który może odczytać tę ilość danych, ale nie wyprowadzić ich, w którym to przypadku każda ramka 12 MP jest zmniejszana do około 2 MP, a następnie procesor koduje i zapisuje ją na karcie pamięci. Pozwala to uzyskać wideo 1080p, które jest tak szerokie jak obraz 12 MP. Jest to najczęstsza implementacja.

Inną implementacją jest pobranie obszaru przycięcia obrazu. Jest to niezwykle powszechne w przypadku wideo 4K, ponieważ bardzo niewiele czujników i procesorów może obsłużyć te dane przy 30 klatkach na sekundę. Wadą tego jest zmniejszony kąt widzenia. Ile zależy od rozdzielczości czujnika; dla 12 MP byłoby to bardzo minimalne, ponieważ 4000 x 3000 nie jest znacznie szerszy niż 3840 x 2160. W przypadku czujnika 16 lub 20 MP może to być nawet 1,3X. Zwróć uwagę, że filmy HD i 4K mają proporcje 16: 9, więc nawet na matrycy 12 MP będzie dużo kadrowania w pionie.

Niektóre czujniki mają dodatkowe obwody, które pozwalają im wysyłać binned piksele, które następnie muszą być ponownie próbkowane w dół do pożądanej rozdzielczości wideo. Powiedzmy, że 12-megapikselowy czujnik o rozdzielczości 4000x3000px może generować 2000x1500, który następnie zostanie ponownie próbkowany lub przycięty do 1080p. W ten sposób nie trzeba tak szybkiego odczytu i można zastosować mniej wydajny procesor.

Czujniki CMOS - które są obecnie najczęstsze - mogą również wykonywać losowy odczyt pikseli, dzięki czemu mogą podpróbkować piksele z dużego obszaru czujnika, pomijając niektóre pomiędzy nimi. Powoduje to powstanie niektórych artefaktów, zwłaszcza mory .

Itai
źródło
1
Inną inną implementacją jest podpróbkowanie, tj. Odczyt tylko co n-ty piksel każdego n-tego wiersza. Jest to całkowicie możliwe w przypadku czujników CMOS. Właśnie tego ranka korzystałem z aparatu, który obsługuje tę funkcję
Chris H
1
@Chris - Dodano.
Itai
1
To naprawdę nie jest poprawna odpowiedź. OP nie mówił o wideo.
enorl76
7
To właśnie robili FHD i 1080p, nawet jeśli o tym nie wiedział.
Itai
18

1080p odnosi się do wideo: skanowanie progresywne 1920 × 1080 . Telefon może wykonywać zdjęcia w rozdzielczości 12 Mpixel, ale tylko wideo 1080p. (Jest to dość typowe; potrzeba dużo więcej mocy obliczeniowej, aby nagrywać wideo w danej rozdzielczości niż robić zdjęcia w tej rozdzielczości.)

j_foster
źródło
3

Różnica polega na tym, że obraz wideo jest przetwarzany z nieruchomych klatek. Szybkość przesyłania danych dla pełnej rozdzielczości czujnika (tj. 12 Mp) byłaby zbyt wysoka do normalnego użytkowania i nie ma standardu dla takiego wideo. Ledwo wykorzystujemy w pełni wideo 1080p.

Tak więc sprzęt w twoim telefonie wykonuje specjalne i bardzo szybkie skalowanie każdej klatki wideo w dół od pełnego 12Mp do standardowego 1080p (lub cokolwiek podałeś). Ta ramka wideo jest następnie kodowana przy użyciu wymaganego kodeka (ponownie zwykle przez szybki specjalistyczny sprzęt) w celu utworzenia zwartego strumienia wideo.

StephenG
źródło