Jak każdy fotograf amator może powiedzieć, ekstremalna obróbka końcowa jest zawsze dobra. Jedną z takich technik jest „ oszustwo miniaturowe ”.
Celem jest sprawienie, aby obraz wyglądał jak fotografia jego zminiaturyzowanej, zabawkowej wersji. Działa to najlepiej w przypadku zdjęć wykonanych pod średnim / wysokim kątem do podłoża, z niewielkim zróżnicowaniem wysokości obiektu, ale można go stosować z różną skutecznością do innych zdjęć.
Wyzwanie: Zrób zdjęcie i zastosuj do niego algorytm sfałszowania miniatur. Można to zrobić na wiele sposobów, ale na potrzeby tego wyzwania sprowadza się to do:
Selektywne rozmycie
Część obrazu powinna być zamazana, aby zasymulować płytką głębię ostrości. Zwykle odbywa się to wzdłuż pewnego gradientu, liniowego lub kształtowego. Wybierz dowolny algorytm rozmycia / gradientu, który Ci się podoba, ale między 15-85% obrazu musi mieć „zauważalne” rozmycie.
Zwiększenie nasycenia
Podkręć kolor, aby rzeczy wyglądały na pomalowane ręcznie. Wyjściowy musi mieć średni poziom nasycenia> + 5% w porównaniu do wejściowego. (przy użyciu nasycenia HSV )
Wzmocnienie kontrastu
Zwiększ kontrast, aby zasymulować trudniejsze warunki oświetleniowe (takie jak światło wewnętrzne / studyjne zamiast słońca). Wyjście musi mieć kontrast> + 5% w porównaniu z wejściem. (przy użyciu algorytmu RMS )
Te trzy zmiany muszą zostać zaimplementowane i żadne inne ulepszenia / zmiany nie są dozwolone. Bez kadrowania, wyostrzania, regulacji balansu bieli, nic.
Dane wejściowe to obraz, który można odczytać z pliku lub pamięci. Możesz używać zewnętrznych bibliotek do odczytu i zapisu obrazu, ale nie możesz ich użyć do przetworzenia obrazu. W tym celu niedozwolone są również dostarczone funkcje (nie można po prostu zadzwonić
Image.blur()
)Nie ma innych danych wejściowych. Siły przetwarzania, poziomy itp. Muszą być określone przez program, a nie przez człowieka.
Dane wyjściowe mogą być wyświetlane lub zapisywane jako plik w standardowym formacie obrazu (PNG, BMP itp.).
Spróbuj uogólnić. Nie powinno działać tylko na jednym obrazie, ale zrozumiałe jest, że nie będzie działać na wszystkich obrazach. Niektóre sceny po prostu nie reagują dobrze na tę technikę, bez względu na to, jak dobry jest algorytm. Stosuj zdrowy rozsądek, zarówno podczas odpowiadania, jak i głosowania na odpowiedzi.
Zachowanie jest niezdefiniowane dla niepoprawnych danych wejściowych i obrazów, których spełnienie nie jest możliwe. Na przykład obraz w skali szarości nie może być nasycony (nie ma odcienia bazowego), czysty biały obraz nie może mieć zwiększonego kontrastu itp.
Uwzględnij co najmniej dwa obrazy wyjściowe w swojej odpowiedzi:
Należy wygenerować jeden z obrazów w tym folderze skrzynki odbiorczej . Do wyboru jest sześć, ale starałem się, aby wszystkie były wykonalne w różnym stopniu. Możesz zobaczyć przykładowe wyniki dla każdego w
example-outputs
podfolderze. Pamiętaj, że są to pełne obrazy JPG 10 MP prosto z aparatu, więc masz dużo pikseli do pracy.Drugim może być dowolny obraz do wyboru. Oczywiście staraj się wybierać obrazy, które można swobodnie wykorzystywać. Dołącz także oryginalny obraz lub link do niego w celu porównania.
Na przykład z tego obrazu:
Możesz wypisać coś takiego:
Dla porównania powyższy przykład został przetworzony w GIMP z kątowym rozmytym gradientem gaussowskim w kształcie pudełka, nasyceniem +80, kontrastem +20. (Nie wiem, jakich jednostek używa do nich GIMP)
Aby uzyskać więcej inspiracji lub uzyskać lepszy pomysł na to, co próbujesz osiągnąć, sprawdź tę witrynę lub tę . Możesz także wyszukiwać miniature faking
i wyszukiwać tilt shift photography
przykłady.
To konkurs popularności. Głosujący głosują na wpisy, które według ciebie wyglądają najlepiej, pozostając wiernymi celowi.
Wyjaśnienie:
Wyjaśniając, które funkcje są niedozwolone, moim zamiarem nie było blokowanie funkcji matematycznych . Moim zamiarem było zablokowanie funkcji manipulacji obrazem . Tak, niektóre elementy się pokrywają, ale rzeczy takie jak FFT, zwoje, matematyka macierzy itp. Są przydatne w wielu innych obszarach. Państwo powinno nie być przy użyciu funkcji, które po prostu potrzebny obraz i zaciera. Jeśli okaże się, odpowiednio Mathy drogę do tworzenia rozmycie, że uczciwą grę.
źródło
GeometricTransformation
,DistanceTransform
,ImageAdd
,ColorNegate
,ImageMultiply
,Rasterize
, iImageAdjust
.) Nawet z pomocą takich funkcji przetwarzania obrazu wysokiego szczebla, kod zajmuje 22 K. Kod interfejsu użytkownika jest jednak bardzo mały.Odpowiedzi:
Java: Implementacja referencyjna
Oto podstawowa implementacja referencyjna w Javie. Działa najlepiej na ujęciach pod dużym kątem i jest okropnie nieefektywny.
Rozmycie jest bardzo prostym rozmyciem ramki, więc zapętla się nad tymi samymi pikselami znacznie więcej niż to konieczne. Kontrast i nasycenie można również połączyć w jedną pętlę, ale ogromna większość czasu spędzonego jest na rozmyciu, więc nie zobaczyłby z tego wiele korzyści. To powiedziawszy, działa dość szybko na obrazach poniżej 2MP lub mniej więcej. Wykonanie zdjęcia 10 MP zajęło trochę czasu.
Jakość rozmycia można łatwo poprawić, używając praktycznie wszystkiego oprócz rozmycia płaskiego pola. Algorytmy kontrastu / nasycenia wykonują swoją pracę, więc nie ma tam prawdziwych skarg.
W programie nie ma prawdziwej inteligencji. Wykorzystuje stałe współczynniki rozmycia, nasycenia i kontrastu. Bawiłem się nim, by znaleźć szczęśliwe średnie ustawienia. W rezultacie, nie są niektóre sceny, że nie robi się bardzo dobrze. Na przykład, pompuje kontrast / nasycenie tak bardzo, że obrazy z dużymi obszarami o podobnych kolorach (jak niebo) rozpadają się na kolorowe pasy.
Jest prosty w użyciu; wystarczy podać nazwę pliku jako jedyny argument. Wyprowadza w formacie PNG niezależnie od tego, jaki był plik wejściowy.
Przykłady:
Z listy rozwijanej:
Te pierwsze obrazy są zmniejszane w celu ułatwienia publikowania. Kliknij obraz, aby zobaczyć w pełnym rozmiarze.
Po:
Przed:
Wybór różnych:
Po:
Przed:
źródło
DO#
Zamiast wykonywać iteracyjne rozmycia pudełkowe, postanowiłem przejść całą drogę i napisać rozmycie gaussowskie. Te
GetPixel
rozmowy naprawdę spowolnić go podczas korzystania z dużych ziaren, ale to naprawdę nie opłaca się konwertować metody do użytkuLockBits
, chyba że były jakieś większe przetwarzania obrazów.Poniżej podano kilka przykładów, które używają domyślnych parametrów strojenia, które ustawiłem (nie grałem zbyt długo z parametrami strojenia, ponieważ wydawały się one działać dobrze dla obrazu testowego).
Dla dostarczonego przypadku testowego ...
Inne...
Inne...
Zwiększenie nasycenia i kontrastu powinno być dość proste z kodu. Robię to w przestrzeni HSL i przekształcam z powrotem w RGB.
Jądro 2D Gaussa jest generowany na podstawie rozmiaru
n
określony, z:... i znormalizowany po przypisaniu wszystkich wartości jądra. Zauważ, że
A=sigma_x=sigma_y=1
.Aby dowiedzieć się, gdzie zastosować jądro, używam wagi rozmycia obliczonej przez:
... co daje przyzwoitą odpowiedź, zasadniczo tworząc elipsę wartości, które są chronione przed rozmyciem, które stopniowo zanika. Filtr pasmowo-przepustowy w połączeniu z innymi równaniami (być może jakimś wariantem
y=-x^2
) mógłby potencjalnie lepiej działać tutaj w przypadku niektórych obrazów. Poszedłem z cosinusem, ponieważ dał dobrą odpowiedź na testowany przypadek podstawowy.źródło
Jawa
Używa szybkiego dwukierunkowego rozmycia średniej ruchomej, aby był wystarczająco szybki, aby uruchomić wiele przejść, emulując rozmycie gaussowskie. Rozmycie jest również gradientem eliptycznym zamiast dwuliniowym.
Wizualnie działa najlepiej na dużych obrazach. Ma ciemniejszy, grubszy motyw. Cieszę się, jak rozmycie pojawiło się na obrazach o odpowiedniej wielkości, jest to dość stopniowe i trudne do rozpoznania, gdzie „zaczyna się”.
Wszystkie obliczenia wykonane na tablicach liczb całkowitych lub podwójnych (dla HSV).
Oczekuje ścieżki pliku jako argumentu, wysyła plik do tej samej lokalizacji z sufiksem „miniaturized.png” Wyświetla również dane wejściowe i wyjściowe w ramce JFrame do natychmiastowego przeglądania.
(kliknij, aby zobaczyć duże wersje, są o wiele lepsze)
Przed:
Po:
Być może będę musiał dodać bardziej inteligentne mapowanie tonów lub zachowanie Luma, ponieważ może być dość ciemno:
Przed:
Po:
Nadal jednak ciekawy, wprowadza go w zupełnie nową atmosferę.
Kod:
źródło
jot
To było miłe wyzwanie. Ustawienia rozmycia, nasycenia i kontrastu są zakodowane na stałe, ale w razie potrzeby można je łatwo zmienić. Jednak obszar ostrości jest zakodowany na stałe jako pozioma linia pośrodku. Nie można go po prostu zmodyfikować, podobnie jak inne ustawienia. Zostało wybrane, ponieważ większość zdjęć testowych przedstawia widoki miasta.
Po wykonaniu rozmycia gaussowskiego podzieliłem obraz poziomo na 5 regionów. Górne i dolne regiony otrzymają 100% rozmycia. Środkowy region otrzyma 0% rozmycia. Dwa pozostałe regiony będą skalowane proporcjonalnie do odwrotnej kostki od 0% do 100%.
Kod ma być używany jako skrypt w J, a ten skrypt będzie w tym samym folderze, w
input.bmp
którym będzie obraz wejściowy. Stworzy,output.bmp
która będzie fałszywą miniaturą danych wejściowych.Wydajność jest dobra i na moim komputerze z i7-4770k przetworzenie obrazu z zestawu OP zajmuje około 20 sekund. Poprzednio przetworzenie obrazu przy użyciu standardowego splotu z
;._3
operatorem podrzędnej pamięci trwało około 70 sekund . Wydajność została poprawiona dzięki zastosowaniu FFT do wykonania splotu.Ten kod wymaga zainstalowania dodatków
bmp
imath/fftw
. Możesz je zainstalować za pomocąinstall 'bmp'
iinstall 'math/fftw'
. Twój system może także wymagać zainstalowaniafftw
biblioteki.źródło