Używam S95 do fotografowania dokumentów tekstowych (zarówno papierowych, jak i mikrofilmowych) dla OCR. Pytałem już o problemy dotyczące najlepszego sfotografowania ekranu komputera dla mikrofilmów, ale zastanawiałem się nad najlepszym sposobem fotografowania tekstu, aby tekst był wyraźny i wyraźny. Oto moje obecne przemyślenia, ale chciałbym usłyszeć, co ma do powiedzenia każdy, kto ma więcej doświadczenia fotograficznego niż ja:
Używam mniejszej liczby megapikseli (około 6-7MP zamiast maksimum S95, czyli 10MP), tak że powstałe pliki PDF nie zabijają mojego komputera, kiedy faktycznie je przewijam
Przysłona - niższa (np. F / 6.3), dzięki czemu jeśli aparat nie jest dokładnie równoległy do strony, tekst pozostanie ostry
Czas otwarcia migawki - tutaj jest kompromis, ponieważ biblioteki są zwykle słabiej oświetlone, więc chciałbym obniżyć czas otwarcia migawki, aby zwiększyć ekspozycję, ale bez statywu istnieje szansa, że aparat się zatrzęsie
ISO - Nie jestem do końca pewien, jak to na to wpłynie.
Balans bieli - Znowu, nie bardzo do końca pewny.
Eksperymentowałem z różnymi ustawieniami w aparacie, ale dopiero uczę się fotografii i chciałbym wiedzieć, czy ktoś ma jakieś sugestie, jak najlepiej sfotografować tekst, z książek lub dokumentów, który jest łatwy do odczytania.
Odpowiedzi:
Jeśli twój aparat ma tryb czarno-biały, postaram się to skrócić czas przetwarzania końcowego. Ponadto wiele programów OCR, z którymi pracowałem, działa znacznie lepiej w trybie czarno-białym.
Będziesz chciał ustawić się jak najbardziej równolegle do strony, ponieważ aby zmniejszyć drgania aparatu podczas trzymania ręki, prawdopodobnie będziesz potrzebować największej przysłony, aby maksymalnie wydłużyć czas otwarcia migawki. Mały czujnik na twoim s95 powinien zwiększyć DOF na tyle, że otworzę aperturę tak szeroką, jak tylko możesz.
Biorąc pod uwagę, że po prostu uruchomisz to za pomocą OCR, zwiększ ISO do tego, co zapewnia odpowiednią ekspozycję przy minimalnym wstrząsie. OCR rzadziej narzeka na dodatkowy szum niż rozmyte litery.
Balans bieli, jeśli mówisz tylko o tekście, powinien być odpowiedni dla dowolnego ustawienia kamery w pomieszczeniu, ale szczerze mówiąc, nie przejmuj się tym zbytnio.
Twoje megapiksele mogą mieć znaczenie tylko wtedy, gdy tekst dokumentu jest niewiarygodnie mały i musisz wyraźnie rozwiązać ten poziom szczegółowości, ale domyślam się, że 6-7 będzie w porządku dla większości rzeczy.
źródło
Wygląda na to, że już dobrze znasz ustawienia. Drgania aparatu zrujnują czytelność tekstu bardziej niż cokolwiek innego, dlatego najpierw go zoptymalizuję. Jeśli nie możesz użyć statywu, upewnij się, że czas otwarcia migawki wynosi co najmniej 1 na całej długości ogniskowej (odpowiednik 35 mm). Oddalenie ułatwi to. Użyj stabilizacji obrazu, jeśli go masz.
Przysłona może być ustawiona dość szeroko, po prostu upewnij się, że jesteś równoległy do strony. Szeroki otwór przysłony pomoże w czasie otwarcia migawki, ponownie rozmycie z powodu szerokiej przysłony jest niczym w porównaniu z rozmyciem spowodowanym ruchem aparatu!
ISO, wszystko czego potrzebujesz, aby uzyskać dobrą ekspozycję. Hałas nie powinien wpływać na czytelność, dopóki nie stanie się naprawdę zły.
Preferowane byłoby fotografowanie niestandardowego balansu bieli na podstawie samego papieru, ale oprogramowanie OCR powinno być w stanie poradzić sobie z białawym tłem.
źródło
Zakładam, że konwertujesz pliki JPEG na pliki PDF. Zalecam uchwycenie maksimum i użycie programu do zmniejszenia rozmiaru do 6-7 MP z wyostrzaniem zastosowanym po zmniejszeniu i przed konwersją do formatu PDF.
Aby to wyjaśnić, potrzebujesz węższej przysłony dla większej głębi ostrości, która jest wyższą liczbą przysłony. (np. chcesz f / 8 zamiast f / 2). Aby tekst był czytelny, staraj się, aby kamera była skierowana możliwie prostopadle, abyś nie musiał się martwić o głębię ostrości. Dobrym pomysłem jest zatrzymanie się nieco od szeroko otwartego, aby zmniejszyć aberracje, takie jak CA, które zobaczysz czarno-białym tekstem. Im bliżej papieru, tym głębsza będzie głębia ostrości.
Prawdopodobnie będzie to miało największy wpływ na czytelność, jeśli trzymasz się za ręce. Jeśli trzymasz się za ręce, chcesz wybrać czas otwarcia migawki taki, aby był on dłuższy niż 1 / (odpowiednik ogniskowej 35 mm) lub nawet szybszy. Zależy to od tego, jakiego ustawienia powiększenia używasz w swoim P&S. Jeśli użyjesz szerokiego końca, możesz uciec przed dłuższymi czasami otwarcia migawki, ale możesz uzyskać zniekształcenie beczki. Jeśli fotografujesz dokumenty tekstowe, a nie ekran komputera, zalecam skorzystanie z lampy błyskowej.
Jeśli możesz, podeprzyj dokument (oklejoną taśmą lub coś płaskiego), abyś mógł na nim oprzeć aparat i uzyskać tak długi czas otwarcia migawki, jak chcesz. Możesz również użyć torby na beanbag lub małych przedmiotów, aby ustawić aparat pod kątem. Można również uzyskać adaptery do statywów do butelek wodnych do P&S.
Przysłona, czas otwarcia migawki i ISO tworzą trójkąt ekspozycji. Przeczytaj o tym tutaj . Im wyższy ISO, tym węższy otwór przysłony i krótszy czas otwarcia migawki, ale można uzyskać bardziej hałaśliwy obraz. Polecam niski ISO (400 lub mniej) dla P&S z tekstem.
Wybierz balans bieli dla swojej sytuacji oświetleniowej. Jeśli masz fluorescencyjny, użyj tego. Jeśli używasz lampy błyskowej, użyj balansu bieli lampy błyskowej.
źródło
Zgadzam się z sugestiami dotyczącymi fotografowania w najwyższej dostępnej rozdzielczości i zmniejszania rozmiaru w komputerze. Wybierz także najwyższej jakości JPEG, który możesz uzyskać z aparatu, lub nawet fotografuj na surowo, jeśli kamera na to pozwala, i przekonwertuj na tiff lub png. Kompresja stratna w jpeg może tworzyć artefakty wokół granicy atramentu / papieru, które mogłyby wprowadzić w błąd oprogramowanie ocr.
Ogólnie rzecz biorąc, chcesz użyć ustawień, które pozwolą uzyskać najostrzejszy możliwy obraz. Rzeczy takie jak kontrast, balans bieli itp. Można zmienić na komputerze. W rzeczywistości zwiększenie kontrastu za pomocą narzędzia poziomów lub narzędzia kontrastu / jasności w Photoshopie lub GIMP może ci bardzo pomóc.
Ponadto konwersja do formatu skali szarości znacznie zmniejszy rozmiar twoich plików. A jeśli to zrobisz i zwiększysz kontrast, tak naprawdę nie musisz się martwić o balans bieli. Możesz eksperymentować z balansem bieli, jednak niektóre ustawienia mogą dawać lepszy kontrast niż inne (zależy to od oświetlenia).
Jeśli komputer może to obsłużyć, wykonaj wszystkie korekty (skala szarości, kontrast, jasność) przed zmniejszeniem, a po zmniejszeniu zastosuj filtr wyostrzający do obrazu.
źródło
Kilka myśli, których nigdzie indziej nie zauważyłem, do dodania do miksu:
Jeśli strzelać „powiększony” (więcej teleobiektywu ), spowoduje to, aby strzelać dalej od strony, która będzie następnie daje bardziej spójnego obrazu w stosunku do rozmiaru o tekście (słowa w kącie będzie bliżej taki sam rozmiar jak słowa na środku; przy szerokim kącie możesz uzyskać zniekształcenie w związku z tym). Nie jestem pewien, jakie jest tutaj „idealne” ustawienie, i jest to kompromis z wymaganymi czasami otwarcia migawki, potencjalnie tylko coś do przemyślenia.
Będziesz chciał „ przeeksponować ” w porównaniu z tym, co twój aparat prawdopodobnie uważa za słuszne domyślnie (chyba że jest wystarczająco inteligentny, by zgadywać, że to papier) - umieszczam to w cudzysłowie, ponieważ tak naprawdę nie chcesz go przeeksponować , po prostu przeeksponuj na podstawie pomiaru na białej stronie), ponieważ główny ton (sam papier) będzie główną rzeczą, dla której aparat próbuje wystawiać, a jeśli wystawisz papier jako średni szary, będziesz mieć bardziej błotnisty punkt wyjścia. Jeśli „przeeksponujesz” o półtora do dwóch przystanków (po prostu nie przechodź do punktu przycinania podświetlenia), tekst powinien być nadal ładny i ciemny, ale papier będzie ładny i jasny, tworząc separacje kontrastowe ( a zatem OCR) łatwiej.
staraj się mieć równomierne oświetlenie - jeśli jeden róg strony jest o wiele jaśniejszy lub ciemniejszy od drugiego, utrudni to rozdzielenie rzeczy na czystą czerń i czystą biel, której najprawdopodobniej potrzebujesz do celów OCR.
„podstawka do kopiowania” jest idealna do takich projektów, choć zakładam, że w bibliotece jest coś, co można łatwo mieć… Jednak w zależności od konfiguracji biblioteki możliwe jest, że gdzieś może być (półka nad biurko czy pręt z oświetleniem lub tym podobne?), które możesz umieścić super zacisk z głowicą kulową ( tutaj , ale każdy super zacisk z odpowiednio dobranym (w zależności od głowy) „kołkiem” i jakimś statywem głowica zrobi to), a następnie kamera zostanie zamontowana nad biurkiem (lub czymkolwiek) powierzchnią, abyś mógł mieć spójne ustawienie i stabilność w przypadku, gdy potrzebujesz dłuższej ekspozycji. Zasadniczo byłoby to równoznaczne ze stanowiskiem „biedaka”.
Możesz także użyć krótkiego samowyzwalacza lub pilota (wyobrażam sobie, że twój aparat ma 2-sekundowy tryb samowyzwalacza i być może niestandardowy, który może być nawet krótszy), aby uniknąć drgań aparatu po naciśnięciu przycisku.
To wszystko, o czym teraz myślę. Mam nadzieję, że to jest pomocne.
źródło
Mam tę samą pracę, co ty, landman, i robiłem to przez lata. Większość ludzi nie wie o czym mówią, zaufaj mi !!!
Aparat na M lub manualny
ISO 100-200 im wyższy, tym jaśniejszy, ale na zdjęciu widać więcej ziarna lub hałasu
Czas otwarcia migawki od 1/100 do 1/160 (zwykle 1/125 jest najlepsza, im niższa jaśniejsza, ale dostajesz więcej pochówków lub powtórzeń)
Przysłona lub f2.7 (dlaczego potrzebujesz głębokiego pola widzenia, to płaska strona)
Fotografuj w kolorze, od 6 do 10 megapikseli, przeglądaj ustawienia balansu bieli, zwykle jarzeniowe 1 lub 2, wyłącz większość dzwonków i gwizdaj, jeśli Ur nie jest pewien, wyłącz
wystawiać zdjęcia na kompie za pomocą acdc
źródło
Kilka małych sugestii, ale myślę, że Twoja konfiguracja wygląda dobrze
Użyj statywu. Pozwoli to usunąć wszelkie problemy z drganiami aparatu i pozwoli na użycie ekspozycji tak długo, jak potrzebujesz.
Unikaj padania światła bezpośrednio na papier pod kątem, który może odbijać się prosto w obiektyw i powodować rozjaśnienie tam, gdzie go nie chcesz. Zazwyczaj oznacza to upewnienie się, że światło wychodzi z boków.
ISO: Zasadniczo powinieneś błądzić w kierunku niższej wartości, ale jestem pewien, że każda różnica materiału szybko stanie się oczywista.
Poza tym nie mogę wymyślić żadnych sposobów na poprawę konfiguracji. Szczerze mówiąc, myślę, że masz.
źródło
Wygląda na to, że masz już większość odpowiedzi :-P Dodam tylko kilka uwag do twoich punktów:
Rozdzielczość: masz rację, nie będziesz potrzebował dużo rozdzielczości, szczególnie jeśli zamierzasz oglądać obrazy na ekranie. Prawdopodobnie sam bym to ograniczył dwukrotnie przy typowej rozdzielczości ekranu.
Przysłona: masz rację, wybierając mniejszą przysłonę, aby uzyskać nieco poruszenia głębi ostrości. Jednak prawdopodobnie nie będziesz potrzebować dużo. Graj z kalkulatorem głębi ostrości dla ogniskowej, ustal rozsądną głębię ostrości, a następnie przejdź do największej możliwej apertury. (Jednak upewnij się, że jesteś o jeden lub dwa stopnie poniżej maksymalnego otworu, aby uzyskać najlepszą ostrość.) Chcesz największej przysłony, aby mieć więcej miejsca na grę z migawką i czułością ISO; patrz poniżej.
Migawka: oczywiście chcesz to tak szybko, jak to możliwe, aby zredukować drgania, a jednocześnie uzyskać wystarczającą ilość światła. Słyszałem, że różne źródła twierdzą, że „czas otwarcia migawki równy ogniskowej” pozwala uniknąć drgań; niektórzy twierdzą podwójnie. Tak więc, jeśli używasz obiektywu 50 mm, spróbuj utrzymać czas otwarcia migawki od 1/50 do 1/100. Gdy już to zrobisz, spróbuj użyć najniższej prędkości, aby zmaksymalizować światło.
ISO: powinieneś być w stanie podnieść ten dość wysoki. Szum może zmniejszyć wygląd obrazu, ale prawdopodobnie nie pogorszy zbytnio jego czytelności. To, co jest „wysokie ISO” i „zbyt głośne”, zależy od aparatu. Eksperyment. Jest to prawdopodobnie najlepszy sposób na uzyskanie prawidłowej ekspozycji w słabym świetle w porównaniu do przysłony i migawki.
Balans bieli: dla ciebie nie powinno to mieć większego znaczenia. Jeśli twój sfotografowany papier wydaje się białawy, czy to ma znaczenie? (Inna historia, jeśli fotografujesz książki z pełnokolorowymi zdjęciami, oczywiście). Jeśli chcesz to poprawić pocztą, będziesz miał stosunkowo łatwy czas, ponieważ masz dużo neutralnego papieru do pracy. Prawdopodobnie zostawiłbym twój aparat na automatycznym balansie bieli i zapomniałem o tym.
źródło