Najlepsze ustawienia aparatu do fotografowania tekstu?

11

Używam S95 do fotografowania dokumentów tekstowych (zarówno papierowych, jak i mikrofilmowych) dla OCR. Pytałem już o problemy dotyczące najlepszego sfotografowania ekranu komputera dla mikrofilmów, ale zastanawiałem się nad najlepszym sposobem fotografowania tekstu, aby tekst był wyraźny i wyraźny. Oto moje obecne przemyślenia, ale chciałbym usłyszeć, co ma do powiedzenia każdy, kto ma więcej doświadczenia fotograficznego niż ja:

  1. Używam mniejszej liczby megapikseli (około 6-7MP zamiast maksimum S95, czyli 10MP), tak że powstałe pliki PDF nie zabijają mojego komputera, kiedy faktycznie je przewijam

  2. Przysłona - niższa (np. F / 6.3), dzięki czemu jeśli aparat nie jest dokładnie równoległy do ​​strony, tekst pozostanie ostry

  3. Czas otwarcia migawki - tutaj jest kompromis, ponieważ biblioteki są zwykle słabiej oświetlone, więc chciałbym obniżyć czas otwarcia migawki, aby zwiększyć ekspozycję, ale bez statywu istnieje szansa, że ​​aparat się zatrzęsie

  4. ISO - Nie jestem do końca pewien, jak to na to wpłynie.

  5. Balans bieli - Znowu, nie bardzo do końca pewny.

Eksperymentowałem z różnymi ustawieniami w aparacie, ale dopiero uczę się fotografii i chciałbym wiedzieć, czy ktoś ma jakieś sugestie, jak najlepiej sfotografować tekst, z książek lub dokumentów, który jest łatwy do odczytania.

Jason
źródło
3
Dlaczego nie skorzystać z odpowiedniego narzędzia do pracy i skanera?
ahockley,
7
„Dlaczego po prostu nie użyć odpowiedniego narzędzia do pracy i skanera?” - Ponieważ wielu dokumentów, z którymi pracuję, nie można skanować. Są albo bardzo delikatne, albo biblioteka nie pozwala na skanowanie, lub biblioteka pobiera wygórowane koszty skanowania w górę o 0,50 USD / stronę.
Jason
2
Chciałbym, aby zostało powiedziane: mam nadzieję, że twoje zastosowania odpowiednio szanują prawa autorskie, jeśli i tak istotne. :) Zakładając, że mam nadzieję, że znajdziesz odpowiedzi!
Lindes
3
„Mam nadzieję, że twoje zastosowania odpowiednio szanują prawa autorskie” - Tak, moja praca dotyczy dokumentów nieobjętych ograniczeniami praw autorskich (jestem historykiem, głównie studiuję Europę z końca XIX wieku)
Jason
2
@ahockley: innym powodem, dla którego nie należy skanować, jest to, że zajmuje to bardzo dużo czasu. Dzięki lustrzance cyfrowej mogę robić około 20 stron na minutę na blacie stołu, ale skaner, który szybko korzysta z podajnika dokumentów i kosztuje dużo.

Odpowiedzi:

7

Jeśli twój aparat ma tryb czarno-biały, postaram się to skrócić czas przetwarzania końcowego. Ponadto wiele programów OCR, z którymi pracowałem, działa znacznie lepiej w trybie czarno-białym.

Będziesz chciał ustawić się jak najbardziej równolegle do strony, ponieważ aby zmniejszyć drgania aparatu podczas trzymania ręki, prawdopodobnie będziesz potrzebować największej przysłony, aby maksymalnie wydłużyć czas otwarcia migawki. Mały czujnik na twoim s95 powinien zwiększyć DOF na tyle, że otworzę aperturę tak szeroką, jak tylko możesz.

Biorąc pod uwagę, że po prostu uruchomisz to za pomocą OCR, zwiększ ISO do tego, co zapewnia odpowiednią ekspozycję przy minimalnym wstrząsie. OCR rzadziej narzeka na dodatkowy szum niż rozmyte litery.

Balans bieli, jeśli mówisz tylko o tekście, powinien być odpowiedni dla dowolnego ustawienia kamery w pomieszczeniu, ale szczerze mówiąc, nie przejmuj się tym zbytnio.

Twoje megapiksele mogą mieć znaczenie tylko wtedy, gdy tekst dokumentu jest niewiarygodnie mały i musisz wyraźnie rozwiązać ten poziom szczegółowości, ale domyślam się, że 6-7 będzie w porządku dla większości rzeczy.

rfusca
źródło
1
Prawdopodobnie masz na myśli „prostopadłą do strony”. Jeśli jesteś równoległy, trudno będzie odczytać tekst. ;-)
Craig Walker
@Craig Walker - użył terminów „równolegle” do strony i zrozumiałem, co miał na myśli, więc nie próbowałem go pomylić. Nie wspominając o tym, że sam czujnik byłby równoległy, podobnie jak wizjer. To zależy tylko od tego, do której części kamery się odwołujesz. Termin był zamierzony.
rfusca
Używaj możliwie największej liczby megapikseli, ważne są dokumenty OCR, które będą względnie małe i tak długo, jak źródłem będzie cały tekst, niezależnie od rozdzielczości kamery. Używam Abbyy FineReader i działa lepiej na obrazach o wyższej rozdzielczości (na przykład 21MP zamiast 10MP). Strzelaj więc w 10 MP.
Słusznie.
Craig Walker,
+1 dla trybu czarno-białego. RGB do przetwarzania tekstu marnuje piksele.
Greg
2

Wygląda na to, że już dobrze znasz ustawienia. Drgania aparatu zrujnują czytelność tekstu bardziej niż cokolwiek innego, dlatego najpierw go zoptymalizuję. Jeśli nie możesz użyć statywu, upewnij się, że czas otwarcia migawki wynosi co najmniej 1 na całej długości ogniskowej (odpowiednik 35 mm). Oddalenie ułatwi to. Użyj stabilizacji obrazu, jeśli go masz.

Przysłona może być ustawiona dość szeroko, po prostu upewnij się, że jesteś równoległy do ​​strony. Szeroki otwór przysłony pomoże w czasie otwarcia migawki, ponownie rozmycie z powodu szerokiej przysłony jest niczym w porównaniu z rozmyciem spowodowanym ruchem aparatu!

ISO, wszystko czego potrzebujesz, aby uzyskać dobrą ekspozycję. Hałas nie powinien wpływać na czytelność, dopóki nie stanie się naprawdę zły.

Preferowane byłoby fotografowanie niestandardowego balansu bieli na podstawie samego papieru, ale oprogramowanie OCR powinno być w stanie poradzić sobie z białawym tłem.

Matt Grum
źródło
1
  1. Zakładam, że konwertujesz pliki JPEG na pliki PDF. Zalecam uchwycenie maksimum i użycie programu do zmniejszenia rozmiaru do 6-7 MP z wyostrzaniem zastosowanym po zmniejszeniu i przed konwersją do formatu PDF.

  2. Aby to wyjaśnić, potrzebujesz węższej przysłony dla większej głębi ostrości, która jest wyższą liczbą przysłony. (np. chcesz f / 8 zamiast f / 2). Aby tekst był czytelny, staraj się, aby kamera była skierowana możliwie prostopadle, abyś nie musiał się martwić o głębię ostrości. Dobrym pomysłem jest zatrzymanie się nieco od szeroko otwartego, aby zmniejszyć aberracje, takie jak CA, które zobaczysz czarno-białym tekstem. Im bliżej papieru, tym głębsza będzie głębia ostrości.

  3. Prawdopodobnie będzie to miało największy wpływ na czytelność, jeśli trzymasz się za ręce. Jeśli trzymasz się za ręce, chcesz wybrać czas otwarcia migawki taki, aby był on dłuższy niż 1 / (odpowiednik ogniskowej 35 mm) lub nawet szybszy. Zależy to od tego, jakiego ustawienia powiększenia używasz w swoim P&S. Jeśli użyjesz szerokiego końca, możesz uciec przed dłuższymi czasami otwarcia migawki, ale możesz uzyskać zniekształcenie beczki. Jeśli fotografujesz dokumenty tekstowe, a nie ekran komputera, zalecam skorzystanie z lampy błyskowej.

    Jeśli możesz, podeprzyj dokument (oklejoną taśmą lub coś płaskiego), abyś mógł na nim oprzeć aparat i uzyskać tak długi czas otwarcia migawki, jak chcesz. Możesz również użyć torby na beanbag lub małych przedmiotów, aby ustawić aparat pod kątem. Można również uzyskać adaptery do statywów do butelek wodnych do P&S.

  4. Przysłona, czas otwarcia migawki i ISO tworzą trójkąt ekspozycji. Przeczytaj o tym tutaj . Im wyższy ISO, tym węższy otwór przysłony i krótszy czas otwarcia migawki, ale można uzyskać bardziej hałaśliwy obraz. Polecam niski ISO (400 lub mniej) dla P&S z tekstem.

  5. Wybierz balans bieli dla swojej sytuacji oświetleniowej. Jeśli masz fluorescencyjny, użyj tego. Jeśli używasz lampy błyskowej, użyj balansu bieli lampy błyskowej.

Eruditass
źródło
Nie sądzę, że f / 8 jest realistyczny do fotografowania z ręki w pomieszczeniach (chyba że używasz lampy błyskowej, musisz najpierw poprosić bibliotekę o pozwolenie), a f / 8 spowoduje rozproszenie uwagi małym czujnikiem, przyrost ostrości jest minimalny w porównaniu do wymaganego wydłużenia czasu otwarcia migawki / ISO.
Matt Grum,
@Matt f / 8 jest przykładem pokazującym, że chce, aby większa liczba zwiększyła głębię pola (i zmniejszyła inne aberracje, takie jak CA, które mogą być widoczne). Nie dałem mu wskazówek, ponieważ nie jestem pewien, ile światła ma. Roztargnienie? Masz na myśli dyfrakcję?
Eruditass,
Tak, miałem na myśli dyfrakcję - piszę to na swoim telefonie, który ma irytujący zwyczaj autokorektyzacji moich słów, nawet jeśli poprawnie je przeliterowałem. CA nie będzie poważnym problemem (w porównaniu z drganiami aparatu), myślę, że najlepiej byłoby zatrzymać się od szeroko otwartego, jeśli światło jest dużym problemem ...
Matt Grum
Nie lubisz technologii? Tak, powiedziałbym, że jeden przystanek od szeroko otwartego jest dobrą wskazówką i zgadzam się, że poruszenie kamery byłoby sednem.
Eruditass,
To naprawdę dobra sugestia, aby strzelać z maksymalną liczbą MP, a następnie próbkować w dół na komputerze. Mogę sobie wyobrazić, że wyostrzenie + dodatkowy kontrast spowoduje, że tekst będzie ostrzejszy i łatwiejszy do odczytania.
Jason
1

Zgadzam się z sugestiami dotyczącymi fotografowania w najwyższej dostępnej rozdzielczości i zmniejszania rozmiaru w komputerze. Wybierz także najwyższej jakości JPEG, który możesz uzyskać z aparatu, lub nawet fotografuj na surowo, jeśli kamera na to pozwala, i przekonwertuj na tiff lub png. Kompresja stratna w jpeg może tworzyć artefakty wokół granicy atramentu / papieru, które mogłyby wprowadzić w błąd oprogramowanie ocr.

Ogólnie rzecz biorąc, chcesz użyć ustawień, które pozwolą uzyskać najostrzejszy możliwy obraz. Rzeczy takie jak kontrast, balans bieli itp. Można zmienić na komputerze. W rzeczywistości zwiększenie kontrastu za pomocą narzędzia poziomów lub narzędzia kontrastu / jasności w Photoshopie lub GIMP może ci bardzo pomóc.

Ponadto konwersja do formatu skali szarości znacznie zmniejszy rozmiar twoich plików. A jeśli to zrobisz i zwiększysz kontrast, tak naprawdę nie musisz się martwić o balans bieli. Możesz eksperymentować z balansem bieli, jednak niektóre ustawienia mogą dawać lepszy kontrast niż inne (zależy to od oświetlenia).

Jeśli komputer może to obsłużyć, wykonaj wszystkie korekty (skala szarości, kontrast, jasność) przed zmniejszeniem, a po zmniejszeniu zastosuj filtr wyostrzający do obrazu.

Jan Hlavacek
źródło
1

Kilka myśli, których nigdzie indziej nie zauważyłem, do dodania do miksu:

  • Jeśli strzelać „powiększony” (więcej teleobiektywu ), spowoduje to, aby strzelać dalej od strony, która będzie następnie daje bardziej spójnego obrazu w stosunku do rozmiaru o tekście (słowa w kącie będzie bliżej taki sam rozmiar jak słowa na środku; przy szerokim kącie możesz uzyskać zniekształcenie w związku z tym). Nie jestem pewien, jakie jest tutaj „idealne” ustawienie, i jest to kompromis z wymaganymi czasami otwarcia migawki, potencjalnie tylko coś do przemyślenia.

  • Będziesz chciał „ przeeksponować ” w porównaniu z tym, co twój aparat prawdopodobnie uważa za słuszne domyślnie (chyba że jest wystarczająco inteligentny, by zgadywać, że to papier) - umieszczam to w cudzysłowie, ponieważ tak naprawdę nie chcesz go przeeksponować , po prostu przeeksponuj na podstawie pomiaru na białej stronie), ponieważ główny ton (sam papier) będzie główną rzeczą, dla której aparat próbuje wystawiać, a jeśli wystawisz papier jako średni szary, będziesz mieć bardziej błotnisty punkt wyjścia. Jeśli „przeeksponujesz” o półtora do dwóch przystanków (po prostu nie przechodź do punktu przycinania podświetlenia), tekst powinien być nadal ładny i ciemny, ale papier będzie ładny i jasny, tworząc separacje kontrastowe ( a zatem OCR) łatwiej.

  • staraj się mieć równomierne oświetlenie - jeśli jeden róg strony jest o wiele jaśniejszy lub ciemniejszy od drugiego, utrudni to rozdzielenie rzeczy na czystą czerń i czystą biel, której najprawdopodobniej potrzebujesz do celów OCR.

  • „podstawka do kopiowania” jest idealna do takich projektów, choć zakładam, że w bibliotece jest coś, co można łatwo mieć… Jednak w zależności od konfiguracji biblioteki możliwe jest, że gdzieś może być (półka nad biurko czy pręt z oświetleniem lub tym podobne?), które możesz umieścić super zacisk z głowicą kulową ( tutaj , ale każdy super zacisk z odpowiednio dobranym (w zależności od głowy) „kołkiem” i jakimś statywem głowica zrobi to), a następnie kamera zostanie zamontowana nad biurkiem (lub czymkolwiek) powierzchnią, abyś mógł mieć spójne ustawienie i stabilność w przypadku, gdy potrzebujesz dłuższej ekspozycji. Zasadniczo byłoby to równoznaczne ze stanowiskiem „biedaka”.

    Możesz także użyć krótkiego samowyzwalacza lub pilota (wyobrażam sobie, że twój aparat ma 2-sekundowy tryb samowyzwalacza i być może niestandardowy, który może być nawet krótszy), aby uniknąć drgań aparatu po naciśnięciu przycisku.

To wszystko, o czym teraz myślę. Mam nadzieję, że to jest pomocne.

Lindes
źródło
1

Mam tę samą pracę, co ty, landman, i robiłem to przez lata. Większość ludzi nie wie o czym mówią, zaufaj mi !!!

  1. Aparat na M lub manualny

  2. ISO 100-200 im wyższy, tym jaśniejszy, ale na zdjęciu widać więcej ziarna lub hałasu

  3. Czas otwarcia migawki od 1/100 do 1/160 (zwykle 1/125 jest najlepsza, im niższa jaśniejsza, ale dostajesz więcej pochówków lub powtórzeń)

  4. Przysłona lub f2.7 (dlaczego potrzebujesz głębokiego pola widzenia, to płaska strona)

  5. Fotografuj w kolorze, od 6 do 10 megapikseli, przeglądaj ustawienia balansu bieli, zwykle jarzeniowe 1 lub 2, wyłącz większość dzwonków i gwizdaj, jeśli Ur nie jest pewien, wyłącz

  6. wystawiać zdjęcia na kompie za pomocą acdc

spencer
źródło
0

Kilka małych sugestii, ale myślę, że Twoja konfiguracja wygląda dobrze

  1. Użyj statywu. Pozwoli to usunąć wszelkie problemy z drganiami aparatu i pozwoli na użycie ekspozycji tak długo, jak potrzebujesz.

  2. Unikaj padania światła bezpośrednio na papier pod kątem, który może odbijać się prosto w obiektyw i powodować rozjaśnienie tam, gdzie go nie chcesz. Zazwyczaj oznacza to upewnienie się, że światło wychodzi z boków.

  3. ISO: Zasadniczo powinieneś błądzić w kierunku niższej wartości, ale jestem pewien, że każda różnica materiału szybko stanie się oczywista.

Poza tym nie mogę wymyślić żadnych sposobów na poprawę konfiguracji. Szczerze mówiąc, myślę, że masz.

AJ Finch
źródło
Czy możesz zasugerować dobry (i stosunkowo niedrogi) statyw, który byłby przydatny, i pozwolić mi odwrócić aparat, aby był skierowany równolegle do stron, które fotografuję? Spojrzałem na statywy Joby i wyglądają obiecująco, ale słyszałem, że często zmieniają się, gdy uderzasz w migawkę.
Jason
@Jason, sprawiedliwy punkt. Mam Joby'ego, który mi się podoba, ale aby go zatrzymać, gdy naciskasz migawkę, po prostu użyj zdalnego spustu migawki lub samowyzwalacza. To jest naprawdę dobra wskazówka, gdy używasz długiego czasu otwarcia migawki. Zła wiadomość jest taka, że ​​każdy statyw wystarczająco ciężki, aby był bardzo stabilny, nie będzie tani. Przepraszam za to! (Jeśli dowiesz się inaczej, daj mi znać!);)
AJ Finch
0

Wygląda na to, że masz już większość odpowiedzi :-P Dodam tylko kilka uwag do twoich punktów:

  1. Rozdzielczość: masz rację, nie będziesz potrzebował dużo rozdzielczości, szczególnie jeśli zamierzasz oglądać obrazy na ekranie. Prawdopodobnie sam bym to ograniczył dwukrotnie przy typowej rozdzielczości ekranu.

  2. Przysłona: masz rację, wybierając mniejszą przysłonę, aby uzyskać nieco poruszenia głębi ostrości. Jednak prawdopodobnie nie będziesz potrzebować dużo. Graj z kalkulatorem głębi ostrości dla ogniskowej, ustal rozsądną głębię ostrości, a następnie przejdź do największej możliwej apertury. (Jednak upewnij się, że jesteś o jeden lub dwa stopnie poniżej maksymalnego otworu, aby uzyskać najlepszą ostrość.) Chcesz największej przysłony, aby mieć więcej miejsca na grę z migawką i czułością ISO; patrz poniżej.

  3. Migawka: oczywiście chcesz to tak szybko, jak to możliwe, aby zredukować drgania, a jednocześnie uzyskać wystarczającą ilość światła. Słyszałem, że różne źródła twierdzą, że „czas otwarcia migawki równy ogniskowej” pozwala uniknąć drgań; niektórzy twierdzą podwójnie. Tak więc, jeśli używasz obiektywu 50 mm, spróbuj utrzymać czas otwarcia migawki od 1/50 do 1/100. Gdy już to zrobisz, spróbuj użyć najniższej prędkości, aby zmaksymalizować światło.

  4. ISO: powinieneś być w stanie podnieść ten dość wysoki. Szum może zmniejszyć wygląd obrazu, ale prawdopodobnie nie pogorszy zbytnio jego czytelności. To, co jest „wysokie ISO” i „zbyt głośne”, zależy od aparatu. Eksperyment. Jest to prawdopodobnie najlepszy sposób na uzyskanie prawidłowej ekspozycji w słabym świetle w porównaniu do przysłony i migawki.

  5. Balans bieli: dla ciebie nie powinno to mieć większego znaczenia. Jeśli twój sfotografowany papier wydaje się białawy, czy to ma znaczenie? (Inna historia, jeśli fotografujesz książki z pełnokolorowymi zdjęciami, oczywiście). Jeśli chcesz to poprawić pocztą, będziesz miał stosunkowo łatwy czas, ponieważ masz dużo neutralnego papieru do pracy. Prawdopodobnie zostawiłbym twój aparat na automatycznym balansie bieli i zapomniałem o tym.

Craig Walker
źródło