Jakie atrybuty sprawiają, że postać jest „profesjonalnej jakości”?

35

Słyszałem, jak ludzie mówią, że działki produkowane przez ORIGIN wyglądają na bardziej dopracowane i „profesjonalne”, podczas gdy działki produkowane przez Mathematica nie. Jednak większość programów do tworzenia wykresów jest dość konfigurowalna i ma to uzasadnienie, że przy odpowiednich ustawieniach takich rzeczy, jak lokalizacja znaczników i etykietowanie, wybór czcionek i kolorów, wyrównanie etykiet itp., Powinienem być w stanie zrobić rysunek z Mathematica / matplotlib / Gnuplot / etc. wygląda tak dobrze, jak te pochodzące z POCHODZENIA. Ale co to znaczy, że postać jest „profesjonalna” w tym kontekście?

Innymi słowy, jeśli moim celem jest stworzenie najlepiej wyglądających liczb możliwych do włączenia do publikacji naukowej, jakie wybory projektowe są ogólnie zalecane w odniesieniu do tego celu? Oczywiście należy wybrać odpowiedni rodzaj wykresu, np. Wykres słupkowy vs. wykres rozproszenia i skala liniowa vs. logarytmiczna, ale są to wybory, o których zawsze myślimy bez względu na to, jakiego programu do drukowania używamy. Bardziej interesują mnie rzeczy, o których zwykle nie myślimy, które są zwykle ustawione zgodnie z domyślnymi ustawieniami niektórych programów drukujących, ale które można zmienić, aby poprawić wygląd wykresu.

David Z
źródło
2
To może być nie na temat tutaj ... Zamieszczam to, aby zbadać granice możliwych do zaakceptowania pytań dotyczących wizualizacji danych (por. Meta.scicomp.stackexchange.com/questions/55/… )
David Z
5
Biorąc pod uwagę niską jakość wielu działek, które trafiają do publikacji naukowych, być może definicja społeczności wymaga poprawy!
David Ketcheson,
2
@DavidZaslavsky - Myślę, że to może być najbardziej odpowiednie miejsce na to pytanie, ponieważ jest specyficzne dla prezentacji danych naukowych, które są częścią nauki obliczeniowej. Często widziałem narzekania naukowców, że wykresy tworzone przez nasze oprogramowanie nie są zgodne ze „standardem publikacji” i muszą zostać poprawione, więc fajnie byłoby zobaczyć doświadczenia innych ludzi z tym problemem. Jak zawsze w przypadku subiektywnych pytań, odpowiedzi powinny być zgodne z sześcioma wytycznymi .
Mark Booth,
Oczywiście @Mark. Starałem się, aby było to jak najbardziej obiektywne, biorąc pod uwagę, że nie jest to kwestia techniczna.
David Z
Dzięki David, mój komentarz był bardziej skierowany do tych, którzy odpowiadali na pytania, ponieważ staraliśmy się wtedy uzyskać krótkie odpowiedzi. Sześć wytycznych woli znacznie dłużej niż krótkie, doświadczenie zamiast opinii, kontekst nad założeniem, bezstronność nad uprzedzeniami, poważne nad nonszalanckie i sugeruje tworzenie kopii zapasowych z faktami i odniesieniami itp. Wszystkie te wydają się być dobrymi rzeczami, do których należy dążyć w odpowiedziach na tego rodzaju pytanie.
Mark Booth,

Odpowiedzi:

14

IMO, co czyni cyfrę „profesjonalną jakością”, jest określone przez zasady czasopisma / wydawcy. Co faktycznie przekłada się na „jakość publikacji”, która jest względna w zależności od tego, gdzie publikujesz. Niektóre uniwersalne reguły wydają się wyróżniać - niezmiennie w stosunku do używanego oprogramowania do drukowania:

1) Rysunek powinien zawierać jak najmniej elementów wymaganych do przekazania informacji / pomysłu / argumentu. Liczbę należy łatwo odczytać / zrozumieć w ciągu kilku sekund - jeśli zrozumienie tego, co się dzieje, zajmie ci więcej czasu, może to oznaczać zbyt wiele informacji. Czasami jest to trudne do sprawdzenia, ponieważ znasz własną fabułę / dane - bez względu na to, jak bardzo są obciążone - pokazanie go kilku współpracownikom, aby sprawdzić, czy mogą je łatwo odczytać, pomaga. (nie mylić ze zrozumieniem fizycznego znaczenia postaci - zwykle zajmuje to sporo czasu).

2) Jeśli musisz użyć kolorów, najlepiej ograniczyć się do kilku, najlepiej po przeciwnej stronie koła kolorów. Np. Niebieski i czerwony jest lepszy niż niebieski i zielony. Postać może mieć wiele odcieni - ale najlepiej mieć kilka głównych kolorów. Często lubię używać niebieskiego (niskie wartości) i czerwonego (wysokie wartości) z białym przejściem pomiędzy nimi. Zawsze miej na uwadze czytelników nieświadomych kolorów.

3) Znaczniki, etykiety konturów itp. Powinny być łatwo czytelne bez lupy - więc rozmiar czcionki podobny do tekstu dziennika. Możesz sprawdzić, czy wszystko jest czytelne, drukując wydruk w formacie o szerokości od 3 do 6 cali (są to popularne rozmiary rysunków w czasopismach naukowych).

4) Na koniec upewnij się, że każdy element figury ma swój cel. Jeśli jest coś, co nie przekazuje użytecznych informacji - wyrzuć je. Pomoże to w czytelności rysunku.

W miejscu, w którym czujesz się komfortowo, dostosowując wszystkie małe elementy, które tworzą figurę - znaczniki, etykiety itp., Tak naprawdę nie ma znaczenia, którego narzędzia używasz, dopóki jesteś w stanie wygenerować czyste eps.

milancurcic
źródło
Czy możesz opracować uzasadnienie dla (1)? Kilka sekund to nie długo. Czy z powodów pragmatycznych ludzie są naprawdę bardzo zajęci, więc jeśli zrozumienie postaci zajmie więcej niż kilka sekund, nie będą się tym przejmować?
Faheem Mitha,
@ FaheemMitha Nie, tak naprawdę miałem na myśli to, że wyświadczasz czytelnikom przysługę, jeśli zachowujesz przejrzystość i prostotę. Nie trzymaj się kilku sekund jako solidnego kryterium - po prostu jestem przyzwyczajony do oceny własnych liczb. Istnieje limit ilości informacji, które możesz umieścić na jednej figurze - umieszczając zbyt wiele, możesz w rezultacie utrudnić zrozumienie treści. Twoi czytelnicy będą kłopotać się czytaniem nawet bardzo zajętych postaci, jeśli są zainteresowani twoją pracą - ale mniej zajęta postać lepiej przekazuje informacje.
milancurcic,
Nie jestem pewien, czy przyjęcie odpowiedzi na tak mgliste pytanie jest całkowicie sensowne, ale odpowiedź ta wydaje się najlepiej kodyfikować niejasne idee, o których myślałam, kiedy zadawałem to pytanie. Dostajesz więc znacznik wyboru :-)
David Z
18

Jest kilka elementów, których szukam, gdy rozważam coś „jakości publikacji” w mojej własnej pracy lub to, co rozważam, patrząc na innych. Oni są:

  1. Wysoka rozdzielczość, najlepiej oparta na wektorze. Ten powinien być już dość oczywisty, ale byłbyś zaskoczony.
  2. Brak bałaganu. Powinienem być w stanie zobaczyć, co dzieje się na twojej figurze i zobaczyć to szybko. Jest kilka rzeczy, których nienawidzę bardziej niż kogoś, kto próbuje skorzystać z przewodnika „Wysoki stosunek atramentu do papieru” i użyć go, aby wcisnąć cały rękopis w jedną postać.
  3. Drukuje dobrze. Ten jest dla mnie najważniejszy, a kiedy recenzuję artykuły, zawsze je testuję. „Czy liczby są drukowane?” Niejednokrotnie trafiałem w postaci, których punkty są całkowicie zaciemnione, gdy są drukowane w skali szarości, co czyni je bezwartościowymi dla moich celów (nie czytam na ekranach).
  4. Dowód, że twórca wie, jak korzystać z ustawień grafiki. Brak wyboru osi nieparzystej kuli, znaczniki w odpowiednim miejscu itp.
  5. W połączeniu z numerem 2 brak „rozkwitu”, który ma charakter całkowicie graficzny. Cienie, niepotrzebne trójwymiarowości itp., Które naprawdę nie robią nic, tylko marnują czas czytelników.

Większość z nich jest ściśle zależna od twórcy, a nie od programu. Widziałem straszne wykresy wykonane w R i doskonałe wykresy wykonane w Excelu.

Fomite
źródło
Grafika wektorowa jest rzeczywiście pożądana. Ale czy są jakieś powszechnie używane programy do rysowania, które nie są?
Faheem Mitha
2
Programy do rysowania? Nie o tym mogę myśleć. Programy tworzące wykresy - pakiety statystyczne i tym podobne? Wiele z nich ma formaty wyjściowe inne niż wektorowe albo dostępne, albo jako domyślne.
Fomite,
14

Jeśli mówimy o danych liczbowych, przejdę do źródeł: Edwarda Tufte'a Wizualne wyświetlanie informacji jakościowych i piękne dowody .

Pan Tufte oczywiście zagłębia się w pewne szczegóły, ale zasada, która mnie wyróżnia, to nie wydawanie atramentu na ramki i dekoracje, ale zamiast tego, aby jak najwięcej atramentu niosło informacje.

Zmieniono na wniosek Marka:

Niektóre główne punkty z wizualizacją informacje jakościowe

  • wyświetlać dane w sposób, który nie zniekształca ani nie zaciemnia tego, co ma do powiedzenia
  • rozmieszczaj wyświetlacze, aby umożliwić porównanie różnych danych na różnych poziomach
  • zintegrować aspekty graficzne z opisami statystycznymi i ustnymi
  • zmaksymalizować stosunek danych do atramentu, usuwając elementy, które nie służą żadnemu celowi (lub stają się zbędne przez inne elementy) i wykorzystuj dostępne elementy, aby przekazać dodatkowe informacje (na przykład osie, które są wariantami na wykresie pudełkowym)
  • małe wielokrotności mogą być użyte do ułożenia wyższych zestawów danych, aby umożliwić porównanie wzdłuż tych dodatkowych wymiarów

Beautiful Evidence to książka o szerszym zakresie. Po prostu odtworzę tytuły rozdziałów:

  • Mapowane obrazy: obrazy jako dowód i wyjaśnienie
  • Wykresy przebiegu w czasie: intensywna, prosta, dopasowana do słów grafika
  • Linki i strzałki przyczynowe: niejednoznaczność w działaniu
  • Słowa, liczby, obrazy - razem
  • Podstawowe zasady projektowania analitycznego
  • Korupcja w prezentacjach dowodowych: skutki bez przyczyn, zbieranie wiśni, nadmierne sięganie, chartjunk i wściekłość na zakończenie
  • Styl poznawczy PowerPoint: Rozbijanie się w obrębie korupcji
  • Rzeźbione cokoły: znaczenie, praktyka, depestestalizacja
  • Rzeźby krajobrazowe

Jedną z interesujących obserwacji w Beautiful Evidence jest to, że generalnie używamy urządzeń wyjściowych o wysokiej gęstości (drukarka 300 DPI jest obecnie urządzeniem o niskiej gęstości) do materiałów drukowanych, ale często rysujemy nasze dane na drukarce ekranowej lub liniowej, co marnuje ogromny potencjał do przekazywania informacji.

dmckee
źródło
Strona 13 Wizualnego wyświetlania informacji ilościowych zaczyna się od ładnego, punktowanego streszczenia „profesjonalnej grafiki” lub, jak to się tam nazywa, „doskonałości graficznej”.
Brian Diggs,
@Brian Diggs - Czy ty lub dmckee możecie zaktualizować tę odpowiedź podsumowaniem głównych punktów? Wielu z nas może być na tyle zainteresowanych, aby poznać podsumowanie, nie będąc wystarczająco zainteresowanym, aby wyjść i kupić książki.
Mark Booth,
@Mark: Zajmę się tym około następnego dnia ... moja kopia jest w biurze, a teraz nie jestem.
dmckee,
8

Najlepsze dane, jakie udało mi się stworzyć osobiście, to pakiet TeX PGF / TikZ . Jeśli korzystasz z LaTex, jak wielu w naukach ścisłych, prawdopodobnie już o nim słyszałeś.

Wydaje się również być liderem w pakietach graficznych LaTex. Znaczna część pytań na stronie TeX StackExchange dotyczy PGF / TikZ. Nie jestem pewien, dlaczego wyniki są tak dobre, ale z pewnością jedną z zalet PGF / TikZ w porównaniu z innymi pakietami podczas korzystania z LaTeX jest to, że po prostu lepiej integruje się z tekstem. Po pierwsze, czcionki na rysunku będą takie same jak w tekście.

Faheem Mitha
źródło
Oczywiście, właściwie to mój ulubiony sposób na robienie liczb ;-) Ale bardziej interesuje mnie, dlaczego wykresy TikZ są uważane za dobre.
David Z
1
@DavidZaslavsky: Nie wiem. Aż jest geniuszem? :-)
Faheem Mitha,
@DavidZaslavsky: Poważnie, to pytanie brzmi na temat tex.sx i prawdopodobnie zostało już tam rozwiązane.
Faheem Mitha,
1
@EpiGrad: Chciałem tylko powiedzieć, że pytanie o TikZ byłoby bardziej przydatne na tex.sx, jeśli David miałby takie zdanie. Oczywiście szersze pytanie nie dotyczy tematu tex.sx.
Faheem Mitha
1
pgfplots jest niesamowity. Domyślnie wygląda to tak, jak chcesz, tj. W pudełkach, z wyraźnymi wektorami, etykiety zgodne z tekstem, itp. Ale jest również łatwy do dostosowania. Moją ulubioną sztuczką jest zdejmowanie osi z pseudokolorowego wykresu Matlaba, przycinanie go, a następnie owijanie wokół niego osi w TikZ. W ten sposób otrzymujesz obraz rastrowy dla pseudokoloru (jest to jeden z niewielu przypadków, w których preferowana jest grafika rastrowa) oraz dobroć LaTeX dla osi i etykiet, a nawet pasek kolorów. To jedna z moich odpowiedzi przy użyciu pgfplots
qubyte
6

Prawie łatwiej jest scharakteryzować, co stanowi zły wykres, niż to, co czyni wykres dobrym.

Niektóre cechy złych wykresów:

  • Zbyt duże lub małe czcionki i symbole
  • Zbyt cienkie lub grube linie dla krzywych i innych cech wykresu
  • Zbyt wiele różnych zmiennych jest pokazywanych lub zmienianych jednocześnie
  • Nieprawidłowy wybór osi (log kontra liniowy, zakres itp.)
  • Pokazywanie trendów między punktami danych za pomocą ciągłych krzywych wskazujących progresje lub zachowanie, które mogą nie istnieć
  • Nie wskazując wielkości niepewności lub błędów
  • Źle podpisane lub oznaczone wykresy (w tym jednostki!)

Ogólnie jednak, podczas gdy większość pakietów oprogramowania jest w stanie tworzyć dobrą grafikę, prawie żaden program, w którym nigdy nie pracowałem, domyślnie jest w stanie, który produkuje dobrą grafikę. Zawsze wymagają ulepszenia: albo rozmiarów czcionek, albo zakresów wyświetlania, albo osi albo wyboru symboli i tak dalej. Obecnie wolę używać matplotlib; inni w mojej grupie przeprowadzili migrację do SciDavis.

eeismail
źródło
Nie jestem pewien, co masz na myśli, mówiąc „Nie wskazując błędów”. możesz wyjaśnić? W przeciwnym razie dobra lista.
Faheem Mitha
Zredagowano dla jasności: „Nie dając żadnej wskazówki co do wielkości niepewności lub błędów”. Jeśli jednak błędy są zbyt małe, aby je wyświetlić, można to wskazać w podpisie.
aeismail,
5

Miałem spory sukces, używając pakietu Mathematica LevelScheme . Jego model wykonania różni się nieznacznie od tradycyjnego programowania Mathematica, więc z jego użyciem wiąże się krzywa uczenia się. Ale jest w stanie zapewnić dokładną kontrolę nad generowaniem wykresów, co jest trudne w zwykłej matematyce. Ponadto, jako pakiet boczny, istnieje pakiet do generowania niestandardowych znaczników.

(Gdy pojawi się wersja z obsługą Mathematica v.8, zostanie przemianowana na SciDraw.)

rcollyer
źródło