Materiały do ​​nauki tworzenia wizualizacji danych?

19

Chciałbym dowiedzieć się, jak tworzyć wizualizacje widoczne na stronie http://flowingdata.com i informationisbeautiful. EDYCJA: Znaczenie, wizualizacje, które są interesujące same w sobie - trochę jak grafika NY Times, w przeciwieństwie do szybkiego czegoś na raport.

Jakiego rodzaju narzędzia są używane do ich tworzenia - czy to w większości dużo Adobe Illustrator / Photoshop? Jakie są dobre zasoby (książki, strony internetowe itp.), Aby dowiedzieć się, jak korzystać z tych narzędzi w szczególności do wizualizacji danych?

Wiem, jak chcę, aby wyglądały wizualizacje (i znam zasady projektowania, np. Z książek Tufte'a), ale nie mam pojęcia, jak je tworzyć.

raegtin
źródło

Odpowiedzi:

20

Przepływające dane regularnie omawiają narzędzia, których używa. Zobacz na przykład:

Pokazuje również bardzo szczegółowo, jak tworzy grafiki przy takich okazjach, jak:

Na tej stronie znajdują się również inne pytania:

IMO, spróbuj:

  1. R i ggplot2: jest to dobry film wprowadzający , ale witryna ggplot2 ma wiele zasobów.
  2. Przetwarzanie: mnóstwo dobrych samouczków na stronie głównej .
  3. Protovis: także mnóstwo świetnych przykładów na stronie głównej .

Możesz później użyć Adobe, aby je wyczyścić.

Możesz także spojrzeć na webvispakiet R , chociaż nie jest tak kompletny jak ggplot2. Z poziomu R możesz uruchomić to polecenie, aby zobaczyć przykład pszenicy Playfair:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

Wreszcie, moje ulubione aplikacje komercyjne do interaktywnej wizualizacji to:

Shane
źródło
1
Niesamowite, świetne linki! Korzystam już z R i ggplot2, ale wizualizacje z tego miejsca wydają się bardziej „różnorodne w grafice do raportu”, niż w „ciekawych z samej siebie oczkach / wizualizacjach”, których szukam. (ggplot2 jest super piękny, ale tak naprawdę nie ma na celu umożliwienia nieograniczonej kreatywności.) Czy się mylę ?, czy czasami używasz R / ggplot2 jako danych wejściowych do innego narzędzia do wizualizacji?
raegtin
5

Wspomniane już przetwarzanie zawiera ładny zestaw książek. Patrz: 1 , 2 , 3 , 4 , 5 , 6 , 7

W sieci znajdziesz wiele rzeczy, które pomogą Ci zacząć od R. Kolejny krok to ggplot2 ma doskonałą dokumentację internetową . Znalazłem też Hadleya książka bardzo pomocna.

Python może być inną drogą. Zwłaszcza z narzędziami takimi jak:

Wszystkie projekty są dobrze udokumentowane w Internecie. Możesz także zajrzeć do niektórych książek .

Wreszcie książka z grafiką dużych zbiorów danych może być również pomocna.

radek
źródło
igraphdziała również w R; dla 3D z akceleracją openGL w R, użycie rgli misc3dpakiety.
Również matplotlibfabuły są brzydkie; mogą być przyjemne dla długoletniego użytkownika gnuplot.
2

Spędzisz dużo czasu na przyspieszaniu z R.

RapidMiner jest darmowy, open source i graficzny, i ma wiele dobrych wizualizacji, które można eksportować.

Jeśli masz pieniądze do stracenia, lub jesteś pracownikiem uniwersyteckim / studentem, JMP jest również bardzo fajny. Może bardzo łatwo tworzyć bardzo ładne wykresy. Może eksportować do Flasha, PNG lub PDF lub co masz.

Neil McGuigan
źródło
5
1. Czas IMHO spędzony z R jest dobrze zainwestowany, jeśli planujesz zrobić coś poważnego. 2. Rozważ również KNIME knime.org jako alternatywę RapidMiner.
radek
(+1) @radek. Jestem także fanem rapidminera, ale moim zdaniem nie jest wystarczająco elastyczny, aby tworzyć wyrafinowane wizualizacje.
steffen
Jeśli masz jakieś doświadczenie w programowaniu, nie będziesz potrzebować więcej niż jeden dzień, aby przyśpieszyć korzystanie z R. Jest to dość proste, jeśli chodzi o języki, a także kilka doskonałych samouczków online.
naught101
1

Inną dobrą alternatywą jest biblioteka protovis http://vis.stanford.edu/protovis/

Jest to bardzo dobrze spreparowana biblioteka JavaScript, która może tworzyć piękne wizualizacje, jeśli masz czas i możliwość napisania skromnej ilości potrzebnego kodu JavaScript.

Bardzo polecam także Tableau http://www.tableausoftware.com . Doskonale nadaje się do szybkiego przeglądania zestawów danych i tworzenia wielu różnych wizualizacji.

Oba produkty mają swoje korzenie w Stanford Visualization Group.

Alex Blakemore
źródło
1

Podano wiele doskonałych odpowiedzi, a języki / biblioteki, których wybierzesz, będą zależeć od rodzaju wizualizacji, którą chcesz wykonać.

Jeśli jednak regularnie używasz Pythona, zdecydowanie polecam dno morskie . Jest bardzo wyrafinowany, jeśli chodzi o wizualizację danych statystycznych, ale również wygląda dość wyrafinowany z punktu widzenia prezentacji.

Weźmy przykład. Załóżmy, że próbujesz wykreślić zużycie energii elektrycznej w budynku komercyjnym według miesiąca. W tym celu w matplotlib można wygenerować prosty wykres liniowy.

Gdybyśmy jednak chcieli, aby wizualizacja była bardziej wyrafinowana i zawierała więcej informacji, moglibyśmy wygenerować mapę termiczną z dnem morskim:

Mapa ciepła

Mapa termiczna to tylko jeden przykład. Niektóre inne powszechne zastosowania z dnem morskim obejmują:

  • Wykresy KDE
  • Wykresy roju
  • Działki skrzypcowe

Ideą dna morskiego jest prezentacja danych w bardziej intuicyjny sposób, niż byłoby to możliwe przy użyciu prostszych wykresów, np. Linii, słupka, ciasta itp.

Jeśli Cię to interesuje - więcej informacji na temat ptaków morskich można znaleźć tutaj: https://seaborn.pydata.org/

Michael Grogan
źródło
0

R jest świetny, ale nie jest tak, że R jest trudny do nauczenia, tylko dlatego, że w dokumentacji nie można szukać żadnej innej nazwy, na przykład Rq byłby świetny. Kiedy pojawia się problem, poszukiwanie rozwiązania jest koszmarem, a dokumentacja też nie jest świetna. Matlab lub Octave będą świetne. A umieszczenie tych działek w R lub Matlabie byłoby bardzo, bardzo nudne.

Wizualna obróbka końcowa IMHO to najlepsza droga. Wiele z nich pochodzi z Adobe Illustratora lub Gimpa. To jest szybsze. Po uzyskaniu struktury fabuły zmień szczegóły w edytorze. Używanie R jako edytora nie daje pożądanej elastyczności. Cały czas będziesz szukać nowych pakietów.

Vass
źródło
R; function??- R ma wbudowaną pomoc. zazwyczaj możesz także wyszukać „cran”, aby znaleźć R, i uważam, że większość głównych wyszukiwarek potrafi dobrze obsługiwać pojedynczą literę.
naught101
0

Oto samouczek YouTube na D3.js, który uczy podstaw HTML, SVG, CSS i JavaScript, a także sposobu ładowania danych i tworzenia wykresu słupkowego, wykresu liniowego i wykresu punktowego za pomocą D3.js.

Miniatura wideo

curran
źródło
-3

Istnieją nieskończone zasoby, ale możesz je zawęzić w zależności od tego, w jaki sposób chcesz przekształcić swoje dane, z iloma źródłami danych masz do czynienia, w jaki sposób należy je udostępnić itp.

Oto przewodnik, w jaki sposób wybrać odpowiedni zasób, który może pomóc we właściwym kierunku.

Scott Morris
źródło
1
Ponieważ jesteś powiązany z tą grupą, zadeklaruj zainteresowanie. Tylko odpowiedzi na linki nie są najbardziej pomocne. Mogą obowiązywać porady na stronie stats.stackexchange.com/help/promotion .
Nick Cox