Materiały do ​​nauki używania (/ tworzenia) dynamicznej (/ interaktywnej) wizualizacji statystycznej

14

Chciałbym dowiedzieć się nieco więcej na temat interaktywnej wizualizacji danych (powiększanie, wskazywanie, szczotkowanie, mapowanie punktów i tak dalej). Chciałbym powitać każdego:

  1. Samouczek / przewodnik / książka (?) / Wideo na temat korzystania z takich metod w badaniach statystycznych.
  2. Wskaźniki dobrych / interesujących interaktywnych pakietów danych (w R i poza nim)

Wystarczy, aby rozpocząć toczenia piłki, wiem, że w R istnieją różne sposoby, aby uzyskać interaktywną wizualizację, jak rggobi , nowy pakiet googleViz R The pakiet animacji i inni. Ale jeśli są inne pakiety warte zbadania (oferujące rzeczy, których R nie ma), chętnie bym się o nich dowiedział (np. Jmp, mathlab, spss, sas, excel i tak dalej).

ps: to pierwsze pytanie, w którym należy użyć tagu „interaktywna wizualizacja”

Tal Galili
źródło
Myślę, że @Shane będzie miał coś do powiedzenia tutaj, mówiąc o webvis (parser dla protovis), ponieważ protovis (poświęcony wizualizacji internetowej) ( vis.stanford.edu/protovis ) zawiera możliwość interaktywnej grafiki ...
robin girard
W wersji R istnieją również iPloty i Rgl , ale rozwiązania oparte na JavaScript lub Python mogą być bardziej elastyczne.
Vincent Zoonekynd,

Odpowiedzi:

13

Oprócz Protovis (HTML + JS) lub Mayavi (Python) polecam Przetwarzanie, które jest

język programowania i środowisko open source dla osób, które chcą tworzyć obrazy, animacje i interakcje. Początkowo opracowany, aby służyć jako szkicownik oprogramowania i uczyć podstaw programowania komputerowego w kontekście wizualnym.

Na stronie http://www.openprocessing.org/ znajduje się wiele skryptów o otwartym kodzie źródłowym oraz wiele powiązanych książek dotyczących przetwarzania, ale także wizualizacji danych.

Wiem, że istnieje projekt dostarczenia interfejsu R, przetwarzania , ale nie wiem, jak to działa. Istnieje również interfejs z clojure / incanter (patrz np. Tworzenie wizualizacji przetwarzania za pomocą Clojure i Incanter ).

Istnieje wiele zasobów internetowych, w tym notatki klasy Stanforda, np. CS448B lub 7 klasycznych dokumentów Visation Founders , których możesz nie chcieć publicznie wyznać, że nie wiesz .

chl
źródło
6

Kilka dodatkowych pakietów do dodania do sugestii Chl dotyczącej przetwarzania w celu tworzenia interaktywnych wizualizacji. Wszystkie są oparte na javascript i mogą działać w przeglądarce, więc mogą być używane do publikowania, a także do własnej analizy:

  • D3.js jest następcą Protovis. Jest bardziej wydajny, ponieważ masz większą kontrolę nad tworzonymi obiektami (są to właściwe obiekty DOM, tj. Masz pełną kontrolę nad nimi za pomocą javascript), ale niektórzy wolą Protovis dla uproszczenia. Dobra techniczna dyskusja D3 vs Protovis tutaj .
  • Raphael.js jest dobrą opcją dla wysoce spersonalizowanej interaktywności na rynku masowym, ponieważ jest zarówno przyszłościowy (bez flasha) i działa w przeglądarkach starszych niż IE6 (jedyne, o czym nie wiem, to stare wersje przeglądarka Android). Podobnie jak D3, wszystko jest obiektem docelowym DOM i ma dobrze zbudowane kontrolki API do animacji i interaktywności. Nie oferuje niczego gotowego do użycia, co jest specyficzne dla wizualizacji: jest to bardzo mocny i elastyczny blank, świetny wybór do projektowania niestandardowych wizualizacji, ale nie do własnej wstępnej analizy eksploracyjnej. Najpierw zapoznaj się ze swoimi danymi.
  • gRaphael.js to standardowe wykresy (słupek, linia itp.) dla Raphaela. Jest prosty, ale działa i można go rozbudowywać - może być przydatnym składnikiem, jeśli budujesz swój własny zestaw.

Jeśli chodzi o inne pytanie dotyczące uczenia się, dla ogólnych zasad, Information Dashboard Design zasługuje na wzmiankę, jeśli chcesz stworzyć tablicę interaktywnych standardowych narzędzi ogólnego przeznaczenia do swoich danych.

Interaktywne wizualizacje są na granicy między statystykami a projektowaniem interaktywności : więc książki na ten temat mogą się przydać. Nie mam osobistego doświadczenia z żadnym z wielu podręczników do projektowania interakcji, ale jestem wielkim fanem Universal Principles of Design . Może to być przesada w stosunku do twoich potrzeb, ale zastanów się, czy nie spojrzeć w dół na kolumnę Użyteczność na doskonałej stronie Treści kategoryczne i przeczytać wymienione rozdziały (stopniowe ujawnianie, sygnał do szumu itp.).

Ponadto, dla każdego, kto nie zna się na programowaniu, Programowanie Interaktywności jest dobrym miejscem na rozpoczęcie doskonalenia umiejętności technicznych (zawiera również spory rozdział o przetwarzaniu).

Ale dla wiedząc, co działa, a co jest możliwe, nie można pokonać uczenia się przez działanie , a dobry kick-start może być rozważenie spływu i analizowania wielkich nazwisk big-cena-tag ogólnego zastosowania interaktywnych pakietów wizualizacyjnych jak tableau i JMP i zastanów się, dlaczego ich funkcje zostały zaprojektowane tak, jak są.

user56reinstatemonica8
źródło
Dzięki za edycję w whuberu linków - pobij mnie!
user56reinstatemonica8
4

Oprócz Przetwarzania sprawdź także Nodebox (1, 2, OpenGL) oparty na Pythonie, zainspirowany Przetwarzaniem:

Nodebox 1 to tylko Mac, podczas gdy Nodebox 2 i wersja OpenGL są wieloplatformowe.

Python ma mnóstwo bibliotek do kruszenia danych, które można zaimportować do Nodebox, np. Scipy.org

Ed Hagen
źródło
1

Jako odrębne podejście do istniejących odpowiedzi, wkrótce po tym, jak opublikowałem swoją pierwszą długą listę, pojawiła się firma WEAVE : pakiet dedykowany do wizualizacji danych o otwartym kodzie źródłowym. Oto krótki artykuł na temat WEAVE na wiodącym blogu Flowing Data

Mądrze jest zastosować inne podejście do wizualizacji danych w zależności od tego, gdzie jesteś w trakcie procesu. Im wcześniej jesteś - im więcej danych jest nieprzetworzonych i niezbadanych - tym bardziej prawdopodobne jest, że skorzystasz z gotowych, elastycznych pakietów ogólnego przeznaczenia, takich jak WEAVE i komercyjne odpowiedniki o zamkniętym źródle, takie jak Tableau i JMP - możesz szybko wypróbować i bezboleśnie, aby poznać dane i dowiedzieć się, jakie linie ataku podjąć, aby jak najlepiej je wykorzystać.

Gdy odkryjesz więcej na temat danych, prawdopodobnie skupisz się na komunikacji lub „eksploracji z przewodnikiem” - bardziej spersonalizowanych wizualizacjach danych eksploracyjnych zaprojektowanych w oparciu o zastrzeżenia, niuanse i obszary zainteresowania, które odkryłeś w danych. W tym miejscu powstają produkty z pustych tablic, takie jak wymienione powyżej programowe narzędzia do rysowania wektorów.

user56reinstatemonica8
źródło