Staram się wizualizować niektóre dane konsumentów, które mają 4 kategorie. Użytkownicy mogą swobodnie przełączać się między różnymi kategoriami. Chciałbym wizualizować ostatnie trzy lub cztery przełączniki dla każdej osoby.
Zaczniemy więc od wykresu z kolumną o 4 stosach. Potem będziemy mieli 16, ponieważ każda kategoria dzieli się na to, co ludzie robili przy poprzedniej okazji, a potem 64 itd., Dopóki pojemniki nie staną się zbyt małe, aby były przydatne.
Myślę, że gdzieś pomiędzy mapą marimekko a ułożonym na wykresie słupkowym lub dendro gramem powinno działać, ale nawet nie wiem, jak to by się nazywało!
Jeśli ktoś może pomóc w rodzaju fabuły, której powinienem użyć, a jeśli chcesz być wyjątkowo miły, jak wdrożyć go w R, byłbym bardzo wdzięczny.
źródło
Odpowiedzi:
Jednym z potencjalnych pomysłów jest wykorzystanie diagramów Sankeya do udokumentowania przepływu wyborów między kategoriami. Są dwa przykłady opisujące to, o czym mówię;
Z aktualizacją niektórych obaw wyrażonych w komentarzach. Wydaje mi się, że program Parallel Sets robi to, co chcesz od razu po wyjęciu z pudełka. Poniżej znajduje się wynik programu, w którym utworzyłem 4 losowe zmienne z 4 kategoriami. Każda grupa, którą zainicjujesz na górze ekranu, zostanie kolejno podzielona między kolejne kategorie. Tworzenie podziału, którego pragniesz.
Na tym obrazie również nie widać, pakiet ma interaktywną funkcjonalność, która pozwala na łatwiejszą analizę danych eksploracyjnych, na przykład po najechaniu kursorem na jedną z kategorii, wszystkie jego potomkowie są podświetleni.
Przesłałem ten sam zestaw danych do Fineo, który możesz przeglądać tutaj . Oprócz początkowych zmiennych kategorii 4 (nazwanych43)
dec1
nadec4
) zawarłem również skonkatenowane kategorie, które pozwalają zbadać podzielone kategorie. Konwencja nazewnictwa dla zmiennych zexp
sufiksem polega na tym, że jest todec
zmienna rozwinięta przez konkatenację poprzednich wybranych kategorii. Więcdec3_exp12
będzie oznaczony jako121
gdybydec1 = 1 and dec2 = 2 and dec3 = 1
. Możesz utworzyć taką samą strukturę typu podziału w Fineo, która jest dostępna w ParSets, ale w tym przykładzie nie można renderować kategorii z lub więcej węzłami.Po zabawie z Fineo abit bardziej jest to fajna aplikacja, ale jest naprawdę ograniczona. Zestawy równoległe mają znacznie większą funkcjonalność, dlatego sugeruję sprawdzenie tego przed aplikacją Fineo.
Myślę, że program ParSets jest znacznie lepszą opcją niż sukcesywne dzielenie kategorii na podzbiory w celu zbadania. Na przykład, przy użyciu tych samych losowych danych, jak powyżej, tutaj jest wykres kropkowy wykreślający kategorie proporcji w
decision 2
wybranych, zależnie od wybranej kategoriidecision 1
.Możesz dokonać tego samego podziału dla zmiany z
decision 2
nadecision 3
, ale zrobić mały wielokrotny wykres dla tego, codecision 1
było początkowe .Możesz kontynuować to w nieskończoność (patrz poniżej). To może być pouczające, ale podejrzewam, że byłoby dość zniechęcające, zanim dotrzesz do wielu innych paneli. Poniżej jest zgodnie z życzeniem, wizualizując 4 kolejne wybory kategorii.
Jak wspomniano wcześniej, małe liczby do czasu podzielenia grafiki na tak wiele kategorii są problematyczne. Jednym ze sposobów, aby to wyjaśnić, jest odwzorowanie estetyki, takiej jak rozmiar, na linię bazową, na której opiera się proporcja. Zmniejsza to obserwacje oparte na mniejszych liczbach z widoku. Możesz także użyć przezroczystości (ale już uczyniłem punkty przezroczystymi, aby rozróżnić punkty przerysowane w tym przykładzie).
Wyobrażam sobie, że niektórzy wyobrażali sobie choinkową strukturę węzłów zamiast wykresów punktowych, ale nie wiem, jak zrobić taką grafikę. Podejrzewam jednak, że podejrzewa ten sam przytłaczający problem. Te małe wielokrotności nie są złe, ale IMO Zestawy Równoległe są dużo bardziej intuicyjne i podejrzewam, że niektóre nieoczywiste wzory byłyby bardziej widoczne w tej wizualizacji. Może ktoś bardziej pomysłowy ode mnie może wymyślić bardziej interesujące dane niż tylko 4 losowe kategorie.
źródło