Jakie są popularne opcje wizualizacji danych 4-wymiarowych?

12

Powiedzmy, że mam następujące czterowymiarowe dane, w których pierwsze trzy można uznać za współrzędne, a ostatnie za wartości.

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

Jak lepiej zobrazować wpływ pierwszych trzech współrzędnych na ostatnią wartość?

Mam świadomość trzech metod.

Jednym z nich jest wykres 3D dla pierwszych trzech współrzędnych z rozmiarem punktów jako czterema wartościami. Ale nie jest łatwo dostrzec trend w danych.

Inny używa serii wykresów 3D, z których każda ma ustaloną współrzędną. wprowadź opis zdjęcia tutaj

Kolejnym może być tak zwane „wykresy kratowe” w kratce R.Nie sur eif jest do tego celu, ale wydaje się, że tak. wprowadź opis zdjęcia tutaj

Tyler 傲 来 国 主
źródło
2
Czy potrzebujesz wyświetlacza statycznego (np. Na papier)?
gung - Przywróć Monikę

Odpowiedzi:

12

Jeśli pierwsze trzy są tylko współrzędnymi przestrzennymi, a dane są rzadkie, możesz po prostu wykonać wykres rozproszenia 3D z punktami o różnej wielkości lub kolorze dla wartości.

Wygląda mniej więcej tak: (źródło: gatech.edu )Rozpraszać

Jeśli twoje dane mają być ciągłe i istnieją w siatce kratowej, możesz wykreślić kilka izokontur danych za pomocą Marching Cubes .

Innym podejściem w przypadku gęstych danych 4D jest wyświetlanie kilku „wycinków” 2D danych osadzonych w 3D. Będzie to wyglądać mniej więcej tak:

Plastry

Mklingen
źródło
Kolorowy wykres rozrzutu 3D jest naprawdę odpowiedni tylko dla ciągłych funkcji danych 3D. Jeśli gradient funkcji zmienia się płynnie, możesz zobaczyć wzór na rozproszeniu punktowym. Podobnie wizualizacja objętości u dołu działa najlepiej również w tym scenariuszu. Jeśli funkcja jest bardzo głośna, trudno będzie ci coś zobaczyć. Jeśli masz 4 zmienne objaśniające (np. Do robienia PCA lub grupowania), wykreśl 3 we współrzędnych euklidesowych i 4 przy użyciu niektórych nieliniowych mapowań do koloru, wprowadzając pewne odchylenie percepcyjne, którego nie można oszacować ilościowo.
Dianne Cook
@DianneCook to prawda.
Wydaje
Hej, właśnie o to pytał% ^)
Dianne Cook
9

Czy masz cztery zmienne ilościowe? Jeśli tak, spróbuj tras, równoległych wykresów współrzędnych, macierzy wykresów rozrzutu. Pakiet tourr (i tourrGui) w R będzie uruchamiał wycieczki, w zasadzie rotację w wysokich wymiarach, możesz wybrać wyświetlanie w 1D, 2D lub więcej, i jest artykuł JSS, który możesz przeczytać, aby zacząć cytować w pakiecie. Równoległe wykresy współrzędnych i macierze rozrzutu znajdują się w pakiecie GGally, również macierze rozrzutu znajdują się w pakiecie YaleToolkit. Możesz również zajrzeć na http://www.ggobi.org filmy i więcej dokumentacji na ich temat.

Jeśli twoje dane są całkowicie kategoryczne, powinieneś użyć wykresów mozaikowych lub wariantów. Spójrz na pakiet wykresów produktu w R, również vcd ma pewne rozsądne funkcje lub pakiet ggparallel, aby wykonać odpowiednik równoległych wykresów współrzędnych dla danych kategorycznych. Ponadto właśnie odkryłem, że pakiet extracat ma pewne funkcje do wyświetlania danych kategorycznych.

Pierwotnie źle odczytałem pytanie, ponieważ zatrzymałem się na nim i zaniedbałem przeczytać pełny opis. Podobnie jak w poniższym podejściu (punkty kolorowania w 3D), możesz użyć połączonego pędzla, aby zbadać funkcje zdefiniowane w przestrzeniach o dużych wymiarach. Spójrz na wideo , które pokazuje, jak to zrobić dla normalnej funkcji 3D na wielu odmianach. Pędzel maluje punkty o wysokiej gęstości (wysokie wartości funkcji), a następnie przesuwa się do niższych i niższych wartości gęstości (niskie wartości funkcji). Lokalizacje, w których próbkowana jest funkcja, są pokazane na obrotowym wykresie rozrzutu 3D, przy użyciu trasy, której można również użyć do obejrzenia domen 4, 5 lub wyższych wymiarów.

Dianne Cook
źródło
2

Wypróbuj twarze Chernoffa . Chodzi o to, aby dołączyć zmienne do rysów twarzy. Na przykład rozmiar uśmiechu byłby jedną zmienną, okrągłość twarzy to inna itd. Choć to brzmi absurdalnie, może to faktycznie zadziałać, jeśli znajdziesz sprytny sposób mapowania zmiennych na obiekty.

Innym sposobem jest pokazanie rzutów 2D trójwymiarowego diagramu fazowego. Powiedzmy, że masz x1, x2, x3, x4 swoje zmienne. Dla każdej wartości x4 narysuj wykres 3-d punktów (x1, x2, x3) i połącz punkty. Działa to najlepiej, gdy zamówione jest x4, np. Data lub godzina.

AKTUALIZACJA: Możesz także wypróbować wykresy bąbelkowe. Trzy wymiary będą zwykle kartezjańskie x, y, z, a czwarty wymiar będzie wielkością punktu bąbelkowego.

Możesz spróbować animacji, tzn. Użyć czasu jako czwartego wymiaru.

Również kombinacja bańki i animacji: x, y, bańka i czas.

Z Chernoffem związana jest również fabuła glifów , która może wyglądać nieco poważniej. To gwiazdy o długości promieni proporcjonalnych do zmiennych wartości.

Aksakal
źródło
Dziękuję za Twoją odpowiedź. Wydaje się, że druga opcja jest możliwa dla mojego problemu. Myślę, że pierwszy nie wydaje się tak poważny jak na artykuł badawczy. Zasadniczo chciałbym, aby fabuła ujawniła pewien trend lub wpływ trzech czynników na wartość (czwarty wymiar).
Tyler 主 来 国 主
5
Twarze Chernoffa zostały wykorzystane w poważnych badaniach, afaik.
Aksakal
1
Ściany Chernoffa mogą być niezwykle przydatne, zwłaszcza gdy wymiar wynosi około 10-20 zmiennych. W przypadku czterech wymiarów nie są one tak skuteczne, jak inne rodzaje reprezentacji graficznych.
whuber
3
twarze chernoffa to okropny pomysł! jeśli musisz użyć wykresu ikon, użyj wykresu gwiazdy. Jeśli masz naprawdę mały zestaw danych, mogą być przydatne, ale spróbuj wykreślić 1000 ikon i sprawdź, czy naprawdę możesz coś zobaczyć!
Dianne Cook