Łatwe wyjaśnienie wykresu współrzędnych równoległych

13

Przeczytałem i widziałem wiele wykresów współrzędnych równoległych. Czy ktoś może odpowiedzieć na następujący zestaw pytań:

  1. Czym są wykresy współrzędnych równoległych (PCP) w prostych słowach, aby laik mógł to zrozumieć?
  2. Matematyczne wyjaśnienie z pewną intuicją, jeśli to możliwe
  3. Kiedy PCP jest przydatne i kiedy go używać?
  4. Kiedy PCP nie są przydatne i kiedy należy ich unikać?
  5. Możliwe zalety i wady PCP
suncoolsu
źródło
Świetny temat - Otrzymasz wiele + 1 za to pytanie ...
Tal Galili,
1
@Tal .. dzięki :-) Ale chciałem dowiedzieć się więcej i być może rozwinąć artykuł na Wiki, który nie jest zbyt pouczający.
suncoolsu,
Świetna zachęta :)
Tal Galili

Odpowiedzi:

6

Wydaje mi się, że główną funkcją PCP jest uwypuklenie jednorodnych grup osób lub odwrotnie (w podwójnej przestrzeni, analogicznie do PCA) specyficznych wzorów asocjacji na różnych zmiennych. Tworzy skuteczne graficzne podsumowanie wielowymiarowego zestawu danych, gdy nie ma zbyt wielu zmiennych. Zmienne są automatycznie skalowane do ustalonego zakresu (zwykle 0–1), co jest równoważne pracy ze zmiennymi znormalizowanymi (aby zapobiec wpływowi jednej zmiennej na inne ze względu na problem ze skalowaniem), ale dla bardzo wielowymiarowych zestawów danych (# zmiennych> 10), zdecydowanie musisz spojrzeć na inne ekrany, takie jak wykres fluktuacji lub mapa termiczna stosowane w badaniach mikromacierzy.

Pomaga odpowiedzieć na pytania takie jak:

  • czy istnieje jakiś spójny wzorzec indywidualnych wyników, który można wyjaśnić przynależnością do określonej klasy (np. różnica płci)?
  • X1X2)

Na poniższym wykresie danych z tęczówki wyraźnie widać, że gatunki (tutaj pokazane w różnych kolorach) wykazują bardzo zróżnicowane profile, biorąc pod uwagę długość i szerokość płatka, lub że setosa tęczówki (niebieski) są bardziej jednorodne pod względem długości płatka ( tzn. ich wariancja jest niższa), na przykład.

alternatywny tekst

Możesz nawet użyć go jako zaplecza do technik klasyfikacji lub redukcji wymiarów, takich jak PCA. Najczęściej, wykonując PCA, oprócz zmniejszenia przestrzeni cech, chcesz również wyróżnić klastry osób (np. Czy są osoby, które systematycznie osiągają wyższe wyniki w przypadku niektórych kombinacji zmiennych); zwykle dzieje się tak z powodu zastosowania pewnego rodzaju hierarchicznego grupowania wyników czynników i podkreślenia wynikowego członkostwa w klastrze w przestrzeni czynnikowej (patrz pakiet FactoClass R).

Jest również stosowany w klastrach ( Wizualizowanie niehierarchicznych i hierarchicznych analiz klastrów ), które mają na celu zbadanie ewolucji alokacji klastrów przy zwiększaniu liczby klastrów (patrz także: Jakie kryteria zatrzymania dla aglomeracyjnych hierarchicznych klastrów są stosowane w praktyce? ).

Takie wyświetlacze są również przydatne, gdy są połączone ze zwykłymi wykresami rozrzutu (które ze względu na konstrukcję są ograniczone do relacji 2D), jest to nazywane szczotkowaniem i jest dostępne w systemie wizualizacji danych GGobi lub oprogramowaniu Mondrian .

chl
źródło
4

Jeśli chodzi o pytania 3, 4 i 5, proponuję sprawdzić tę pracę

Postrzeganie wzorów we współrzędnych równoległych: ustalanie progów dla identyfikacji relacji przez: Jimmy Johansson, Camilla Forsell, Mats Lind, Matthew Cooper w wizualizacji informacji, tom. 7, nr 2. (2008), s. 152–162.

Podsumowując swoje odkrycia, ludzie są w stanie określić kierunek nachylenia relacji między każdym węzłem, ale nie są tak dobrzy w określeniu siły zależności lub stopnia nachylenia. Podają sugerowane poziomy hałasu, w których ludzie mogą nadal rozszyfrować związek w artykule. Niestety artykuł nie omawia identyfikowania podgrup za pomocą kolorów, jak pokazuje chl.

Andy W.
źródło
4

Proszę odwiedzić http://www.cs.tau.ac.il/~aiisreal/, a także spojrzeć na nową książkę

Równoległe współrzędne - ta książka dotyczy wizualizacji, systematycznie włączając fantastyczne rozpoznawanie ludzkich wzorców do procesu rozwiązywania problemów ... www.springer.com/math/cse/book/978-0-387-21507-5.

W rozdz. 10 istnieje wiele prawdziwych przykładów z danymi wielowymiarowymi pokazującymi, w jaki sposób można wykorzystać współrzędne równoległe (skrót || -cs). Warto także nauczyć się matematyki, aby wizualizować i pracować z relacjami wielowymiarowymi / wielowymiarowymi (powierzchniami), a nie tylko z zestawami punktów. Fajnie jest oglądać i pracować z analogami znanych obiektów w wielu wymiarach, np. Paskiem Moebiusa, zestawami wypukłymi i nie tylko.

W skrócie ||-c to wielowymiarowy układ współrzędnych, w którym osie są równoległe do siebie, umożliwiając widzenie wielu osi. Metodologię zastosowano do algorytmów rozwiązywania konfliktów w kontroli ruchu lotniczego, wizji komputerowej, kontroli procesów i wsparciu decyzyjnym.

użytkownik1366
źródło