Jakie są dobre sposoby na wizualizację zestawu odpowiedzi Likerta?
Na przykład zestaw elementów pytających o znaczenie X w podejmowaniu decyzji dotyczących A, B, C, D, E, F i G? Czy jest coś lepszego niż skumulowane wykresy słupkowe?
- Co należy zrobić z odpowiedziami N / A? Jak mogą być reprezentowani?
- Czy wykresy słupkowe powinny podawać wartości procentowe, czy liczbę odpowiedzi? (tj. czy pręty powinny mieć tę samą długość?)
- Jeśli wartości procentowe, mianownik powinien zawierać nieprawidłowe i / lub nie dotyczyły odpowiedzi?
Mam własne poglądy, ale szukam pomysłów innych ludzi.
R
użytkownikom, że tego rodzaju wykresy są zaimplementowane w pakiecieHH
. Aby zrobić wrażenie, możesz spróbowaćlikert(t(apply(data, 2, table)))
.Skumulowane wykresy słupkowe są na ogół dobrze rozumiane przez statystystów, pod warunkiem, że są delikatnie wprowadzane. Przydatne jest skalowanie ich według wspólnej miary (np. 0-100%), ze stopniowym kolorem dla każdej kategorii, jeśli są to pozycje porządkowe (np. Likert). Wolę dotchart (wykres kropkowy Cleveland), gdy nie ma zbyt wielu przedmiotów i nie więcej niż 3-5 kategorii odpowiedzi. Ale tak naprawdę jest to kwestia przejrzystości wizualnej. Zasadniczo podam%, ponieważ jest to miara standardowa, i raportuję tylko% i zlicza z nieskumulowanym wykresem słupkowym. Oto przykład tego, co mam na myśli:
Lepsze renderowanie można osiągnąć za pomocą
lattice
lubggplot2
. Wszystkie elementy mają te same kategorie odpowiedzi w tym konkretnym przykładzie, ale w bardziej ogólnym przypadku możemy spodziewać się różnych, więc pokazanie ich wszystkich nie wydawałoby się zbędne, jak ma to miejsce w tym przypadku. Możliwe byłoby jednak nadanie tego samego koloru każdej kategorii odpowiedzi, aby ułatwić czytanie.Powiedziałbym jednak, że skumulowane wykresy słupkowe są lepsze, gdy wszystkie elementy mają tę samą kategorię odpowiedzi, ponieważ pomagają docenić częstotliwość modalności jednej odpowiedzi między elementami:
Mogę również wymyślić jakąś mapę termiczną, która jest przydatna, jeśli istnieje wiele przedmiotów o podobnej kategorii odpowiedzi.
Należy zgłaszać brakujące odpowiedzi (zwłaszcza gdy nie są one nieistotne lub zlokalizowane w odniesieniu do konkretnego elementu / pytania), najlepiej dla każdego elementu. Zasadniczo% odpowiedzi dla każdej kategorii jest obliczany bez NA. Tak zwykle robi się w ankiecie lub psychometrii (mówimy o „wyrażonych lub zaobserwowanych odpowiedziach”).
PS Mogę wymyślić bardziej wymyślne rzeczy, takie jak obrazek pokazany poniżej (pierwszy został wykonany ręcznie, drugi pochodzi z
ggplot2
,ggfluctuation(as.table(tab))
), ale nie sądzę, aby zawierał tak dokładne informacje jak kropka lub wykres słupkowy, ponieważ zmiany powierzchni są trudne doceniać.źródło
Myślę, że odpowiedź chl jest świetna.
Jedną rzeczą, którą mogę dodać, jest przypadek, w którym chciałbyś porównać korelację między elementami. W tym celu można użyć czegoś w rodzaju macierzy rozproszenia wykresu korelacji dla danych uporządkowanych według kategorii
(Ten kod nadal wymaga drobnych poprawek - ale daje ogólny pomysł ...)
źródło
pairs.panels
funkcję wpsych
pakiecie autorstwa W Revelle.