Kontekst:
Mam dwa zestawy danych z tego samego kwestionariusza przeprowadzonego przez dwa lata. Każde pytanie mierzone jest za pomocą 5-stopniowej skali.
Q1: Schemat kodowania
W tej chwili zakodowałem swoje odpowiedzi w przedziale [0, 1], gdzie 0 oznacza „najbardziej negatywną odpowiedź”, 1 oznacza „najbardziej pozytywną odpowiedź”, a inne odpowiedzi są rozmieszczone równomiernie.
- Jakiego „najlepszego” schematu kodowania użyć w skali Likerta?
Zdaję sobie sprawę, że może to być nieco subiektywne.
Q2: Znaczenie na przestrzeni lat
- Jaki jest najlepszy sposób ustalenia, czy nastąpiła statystycznie istotna zmiana w ciągu dwóch lat?
To znaczy, patrząc na wyniki dla pytania 1 dla każdego roku, jak stwierdzić, czy różnica między wynikiem z 2011 r. A wynikiem z 2010 r. Jest statystycznie znacząca? Mam niejasne wspomnienie o zastosowaniu testu t Studenta, ale nie jestem pewien.
źródło
Wilcoxon Ranksum Test znany również jako Mann-Whitney jest dobrym rozwiązaniem w przypadku danych porządkowych. Rozwiązanie do ładowania początkowego jest również eleganckie, choć nie jest to „klasyczny” sposób. Metoda ładowania początkowego może być również cenna w przypadku, gdy dążysz do innych rzeczy, takich jak analiza czynnikowa. W przypadku analizy regresji możesz wybrać zamówiony probit lub logit jako specyfikację modelu.
BTW: Jeśli Twoja skala ma większy zakres (> 10 wartości na zmienną), możesz użyć wyników jako zmiennej metrycznej, co czyni test t bezpiecznym wyborem. Pamiętaj, że jest to trochę brudne i przez niektórych może być uważane za dzieło diabła.
stephan
źródło