Kontynuując moje wcześniejsze posty, o ile rozumiem, jeśli mam trzy współczynniki korelacji, będę musiał je przetestować parami, aby zobaczyć, czy istnieje między nimi znacząca różnica.
Oznacza to, że musiałbym użyć transformacji Fishera do obliczenia wyniku z r, a następnie wartości p z (co robią zalecane kalkulatory we wcześniejszych postach, na szczęście), a następnie ustalić, czy wartość p jest wyższa czy niższa niż moja wartość alfa (0,05) dla każdej pary.
tzn. jeśli 21 do 30 lat to grupa wiekowa 1, 31 do 40 lat to grupa wiekowa 2, a 41 do 50 lat to grupa wiekowa 2, moje porównanie korelacji między ich nawykami zakupowymi a utratą masy ciała byłoby:
- Grupa 1 a grupa 2
- Grupa 1 a grupa 3
- Grupa 2 vs. grupa 3
Czy zamiast wykonać trzy osobne obliczenia, istnieje sposób na wykonanie wszystkich tych obliczeń w jednym kroku?
źródło
Odpowiedzi:
Twoje pytanie jest doskonałym przykładem modeli regresji z predyktorami ilościowymi i jakościowymi . W szczególności trzy grupy wiekowe - - są zmiennymi jakościowymi, a zmiennymi ilościowymi są nawyki zakupowe i utrata masy ciała (zgaduję, ponieważ obliczasz korelacje).1 , 2 , i3)
Muszę podkreślić, że jest to znacznie lepszy sposób modelowania niż obliczanie osobnych korelacji grupowych, ponieważ masz więcej danych do modelowania, dlatego twoje oszacowania błędów (wartości p itp.) Będą bardziej wiarygodne. Bardziej technicznym powodem jest wynikający z tego wyższy stopień swobody w statystyce testu t do testowania istotności współczynników regresji.
Działając zgodnie z zasadą, że jakościowymi predyktorami można zarządzać za zmiennych wskaźnikowych , potrzebne są tutaj tylko dwie zmienne wskaźnikowe, , które są zdefiniowane w następujący sposób:do c - 1 X1,X2)
Oznacza to, że grupa jest reprezentowana przez ; stanowią odpowiedź - zakupy zwyczaj jako i ilościowej odchudzania zmiennej objaśniającej jak . Pasujesz teraz do tego modelu liniowego3) X1= 0 ,X2)= 0 Y W.
Jak przeprowadzane są testy? Zasadniczo po dopasowaniu modelu i uzyskaniu oszacowań należy przetestować niektóre kontrasty. Specjalnie dla twoich porównań:
źródło
Testowanie parami w tej sytuacji nie jest (jeszcze) uzasadnione opisem danych. Powinieneś używać metod regresji wielu zmiennych. Wywołanie R może być:
Konstruowanie 3 kategorii nie jest najlepszą metodą kontrolowania wieku (lub analizowania jego wkładu, jeśli jest to podstawowe pytanie), ponieważ kategoryzacja może zniekształcać ciągłe relacje, a terminy splajnowe eliminują potrzebę wybierania dowolnych punktów podziału. Po uzyskaniu wystarczających dowodów na powiązanie zmiany masy po odpowiedniej analizie będą dostępne opcje testowania ad hoc.
(Zgodziłem się z większością tego, co @whuber wyraził w komentarzu, i ogólnie uważam jego komentarz za autorytatywny, ale nie rozumiem jego stanowiska w sprawie podejść do regresji).
źródło