Jestem doktorantem z psychologii eksperymentalnej i staram się doskonalić swoje umiejętności i wiedzę na temat analizy moich danych.
Do piątego roku studiów w psychologii myślałem, że modele podobne do regresji (np. ANOVA) zakładają następujące rzeczy:
- normalność danych
- jednorodność wariancji danych i tak dalej
Moje studia licencjackie doprowadziły mnie do przekonania, że założenia dotyczyły danych. Jednak w moim piątym roku niektórzy z moich instruktorów podkreślili fakt, że założenia dotyczą błędu (szacowanego przez resztki), a nie surowych danych.
Ostatnio rozmawiałem o pytaniu o założenia z niektórymi z moich kolegów, którzy również przyznali, że odkryli znaczenie sprawdzania założeń dotyczących rezydualnych dopiero w ostatnich latach studiów.
Jeśli dobrze rozumiem, modele podobne do regresji przyjmują założenia dotyczące błędu. Dlatego sensowne jest sprawdzenie założeń dotyczących reszt. Jeśli tak, to dlaczego niektórzy sprawdzają założenia dotyczące surowych danych? Czy to dlatego, że taka procedura sprawdzająca jest zbliżona do tego, co uzyskalibyśmy poprzez sprawdzenie pozostałości?
Byłbym bardzo zainteresowany dyskusją na ten temat z niektórymi ludźmi, którzy mają dokładniejszą wiedzę niż moi koledzy i ja. Z góry dziękuję za odpowiedzi.
źródło
Rozróżnienie między danymi resztowymi a danymi surowymi uważam za nieprzydatne, ponieważ oba odnoszą się bardziej do faktycznej próby, a nie do podstawowego rozkładu populacji. Lepiej jest myśleć o tym, że jednym z wymagań jest „wymagania w grupie”, a inne „między założeniami grupy”.
Na przykład jednorodność wariancji jest „założeniem międzygrupowym”, ponieważ mówi, że wariancja wewnątrz grupy jest taka sama dla wszystkich grup.
Normalność jest założeniem „wewnątrz grupy”, które wymaga, aby w każdej grupie y rozkład był normalny.
Zauważ, że normalność w stosunku do całego surowca zwykle oznacza, że nie masz żadnego efektu - spójrz na rozkład płci bez rozróżnienia między kobietami i mężczyznami. Nie będzie normalnie dystrybuowany z powodu silnego efektu płci. Ale w przypadku każdej płci ma się całkiem dobrze.
źródło