Jak wybierać między ANOVA i ANCOVA w zaprojektowanym eksperymencie?

17

Przeprowadzam eksperyment, który obejmuje:

  • DV: Zużycie plastra (ciągłe lub może być kategoryczne)

  • IV: Zdrowa wiadomość, niezdrowa wiadomość, brak wiadomości (kontrola) (3 grupy, w których ludzie są losowo przydzielani - kategorycznie) Jest to zmanipulowana wiadomość o zdrowiu plasterka.

Następujące wartości IV można uznać za indywidualne zmienne różnicowe:

  • Impulsywność (może być kategoryczna, tj. Wysoka kontra niska lub ciągła i jest mierzona za pomocą skali)

  • Preferencje słodkiego smaku (jest to również mierzone za pomocą kwestionariusza, który ma 3 opcje do wyboru dla każdego pytania)

  • BMI - uczestnicy będą odpowiednio ważeni (można to również uznać za kategoryczne lub ciągłe).

Ponieważ grupy zostaną losowo przypisane do jednej z 3 grup, zakładam, że wykonuję ANOVA pewnego rodzaju i prawdopodobnie zastosowałbym ANOVA czynnikową, ponieważ jestem zainteresowany, który IV wpływa na DV najbardziej, ale także interakcje między IV, jak wskazują badania że istnieją zależności między niektórymi kombinacjami.

Ale nie jestem do końca tego pewien, ponieważ muszę wiedzieć, czy najlepiej jest, aby wszystkie IV były kategoryczne, ciągłe czy mieszane.

A może ANCOVA jest możliwością, a nawet regresją, ale nie jestem tego pewien, biorąc pod uwagę, że są one przypisywane do grup, a następnie klasyfikowane na podstawie odpowiedzi na ankiety.

Mam nadzieję, że ma to sens i czekam na wiadomość od kogoś na temat mojego zapytania.

mobo
źródło
Cześć Melory, to brzmi jak ciekawy eksperyment. Dla IVs, jesteś zainteresowany wiedząc, jak każdy jest związany z DVna skali ciągłej, czy jesteś bardziej zainteresowany skutkami IVgrup, m.in., że osoby z nadwagą jedzą więcej niż kawałek normalnych ludzi wagi (na swoim BMIśrodka)?
Michelle,
Cześć Michelle, dzięki za komentarze. Szczerze mówiąc, wciąż jestem na etapie rozwoju i jeżdżę wszędzie! Mam jednak wstępne cele, a mianowicie: Głównym celem obecnego badania jest zbadanie wpływu przekonań związanych z jedzeniem na temat zdrowotności żywności na faktyczne spożycie żywności. Ponadto drugorzędnym celem jest odkrycie, w jakim stopniu poszukiwanie wrażeń, preferencje dotyczące słodkiego smaku i BMI mogą złagodzić wpływ przekonań związanych z jedzeniem na przyjmowanie posiłków ”.
mobo
Cześć jeszcze raz Michelle - właśnie dodając do poprzedniego komentarza. Jednak powiedziawszy, że jestem również zainteresowany interakcjami między niektórymi IV, ponieważ badania wskazują na relacje, tj. Ludzie z nadwagą są skorelowani z poszukiwaniem wrażeń. Czy to pomaga w miejscu, w którym jestem? Chciałbym usłyszeć twoje myśli. Dzięki.
mobo
Cześć Melory, nie dodawałbym BMIjako ciągłej miary i użyłbym kategorii niedowagi / normalnej / nadwagi / otyłości, ponieważ to jest twoje pytanie badawcze, a nie to, czy liczba plasterków rośnie wraz ze wzrostem BMIwyniku. Wypróbowałbym inne IVjako ciągłe. Czy zamierzasz publikować, ponieważ byłbym profesjonalnie zainteresowany twoim tekstem?
Michelle,
Cześć Michelle, dzięki za to. Chciałbym opublikować. Czy to dla Ciebie obszar zainteresowania? Więc mówisz, że byłoby właściwe przeprowadzić ANOVA czynnikową, myślę, że mogę mieć zbyt wiele zmiennych, z którymi mógłbym próbować pracować.
mobo

Odpowiedzi:

34

W przeszłości regresję i ANOVA opracowano osobno, a częściowo ze względu na tradycję nadal często naucza się ich osobno. Ponadto ludzie często myślą, że ANOVA jest odpowiednia do zaprojektowanych eksperymentów (tj. Manipulowanie zmiennym / losowym przypisaniem) i regresja odpowiednia do badań obserwacyjnych (np. Pobieranie danych z rządowej strony internetowej i szukanie relacji). Wszystko to jest jednak trochę mylące. ANOVA jest regresją, tylko taką, w której wszystkie zmienne towarzyszące są kategoryczne. ANCOVA jestregresja z jakościowymi i ciągłymi zmiennymi towarzyszącymi, ale bez terminów interakcji między czynnikami a ciągłymi zmiennymi objaśniającymi (tj. tzw. „założenie równoległych zboczy”). Jeśli chodzi o to, czy badanie ma charakter eksperymentalny czy obserwacyjny, nie ma to związku z samą analizą.

Twój eksperyment brzmi dobrze. Analizowałbym to jako regresję (w mojej głowie mam tendencję do nazywania wszystkiego regresją). Dołączę wszystkie zmienne towarzyszące, jeśli jesteś nimi zainteresowany i / lub jeśli teorie, z którymi pracujesz, sugerują, że mogą być ważne. Jeśli uważasz, że wpływ niektórych zmiennych może zależeć od innych zmiennych, pamiętaj o dodaniu wszystkich wymaganych warunków interakcji. Należy pamiętać, że każda zmienna objaśniająca (w tym terminy interakcji!) Zużywa pewien stopień swobody, więc upewnij się, że wielkość próby jest odpowiednia. Chciałbym nie dichotomize, lub w inny sposób kategoryczny, dowolnych zmiennych ciągłych (jest to niefortunne, że praktyka ta jest powszechna, to naprawdę złą rzeczą do zrobienia). W przeciwnym razie wygląda na to, że jesteś na dobrej drodze.

Aktualizacja: Wydaje się, że istnieją pewne obawy, czy konwertować zmienne ciągłe na zmienne z tylko dwiema (lub więcej) kategoriami. Pozwól, że zajmę się tym tutaj, a nie w komentarzu. Trzymałbym wszystkie twoje zmienne jako ciągłe. Istnieje kilka powodów, dla których należy unikać kategoryzacji zmiennych ciągłych:

  1. Kategoryzując, wyrzucalibyśmy informacje - niektóre obserwacje są dalej od linii podziału, a inne są do niej bliższe, ale są traktowane tak, jakby były takie same. W nauce naszym celem jest zebranie większej liczby lepszych informacji oraz lepsza organizacja i integracja tych informacji. Wyrzucanie informacji jest po prostu sprzeczne z dobrą nauką w moim przekonaniu;
  2. Masz tendencję do tracenia mocy statystycznej, jak wskazuje @Florian (dzięki za link!);
  3. Tracisz zdolność wykrywania nieliniowych relacji, jak wskazuje @ rolando2;
  4. Co jeśli ktoś przeczyta Twoją pracę i zastanawia się, co by się stało, gdybyśmy narysowali linie kategorii b / t w innym miejscu? (Na przykład rozważmy przykład BMI, co jeśli ktoś za 10 lat, na podstawie tego, co dzieje się w literaturze w tamtym czasie, chce również wiedzieć o osobach z niedowagą i chorobliwie otyłych?) Po prostu pecha, ale jeśli utrzymasz wszystko w oryginalnej formie, każdy czytelnik może ocenić swój preferowany schemat kategoryzacji;
  5. X
    Xspline=0if X.7Xspline=X.7if X>.7
    XsplineX

Moim zdaniem najważniejsze są 1 i 5.

gung - Przywróć Monikę
źródło
Cześć Gung. Dziękuję bardzo za Twoje komentarze. Więc użyłbyś regresji i nie miałbyś żadnej z IV jako tak kategorycznej? Myślałem, że BMI może mieć nadwagę / otyłość lub być normalne; preferencje smakowe mają kategorie, a także poszukiwanie wrażeń może być kategoryczne, ponieważ są to prawdziwe / fałszywe stwierdzenia, które następnie zapewnią ocenę, którą można następnie skategoryzować. Ale czy postrzegasz je jako naprawdę ciągłe?
mobo
Cześć znowu, gung, to jest mój cel, który może również zapewnić pewną jasność: Głównym celem obecnych badań jest zbadanie wpływu przekonań związanych z jedzeniem na temat zdrowotności żywności na faktyczne spożycie żywności. Ponadto drugorzędnym celem jest odkrycie, w jakim stopniu poszukiwanie wrażeń, preferencje dotyczące słodkiego smaku i BMI mogą złagodzić wpływ przekonań związanych z jedzeniem na przyjmowanie pokarmu. Chciałbym usłyszeć twoje myśli.
mobo
Ładna odpowiedź @gung. Popieram pomysł, aby idealnie zachować ciągłe zmienne takimi, jakie są, ponieważ dałoby to najwięcej informacji. Wiele osób uważa, że ​​trudne jest nauczenie się, w jaki sposób uwzględniać zarówno predyktory ciągłe, jak i kategoryczne, ale może okazać się to opłacalne, zarówno w tym badaniu, jak i w przyszłości. I niezależnie od tego, czy je kategoryzujesz, czy nie, spróbuj poszukać sposobów na wykrycie wszelkich nieliniowych relacji, które mogą istnieć - być może w kształcie litery U, w kształcie litery U do góry nogami lub w kształcie litery J lub odwrotnej litery J. To może znacznie wzbogacić twoje badania.
rolando2
Tak +1 za odpowiedź Gunga! Dychotomizacja zmiennych ciągłych nigdy nie jest dobrym pomysłem z powodu, na przykład, utraty mocy (np. Artykuł słynnego Jacoba Cohena unc.edu/~rcm/psy282/cohen.1983.pdf ). Aby potraktować twój „komunikat” IV w analizie regresji, zalecę użycie kodów kontrastowych do przetestowania jego efektu (i interakcji z udziałem tego IV), patrz na przykład Judd, CM i McClelland, GH, Ryan, C. (2008 ). Analiza danych: metoda porównywania modeli (wydanie 2). Nowy Jork: Routledge Press.
Florian
Cześć rolando2, dziękuję bardzo za twoją opinię. Masz rację, ponieważ trudno mi połączyć zmienne kategoryczne i ciągłe, co utrudnia mi określenie, jakiej analizy użyć. Moim wstępnym celem jest: Głównym celem obecnych badań jest zbadanie wpływu przekonań związanych z jedzeniem na temat zdrowotności żywności na faktyczne spożycie żywności. Ponadto drugorzędnym celem jest odkrycie, w jakim stopniu poszukiwanie wrażeń, preferencje dotyczące słodkiego smaku i BMI mogą złagodzić wpływ przekonań związanych z jedzeniem na przyjmowanie posiłków ”. Myśli na ten temat?
mobo