Zmienne zależne od filogenetyki: ANOVA?

13

Rozumiem, że wyprowadzanie macierzy kowariancji z danych filogenetycznych w celu uzyskania dla dwóch zmiennych, na których dokonuje się regresji. Ale co się stanie, jeśli masz jedną zmienną ciągłą, która wcześniej była zależna od filogenezy, i jedną zmienną porządkową? Ten ostatni jest porządkowy, nie jestem pewien, jak powiązać to ze sposobem, w jaki zależność filogenetyczna powoduje tendencyjne statystyki testowe.cov(X,Y)=0

Czy sensowne jest obliczenie niezależnych kontrastów filogenetycznych Felsensteina na zmiennej ciągłej i wykorzystanie ich do analizy ANOVA?

Wartość PIC to:

Cij=(XiXj)dij

Gdzie jest X dla gatunku I , X j jest X dla gatunku j i d i j to odległość między parami gatunków í i j na drzewa filogenetycznego.XiXi,XjXjdijij

użytkownik1134516
źródło
1
W CrossValidated jest wystarczająco dużo statystycznych zastosowanych, że możemy rozważyć migrację tego do strony statystyk.
Daniel Standage
2
Poleciłbym listę mailingową r-sig- phylo ( stat.ethz.ch/mailman/listinfo/r-sig-phylo ). Nawet jeśli nie używasz R do analizy, otrzymasz bardzo dobre odpowiedzi na swoje pytanie.
kmm

Odpowiedzi:

1

Pierwszym krokiem, który zaleciłbym, jest wprowadzenie zmiennej zastępczej dla każdej klasy porządkowej (patrz komentarze na https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta edu / wydziału / kunovich / Soci5304_Handouts / wątek% 25208_Dummy% 2520Variables.doc i CD = 2 & ved = 0CCAQFjAB i USG = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ i sig2 = 9hkDU6Y2mpKcGzBTIK8jog ) i wykreślić odpowiednich środków z analizy regresji obojętne zmienna. Możesz również przetestować trend w samych zmiennych zastępczych. Możesz także ponownie uporządkować kategorię zmiennych porządkowych według odpowiedniej szacunkowej wielkości zmiennych zastępczych do późniejszej analizy, jeśli jest to uzasadnione wcześniej (aby zobaczyć aktualne dane).

Zakładając, że w poprzedniej analizie brakuje efektu rosnącego trendu (niekoniecznie liniowego) i uwzględnienie jakiegokolwiek obsługiwanego uporządkowania w samej zmiennej porządkowej, ciekawym podejściem, które rozwiązuje również możliwe problemy z normalnością, jest przeprowadzenie analizy regresji, w której wszystkie zmienne mają przypisane szeregi, w tym zmienna porządkowa. Uzasadnieniem tego szaleństwa jest cytowanie z Wikipedii współczynnika korelacji rang Spearmana (link: http://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient):

„Współczynnik Spearmana, jak każde obliczenie korelacji, jest odpowiedni zarówno dla zmiennych ciągłych, jak i dyskretnych, w tym zmiennych porządkowych. [1] [2]”

Wikipedia przedstawia przykład i kilka sposobów oceny błędu standardowego obliczonej korelacji rang do testowania. Zauważ, że jeśli nie jest ona statystycznie różna od zera, to wersja skalowana, podobnie jak w regresji obliczeniowej opartej na szeregach, jest podobnie, nieistotna.

Dalej normalizowałbym te szeregi (dzieląc przez liczbę obserwacji), podając możliwą przykładową interpretację kwantową (uwaga, możliwe są udoskonalenia w konstruowaniu rozkładu empirycznego dla danych). Wykonałbym również prostą korelację między y a daną transformowaną zmienną porządkową, aby kierunek wybranego przez ciebie rankingu (na przykład od 1 do 4 w porównaniu z 4 do 1) wytworzył znak dla korelacji rang, który ma intuicyjne znaczenie w kontekście twojego badania.

[Edytuj] Należy pamiętać, że modele ANOVA mogą być prezentowane w formacie regresji z odpowiednią matrycą projektową, a przy każdym standardowym modelu regresji, który badasz, centralnym tematem jest oparta na średniej analiza Y dla X. Jednak w niektórych dyscyplinach, takich jak ekologia, owocne okazało się inne skupienie na relacjach regresji implikowane przy różnych kwantylach, w tym medianie. Podobno w ekologii średnie efekty mogą być małe, ale niekoniecznie w innych kwantylach. To pole nazywa się regresją kwantową. Sugeruję, abyś zastosował go w celu uzupełnienia bieżącej analizy. Jako odniesienie możesz znaleźć artykuł 213-30 „Wprowadzenie do regresji kwantowej i procedury QUANTREG” autorstwa Colina (Lin) Chena z SAS Institute.

Tutaj znajduje się również źródło dotyczące wykorzystania przekształceń rang: „Zastosowanie przekształceń rang w regresji” Ronalda L. Imana i WJ Conover, opublikowane w Technometrics, tom 21, nr 4, listopad 1979 r. Artykuł zauważa, że ​​regresje stosowanie transformacji rang wydaje się działać całkiem dobrze na danych monotonicznych. Opinię tę podzielają również specjaliści od niezawodności, którzy stwierdzają w magazynie internetowym, aby zacytować: „Metoda szacowania regresji rangi jest całkiem dobra w przypadku funkcji, które można zlinearyzować”. Źródło: „Reliability Hotwire, wydanie 10, grudzień 2010 r.

AJKOER
źródło
anonimowy użytkownik próbuje wprowadzić dość obszerne (IMO) zmiany w Twoim poście. Jeśli się z nimi nie zgadzasz, możesz je wycofać, klikając link „edytowano __ temu”, znajdując ostatnią preferowaną wersję i klikając „wycofać”.
gung - Przywróć Monikę
0

Filogenetyczny test ANOVA został opracowany przez Garland i in. (1993) i jest zaimplementowany w phy.anovafunkcji w geigerpakiecie. Metoda wytwarza wartości p skorygowane o filogenetyczną nie-niezależność poprzez generowanie zerowego rozkładu w oparciu o symulację ewolucji na filogenezie.

Wolne loris
źródło