Rozumiem, że wyprowadzanie macierzy kowariancji z danych filogenetycznych w celu uzyskania dla dwóch zmiennych, na których dokonuje się regresji. Ale co się stanie, jeśli masz jedną zmienną ciągłą, która wcześniej była zależna od filogenezy, i jedną zmienną porządkową? Ten ostatni jest porządkowy, nie jestem pewien, jak powiązać to ze sposobem, w jaki zależność filogenetyczna powoduje tendencyjne statystyki testowe.
Czy sensowne jest obliczenie niezależnych kontrastów filogenetycznych Felsensteina na zmiennej ciągłej i wykorzystanie ich do analizy ANOVA?
Wartość PIC to:
Gdzie jest X dla gatunku I , X j jest X dla gatunku j i d i j to odległość między parami gatunków í i j na drzewa filogenetycznego.
Odpowiedzi:
Pierwszym krokiem, który zaleciłbym, jest wprowadzenie zmiennej zastępczej dla każdej klasy porządkowej (patrz komentarze na https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta edu / wydziału / kunovich / Soci5304_Handouts / wątek% 25208_Dummy% 2520Variables.doc i CD = 2 & ved = 0CCAQFjAB i USG = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ i sig2 = 9hkDU6Y2mpKcGzBTIK8jog ) i wykreślić odpowiednich środków z analizy regresji obojętne zmienna. Możesz również przetestować trend w samych zmiennych zastępczych. Możesz także ponownie uporządkować kategorię zmiennych porządkowych według odpowiedniej szacunkowej wielkości zmiennych zastępczych do późniejszej analizy, jeśli jest to uzasadnione wcześniej (aby zobaczyć aktualne dane).
Zakładając, że w poprzedniej analizie brakuje efektu rosnącego trendu (niekoniecznie liniowego) i uwzględnienie jakiegokolwiek obsługiwanego uporządkowania w samej zmiennej porządkowej, ciekawym podejściem, które rozwiązuje również możliwe problemy z normalnością, jest przeprowadzenie analizy regresji, w której wszystkie zmienne mają przypisane szeregi, w tym zmienna porządkowa. Uzasadnieniem tego szaleństwa jest cytowanie z Wikipedii współczynnika korelacji rang Spearmana (link: http://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient):
„Współczynnik Spearmana, jak każde obliczenie korelacji, jest odpowiedni zarówno dla zmiennych ciągłych, jak i dyskretnych, w tym zmiennych porządkowych. [1] [2]”
Wikipedia przedstawia przykład i kilka sposobów oceny błędu standardowego obliczonej korelacji rang do testowania. Zauważ, że jeśli nie jest ona statystycznie różna od zera, to wersja skalowana, podobnie jak w regresji obliczeniowej opartej na szeregach, jest podobnie, nieistotna.
Dalej normalizowałbym te szeregi (dzieląc przez liczbę obserwacji), podając możliwą przykładową interpretację kwantową (uwaga, możliwe są udoskonalenia w konstruowaniu rozkładu empirycznego dla danych). Wykonałbym również prostą korelację między y a daną transformowaną zmienną porządkową, aby kierunek wybranego przez ciebie rankingu (na przykład od 1 do 4 w porównaniu z 4 do 1) wytworzył znak dla korelacji rang, który ma intuicyjne znaczenie w kontekście twojego badania.
[Edytuj] Należy pamiętać, że modele ANOVA mogą być prezentowane w formacie regresji z odpowiednią matrycą projektową, a przy każdym standardowym modelu regresji, który badasz, centralnym tematem jest oparta na średniej analiza Y dla X. Jednak w niektórych dyscyplinach, takich jak ekologia, owocne okazało się inne skupienie na relacjach regresji implikowane przy różnych kwantylach, w tym medianie. Podobno w ekologii średnie efekty mogą być małe, ale niekoniecznie w innych kwantylach. To pole nazywa się regresją kwantową. Sugeruję, abyś zastosował go w celu uzupełnienia bieżącej analizy. Jako odniesienie możesz znaleźć artykuł 213-30 „Wprowadzenie do regresji kwantowej i procedury QUANTREG” autorstwa Colina (Lin) Chena z SAS Institute.
Tutaj znajduje się również źródło dotyczące wykorzystania przekształceń rang: „Zastosowanie przekształceń rang w regresji” Ronalda L. Imana i WJ Conover, opublikowane w Technometrics, tom 21, nr 4, listopad 1979 r. Artykuł zauważa, że regresje stosowanie transformacji rang wydaje się działać całkiem dobrze na danych monotonicznych. Opinię tę podzielają również specjaliści od niezawodności, którzy stwierdzają w magazynie internetowym, aby zacytować: „Metoda szacowania regresji rangi jest całkiem dobra w przypadku funkcji, które można zlinearyzować”. Źródło: „Reliability Hotwire, wydanie 10, grudzień 2010 r.
źródło
Filogenetyczny test ANOVA został opracowany przez Garland i in. (1993) i jest zaimplementowany w
phy.anova
funkcji wgeiger
pakiecie. Metoda wytwarza wartości p skorygowane o filogenetyczną nie-niezależność poprzez generowanie zerowego rozkładu w oparciu o symulację ewolucji na filogenezie.źródło