Mam trzypoziomową tabelę zdarzeń awaryjnych, z danymi zliczeń dla kilku gatunków, rośliny żywicielskiej, z której zostały zebrane, oraz tego, czy zbiór ten miał miejsce w deszczowy dzień (to naprawdę ma znaczenie!). Przy użyciu R fałszywe dane mogą wyglądać mniej więcej tak:
count <- rpois(8, 10)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
, , rain = 0
species
host a b
c 12 15
d 10 13
, , rain = 1
species
host a b
c 11 12
d 12 7
Teraz chcę wiedzieć dwie rzeczy: Czy gatunki są związane z roślinami żywicielskimi? Czy „deszcz czy nie” wpływa na to skojarzenie? Użyłem loglm()
z MASS
tego do:
# Are species independent to host plants, given the effect of rain?
loglm(~species + host + rain + species*rain + host*rain, data=my.table)
# Given any relationship between host plants and species, does rain change it?
loglm(~species + host + rain + species*host)
Jest to nieco poza moim poziomem komfortu i chciałem sprawdzić, czy odpowiednio ustawiłem modele i że był to najlepszy sposób, aby odpowiedzieć na te pytania.
źródło
Poleceniem R byłoby:
źródło
Początkowo zasugerowałem wypróbowanie jednej z ograniczonych technik święceń z
vegan
pakietu, ale z drugiej strony wątpię, czy byłoby to przydatne, ponieważ faktycznie masz 2 tabele zdarzeń awaryjnych. Mam nadzieję, że druga część tego przykładu [PDF: R Demonstracja - Analiza kategoryczna] będzie pomocna.źródło