Jak sprawdzić, czy „poprzedni stan” ma wpływ na „kolejny stan” w R.

10

Wyobraź sobie sytuację: mamy historyczne zapisy (20 lat) trzech kopalń. Czy obecność srebra zwiększa prawdopodobieństwo znalezienia złota w przyszłym roku? Jak przetestować takie pytanie?


wprowadź opis zdjęcia tutaj

Oto przykładowe dane:

mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
            "rock","rock","rock","rock","silver","rock","rock",
            "rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
            "silver","gold","gold","gold","gold","gold","rock",
            "silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
            "rock","silver","rock","rock","rock","rock","silver",
            "gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)

Ladislav Naďo
źródło
1
Możesz być zainteresowany obliczeniem macierzy przejścia .
Andy W
Cześć @AndyW! Dziękuję za komentarz. Znam pakiet macierzy przejścia: makkovchain - markovchainFit (). Czy mogę użyć wartości prawdopodobieństwa z macierzy przejścia jako wartości p? Czy istnieje sposób przetestowania hipotezy: „Istnieje relacja„ srebrno-złota ”. (wartość p = xx)?
Ladislav Naďo
1
@ Prawdopodobieństwa przejścia @LadislavNado nie mogą być interpretowane jako wartości p (nie mówią nic o odrzucaniu H0), zobacz stats.stackexchange.com/questions/31/..., aby dowiedzieć się więcej na temat wartości p.
Tim
1
Widzę problem ze sposobem wyodrębnienia danych. Zastanów się nad scenariuszem „srebro: nie” i „złoto: tak”, powinieneś także liczyć kolejne serie „złota”, ponieważ spełnia ono logiczne kryteria.
1
Po skorygowaniu jednej komórki od 1 do 14 model zmienia się na: Współczynniki: Oszacuj Std. Błąd wartość Z Pr (> | z |) (Przechwyć) -1,2528 0,8018 -1,562 0,118 współczynnik as (c (0, 1)) 1 0,3655 0,8624 0,424 0,672

Odpowiedzi:

4

Moja najlepsza próba: ... użycie macierzy przejścia sugerowanych przez @AndyW prawdopodobnie nie jest rozwiązaniem, którego szukam (na podstawie komentarza @ Tima). Więc spróbowałem innego podejścia. Znalazłem ten link, który dotyczy sposobu regresji logistycznej, w którym zmienna odpowiedzi y i zmienna predykcyjna x są binarne .

Zgodnie z przykładem powinienem utworzyć tabelę 2 × 2 na podstawie moich danych:

               gold (yes)  gold (no)
silver (yes)       2           7
silver (no)       14          34

Jak wyodrębniłem wartości: wprowadź opis zdjęcia tutaj

I zbuduj model:

response <- cbind(yes = c(2, 14), no = c(7, 34))

mine.logistic <- glm(response ~ as.factor(c(0,1)),
                      family = binomial(link=logit))

summary(mine.logistic)
# Coefficients:
#                     Estimate Std. Error z value Pr(>|z|)
# (Intercept)          -1.2528     0.8018  -1.562    0.118
# as.factor(c(0, 1))1   0.3655     0.8624   0.424    0.672

Czy to dobre rozwiązanie? Czy wartość p (0,673) oznacza, że ​​obecność srebra nie zwiększa prawdopodobieństwa znalezienia złota?

Ladislav Naďo
źródło
Jak wygenerowałeś te ładne wykresy? Tikz?
shadowtalker
Cześć @ssdecontrol! Wykresy zostały wykonane ręcznie w Inkscape.
Ladislav Naďo
Tak, to przyzwoita interpretacja. Ponadto, jeśli popatrzysz tylko na rzędy stołu 2x2, w górnym rzędzie (srebro: tak) masz 9 skrzynek, z których 2 miały złoto, więc biorąc pod uwagę srebrne prawdopodobieństwo złota w przyszłym roku wynosi 2/9 = 0,222. W dolnym rzędzie (srebro: nie) masz 48 skrzynek, z których 14 miało złoto w przyszłym roku, więc biorąc pod uwagę, że srebro nie ma złota, wynosi 14 / (14 + 34) = 0,292. Biorąc to wszystko pod uwagę, wygląda na to, że srebro szkodzi twojej szansie na znalezienie złota, choć z twoich wartości p nie „statystycznie znacząco”.
Gregor Thomas
Pamiętaj też o kodowaniu, zaczynasz od yes = c(2, 14), no = c(7, 34), co oznacza, że ​​stawiasz Silver: tak na pierwszym miejscu. Kiedy więc zrobisz, as.factor(c(0, 1))0 odpowiada srebrnemu: tak, który jest twoim poziomem odniesienia, a tym samym twoim punktem przecięcia. Wartość 0,67 p odpowiada niewielkiemu dodatniemu wzrostowi, który prawdopodobnie spowoduje przejście złota ze srebra: tak na srebro: nie.
Gregor Thomas
I ostatnia uwaga: Ci za pomocą macierzy przejścia. Twoja macierz 2, 7, 14, 34 jest macierzą przejściową.
Gregor Thomas