Wyobraź sobie sytuację: mamy historyczne zapisy (20 lat) trzech kopalń. Czy obecność srebra zwiększa prawdopodobieństwo znalezienia złota w przyszłym roku? Jak przetestować takie pytanie?
Oto przykładowe dane:
mine_A <- c("silver","rock","gold","gold","gold","gold","gold",
"rock","rock","rock","rock","silver","rock","rock",
"rock","rock","rock","silver","rock","rock")
mine_B <- c("rock","rock","rock","rock","silver","rock","rock",
"silver","gold","gold","gold","gold","gold","rock",
"silver","rock","rock","rock","rock","rock")
mine_C <- c("rock","rock","silver","rock","rock","rock","rock",
"rock","silver","rock","rock","rock","rock","silver",
"gold","gold","gold","gold","gold","gold")
time <- seq(from = 1, to = 20, by = 1)
r
time-series
hypothesis-testing
stochastic-processes
Ladislav Naďo
źródło
źródło
Odpowiedzi:
Moja najlepsza próba: ... użycie macierzy przejścia sugerowanych przez @AndyW prawdopodobnie nie jest rozwiązaniem, którego szukam (na podstawie komentarza @ Tima). Więc spróbowałem innego podejścia. Znalazłem ten link, który dotyczy sposobu regresji logistycznej, w którym zmienna odpowiedzi y i zmienna predykcyjna x są binarne .
Zgodnie z przykładem powinienem utworzyć tabelę 2 × 2 na podstawie moich danych:
Jak wyodrębniłem wartości:
I zbuduj model:
Czy to dobre rozwiązanie? Czy wartość p (0,673) oznacza, że obecność srebra nie zwiększa prawdopodobieństwa znalezienia złota?
źródło
yes = c(2, 14), no = c(7, 34)
, co oznacza, że stawiasz Silver: tak na pierwszym miejscu. Kiedy więc zrobisz,as.factor(c(0, 1))
0 odpowiada srebrnemu: tak, który jest twoim poziomem odniesienia, a tym samym twoim punktem przecięcia. Wartość 0,67 p odpowiada niewielkiemu dodatniemu wzrostowi, który prawdopodobnie spowoduje przejście złota ze srebra: tak na srebro: nie.