Sytuacja: dwa ptaki (samiec i samica) chronią jaja w gnieździe przed intruzem. Każdy ptak może użyć ataku lub zagrożenia do ochrony i może być obecny lub nieobecny. Z danych wynika, że zachowanie może być komplementarne - ataki mężczyzn, podczas gdy kobiety wykorzystują wyświetlanie zagrożenia i odwrotnie.
Moje pytanie brzmi: jak statystycznie udowodnić taką współpracę? Czy może ktoś zna jakieś badanie behawioralne, które zajmuje się podobną analizą? Zdecydowana większość analiz sekwencyjnych, które znalazłem, koncentruje się na DNA.
Tutaj podaję dane pozorne , ale mój oryginalny zestaw danych składa się z kilkudziesięciu par, które zostały zarejestrowane dokładnie 10 minut podczas obrony ich gniazda. Sekwencja behawioralna każdego ptaka ma zatem długość 600 stanów (każda sekunda ma stan). Te krótsze dane powinny zawierać wzorzec podobny do całego zestawu danych.
male_seq <- rep(c("absent","present","attack","threat","present","attack",
"threat","present","attack","absent"),
times = c(3,4,8,2,6,3,2,6,2,1))
female_seq <- rep(c("absent","present","threat","present","threat","present",
"threat","attack","present","threat","attack","present",
"attack","threat","absent"),
times = c(2,6,2,1,2,1,1,3,5,3,1,3,3,2,2))
źródło
Odpowiedzi:
Wysyłam drugą odpowiedź od twojego ostatniego komentarza
to zmieniacz gier. Wydaje się, że problem można rozwiązać z zupełnie innej perspektywy. Po pierwsze, jesteś zainteresowany tylko częścią próbki, gdy atakują mężczyźni. Po drugie, jesteś zainteresowany tym, czy w takich przypadkach kobiety robią smakołyki częściej niż się spodziewalibyśmy, gdyby robili je losowo. Aby przetestować taką hipotezę, możemy użyć testu permutacji: losowo potasuj albop -wartość.
male_seq
albofemale_seq
(to nie ma znaczenia), a następnie policz przypadki gdziemale_seq == "attack"
ifemale_seq == "treat"
aby uzyskać rozkład zerowy. Następnie porównaj liczbę uzyskaną z twoich danych z liczbą uzyskaną w rozkładzie zerowymMożesz zdefiniować swoją statystykę testową inaczej, w zależności od tego, jak zdefiniujesz „preferencje” kobiet. Test permutacji w tym przypadku jest bezpośrednią interpretacją twojegoH0 : „zachowanie kobiety jest niezależne od zachowania mężczyzny”, co prowadzi do: „zachowanie kobiety jest przypadkowe, biorąc pod uwagę zachowanie mężczyzny”, więc zachowania są losowo tasowane pod H0 .
Co więcej, nawet jeśli założono, że zachowania pojawiają się w klastrach tego samego zachowania powtarzanych przez pewien czas, za pomocą testu permutacji można przetasować całe klastry:
W obu przypadkach wzorce współpracy w dostarczonych danych wydają się dalekie od losowych. Zauważ, że w obu przypadkach ignorujemy autokorelację tych danych, raczej pytamy: jeśli wybramy przypadkowy moment w czasie, gdy mężczyzna atakuje, czy kobieta byłaby mniej lub bardziej skłonna do robienia przysmaków w tym samym czasie?
Ponieważ wydaje się, że mówisz o przyczynowości („kiedy ... wtedy”), przeprowadzając test permutacji, możesz być zainteresowany porównaniem zachowania mężczyzn wt−1 czas na zachowanie kobiet w t czas (jaka była „reakcja” kobiet na zachowanie mężczyzn?), ale o to musicie zadać sobie pytanie. Testy permutacyjne są elastyczne i można je łatwo dostosować do rodzaju problemów, które wydaje się opisywać.
źródło
Możesz myśleć o swoich danych w kategoriach dwuwymiarowego łańcucha Markowa. Masz dwie różne zmienneX dla kobiet i Y dla mężczyzn, którzy opisują stochastyczny proces zmian w X i Y o czasie t do jednego z czterech różnych stanów. Oznaczmy przezXt−1,i→Xt,j przejście dla X od t−1 do t czas, od i -do j -ty stan. W takim przypadku przejście w czasie do innego stanu zależy od poprzedniego stanu wX i wY :
Prawdopodobieństwa przejścia można łatwo obliczyć, zliczając historie przejścia i normalizując później prawdopodobieństwa:
Można go również łatwo symulować przy użyciu krańcowych prawdopodobieństw:
Wynik takiej symulacji przedstawiono na wykresie poniżej.
Ponadto można go wykorzystać do prognozowania o jeden krok do przodu:
z dokładnością 69–86% w podanych danych:
Gdyby przejścia następowały losowo, prawdopodobieństwo przejścia następowałoby po dyskretnym jednorodnym rozkładzie. Nie jest to dowód , ale może służyć jako sposób myślenia o danych przy użyciu prostego modelu.
źródło