Wykorzystanie analizy szeregów czasowych do analizy / przewidywania gwałtownych zachowań

13

To trochę nieporadne pytanie, ale mam poważne zainteresowanie odpowiedzią. Pracuję w szpitalu psychiatrycznym i mam trzy lata danych gromadzonych każdego dnia na każdym oddziale, dotyczących poziomu przemocy na tym oddziale.

Oczywiście model, który pasuje do tych danych, jest modelem szeregów czasowych. Musiałem różnicować wyniki, aby były bardziej normalne. Dopasowuję model ARMA z różnicowanymi danymi i moim zdaniem najlepsze dopasowanie to model z jednym stopniem różnicowania i autokorelacją pierwszego rzędu w opóźnieniu 2.

Moje pytanie brzmi: do czego, do licha, mogę użyć tego modelu? Szeregi czasowe zawsze wydają się tak przydatne w podręcznikach, gdy dotyczą populacji zająca i cen ropy, ale teraz zrobiłem własne, wyniki wydają się tak abstrakcyjne, że są całkowicie nieprzejrzyste. Zróżnicowane wyniki korelują ze sobą w drugim etapie, ale tak naprawdę nie mogę zalecić, aby wszyscy byli w pogotowiu dwa dni po poważnym incydencie z całą powagą.

Czy mogę?

Chris Beeley
źródło
czy mógłbyś zmienić tytuł na coś w rodzaju „Używanie analizy szeregów czasowych do analizowania / przewidywania gwałtownych zachowań”?
Paul
1
Naprawdę podoba mi się tego rodzaju pytanie, myślę, że ten rodzaj precyzyjnego problemu rzeczywistego zwiększy zainteresowanie witryną. Byłoby jeszcze lepiej, gdybyś miał możliwość dodania linku do danych lub powiedzenia nam (jako uzupełnienie postu), co w końcu zrobiłeś, jakie były wnioski ... jednak rozumiem, że to może być poufne ...
robin girard
Chciałbym móc ponownie zagłosować, abyś przeszedł na pytanie o definicję zmiennej losowej;)
robin girard
Wrócę, aby powiedzieć wam, jakie były wyniki, ale minie trochę czasu, ponieważ pracuję nad tym obok wielu innych zadań. Nie byłeś pewien, co miałeś na myśli mówiąc o „pomijaniu pytania o zmienną losową”? Czy jest jakieś pytanie, na które polecam spojrzeć?
Chris Beeley,
przepraszam, jeśli nie byłam jasna, nie znaczy to, że wolę (osobiste subiektywne opinie) pytania takie jak twoje niż pytanie, które brzmi „co to jest zmienna losowa” ... ale myślę, że przyjemność nie jest wszystkim :)
robin girard

Odpowiedzi:

9

Model pasujący do danych nie musi być modelem szeregów czasowych; Radziłbym trochę myśleć nieszablonowo.

Jeśli masz wiele zmiennych (np. Wiek, płeć, dieta, pochodzenie etniczne, choroba, leki), możesz użyć ich do innego modelu. Może obecność niektórych pacjentów w tym samym pokoju jest ważnym czynnikiem predykcyjnym? A może ma to związek z personelem? Lub rozważ użycie modelu wielu szeregów czasowych (np. VECM), jeśli masz inne zmienne, których możesz użyć. Spójrz na relacje między przemocą wśród pacjentów: czy niektórzy pacjenci działają razem?

Model szeregów czasowych jest użyteczny, jeśli czas odgrywa ważną rolę w zachowaniu. Na przykład może wystąpić grupowanie przemocy. Spójrz na literaturę dotyczącą grup zmiennych. Jak sugeruje @Jas, przy opóźnieniu wynoszącym 2, być może będziesz musiał być w stanie gotowości następnego dnia po wybuchu przemocy. Ale to nie pomaga w zapobieganiu pierwszego dnia: mogą istnieć inne informacje, które można połączyć z analizą, aby faktycznie zrozumieć przyczynę przemocy, zamiast po prostu przesyłać je w sposób szeregowy.

Na koniec, jako sugestia techniczna: jeśli używasz R do analizy, możesz rzucić okiem na pakiet prognozy Roba Hyndmana (twórcy tej strony). Ma wiele bardzo fajnych funkcji; patrz artykuł „Automatyczne prognozowanie szeregów czasowych: Pakiet prognozy dla R” w Journal of Statistics Software.

Shane
źródło
1
Uzgodnione - tylko po to, aby przedstawić kilka dodatkowych pomysłów na modelowanie: logistyka, aby przewidzieć, którzy pacjenci będą mieli 1+ gwałtowne wybuchy, regresja Poissona (esque), aby przewidzieć, którzy pacjenci będą mieli wiele wybuchów, wielopoziomowy, aby zbadać warianty od pokoju do pokoju i / lub oddział-do-oddział ...
Matt Parker
1
+1 Łatwo jest zostać zaślepionym przez napomnienia, aby nie używać modeli liniowych itp. W szeregach czasowych z powodu problemów z autokorelacją i dać się wciągnąć w ARIMA, DLM itp., Gdy LM, GLM itp. Mogą być dość potężne dzięki mała ostrożność.
Wayne,
6

Dopasowałeś model do różnic, co oznacza, że ​​opisujesz zmianę poziomu przemocy. Masz opóźnienie o 2 dni. Opóźnienie wskazuje na pamięć procesu. Innymi słowy, zmiana poziomu przemocy dzisiaj jest w pewnym stopniu zależna od zmiany poziomu przemocy w ciągu ostatnich dwóch dni. W przypadku dłuższych przedziałów czasowych wpływ przypadkowych wpływów staje się na tyle silny, że nie ma już wyraźnego związku.

Czy autokorelacja jest dodatnia? Zatem zmiana poziomu przemocy dzisiaj sugeruje podobną zmianę w poziomie przemocy w ciągu dwóch dni. Czy to jest negatywne? Wtedy przemoc może pozostać wyższa przez dwa dni.

Oczywiście możesz chcieć kontrolować mylące efekty. Na przykład po poważnym incydencie ludzie mogą częściej zgłaszać drobne incydenty, ale ta „uwrażliwienie” zniknie po dwóch dniach.

Jonas
źródło