To trochę nieporadne pytanie, ale mam poważne zainteresowanie odpowiedzią. Pracuję w szpitalu psychiatrycznym i mam trzy lata danych gromadzonych każdego dnia na każdym oddziale, dotyczących poziomu przemocy na tym oddziale.
Oczywiście model, który pasuje do tych danych, jest modelem szeregów czasowych. Musiałem różnicować wyniki, aby były bardziej normalne. Dopasowuję model ARMA z różnicowanymi danymi i moim zdaniem najlepsze dopasowanie to model z jednym stopniem różnicowania i autokorelacją pierwszego rzędu w opóźnieniu 2.
Moje pytanie brzmi: do czego, do licha, mogę użyć tego modelu? Szeregi czasowe zawsze wydają się tak przydatne w podręcznikach, gdy dotyczą populacji zająca i cen ropy, ale teraz zrobiłem własne, wyniki wydają się tak abstrakcyjne, że są całkowicie nieprzejrzyste. Zróżnicowane wyniki korelują ze sobą w drugim etapie, ale tak naprawdę nie mogę zalecić, aby wszyscy byli w pogotowiu dwa dni po poważnym incydencie z całą powagą.
Czy mogę?
źródło
Odpowiedzi:
Model pasujący do danych nie musi być modelem szeregów czasowych; Radziłbym trochę myśleć nieszablonowo.
Jeśli masz wiele zmiennych (np. Wiek, płeć, dieta, pochodzenie etniczne, choroba, leki), możesz użyć ich do innego modelu. Może obecność niektórych pacjentów w tym samym pokoju jest ważnym czynnikiem predykcyjnym? A może ma to związek z personelem? Lub rozważ użycie modelu wielu szeregów czasowych (np. VECM), jeśli masz inne zmienne, których możesz użyć. Spójrz na relacje między przemocą wśród pacjentów: czy niektórzy pacjenci działają razem?
Model szeregów czasowych jest użyteczny, jeśli czas odgrywa ważną rolę w zachowaniu. Na przykład może wystąpić grupowanie przemocy. Spójrz na literaturę dotyczącą grup zmiennych. Jak sugeruje @Jas, przy opóźnieniu wynoszącym 2, być może będziesz musiał być w stanie gotowości następnego dnia po wybuchu przemocy. Ale to nie pomaga w zapobieganiu pierwszego dnia: mogą istnieć inne informacje, które można połączyć z analizą, aby faktycznie zrozumieć przyczynę przemocy, zamiast po prostu przesyłać je w sposób szeregowy.
Na koniec, jako sugestia techniczna: jeśli używasz R do analizy, możesz rzucić okiem na pakiet prognozy Roba Hyndmana (twórcy tej strony). Ma wiele bardzo fajnych funkcji; patrz artykuł „Automatyczne prognozowanie szeregów czasowych: Pakiet prognozy dla R” w Journal of Statistics Software.
źródło
Dopasowałeś model do różnic, co oznacza, że opisujesz zmianę poziomu przemocy. Masz opóźnienie o 2 dni. Opóźnienie wskazuje na pamięć procesu. Innymi słowy, zmiana poziomu przemocy dzisiaj jest w pewnym stopniu zależna od zmiany poziomu przemocy w ciągu ostatnich dwóch dni. W przypadku dłuższych przedziałów czasowych wpływ przypadkowych wpływów staje się na tyle silny, że nie ma już wyraźnego związku.
Czy autokorelacja jest dodatnia? Zatem zmiana poziomu przemocy dzisiaj sugeruje podobną zmianę w poziomie przemocy w ciągu dwóch dni. Czy to jest negatywne? Wtedy przemoc może pozostać wyższa przez dwa dni.
Oczywiście możesz chcieć kontrolować mylące efekty. Na przykład po poważnym incydencie ludzie mogą częściej zgłaszać drobne incydenty, ale ta „uwrażliwienie” zniknie po dwóch dniach.
źródło