Jakie są różnice między terminami „analiza szeregów czasowych” i „analiza danych podłużnych”

17

Mówiąc o danych podłużnych, możemy odnosić się do danych zebranych w czasie wielokrotnie od tego samego przedmiotu / jednostki badawczej, dlatego istnieją korelacje dla obserwacji w obrębie tego samego przedmiotu, tj. Podobieństwo wewnątrz podmiotu.

Mówiąc o danych szeregów czasowych, odnosimy się również do danych zebranych w szeregu czasowym i wydaje się bardzo podobny do wspomnianego powyżej ustawienia podłużnego.

Zastanawiam się, czy ktoś może wyjaśnić te dwa pojęcia, jaki jest związek i jakie są różnice?

pytać
źródło
1
Może to przerodzić się w ankietę ... Pracowałem nad obydwoma rodzajami danych, a jedną kluczową różnicą wydaje się to, że dane podłużne są często wykorzystywane w analizach przyczynowych , aby zrozumieć wpływ interwencji lub leczenia, podczas gdy często stosuje się szeregi czasowe w prognozowaniu . Oczywiście różnica nie jest jednoznaczna (musisz zrozumieć, jakie czynniki są podstawą do prognozowania, a IMO nie zrozumiałeś sterowników, chyba że możesz dobrze prognozować). Ale ludzie, którzy wykrywają sygnał w szeregach czasowych, często nie przejmują się prognozowaniem, więc prawdopodobnie odrzuciliby moje rozróżnienie.
Stephan Kolassa
Dziękuję za komentarze. Ale myślę, że termin „przyczynowy” może być tutaj niewłaściwy, a termin „skojarzenie” powinien być lepszy? Jeśli chodzi o cel analizy danych, myślę, że twoje komentarze miały dla mnie jakiś sens. Ale czy nie możemy wykorzystać danych podłużnych do wykonania prognozy? Ponieważ to także rodzaj danych szeregów czasowych.
pytając
1
Masz punkt „związek przyczynowy” z „powiązaniem”, a do prognozowania można oczywiście użyć danych podłużnych - po prostu często nie widzę tych dwóch pojęć razem. Prognozy zwykle mówią o szeregach czasowych. Poza tym nie mogłem tego lepiej ująć niż @gung.
Stephan Kolassa
3
Jedną z możliwych typowych (nie definicyjnych) różnic jest to, że w szeregach czasowych widzisz i modelujesz czas reakcji jako zależny od stanu ; jest to efekt przeniesienia . W analizie czasu podłużnego zwykle uznajesz czas za stały , ewolucyjny czynnik tła. tt1
ttnphns

Odpowiedzi:

19

Wątpię, czy istnieją ścisłe, formalne definicje, na które zgadza się szeroki zakres analityków danych.

Ogólnie jednak szeregi czasowe oznaczają pojedynczą jednostkę badawczą obserwowaną w regularnych odstępach czasu przez bardzo długi okres czasu. Prototypowym przykładem może być roczny wzrost PKB kraju w ciągu dziesięcioleci, a nawet ponad stu lat. Dla analityka pracującego dla prywatnej firmy mogą to być miesięczne przychody ze sprzedaży przez cały okres istnienia firmy. Ponieważ jest tak wiele obserwacji, dane są analizowane bardzo szczegółowo, szukając takich rzeczy jak sezonowość w różnych okresach (np. Miesięcznie: większa sprzedaż na początku miesiąca tuż po wypłacie osób; rocznie: większa sprzedaż w listopadzie i Grudzień, kiedy ludzie robią zakupy w okresie świątecznym) i być może zmiany w systemie. Prognozy są często bardzo ważne, jak zauważa @StephanKolassa.

Podłużne zwykle odnosi się do mniejszej liczby pomiarów w większej liczbie jednostek badawczych. Prototypowym przykładem może być badanie leku, w którym setki pacjentów mierzy się na początku (przed leczeniem) i co miesiąc przez kolejne 3 miesiące. Przy zaledwie 4 obserwacjach każdej jednostki w tym przykładzie nie jest możliwe wykrycie rodzajów cech, którymi są zainteresowani analitycy szeregów czasowych. Z drugiej strony, z pacjentami przypuszczalnie zrandomizowanymi do grupy leczenia i kontroli, przyczynowość można wywnioskować raz rozwiązano kwestię braku niezależności. Jak to sugeruje, często brak niezależności jest uważany za prawie uciążliwy, a nie za główny przedmiot zainteresowania.

gung - Przywróć Monikę
źródło
8

Istnieją w przybliżeniu trzy rodzaje zestawów danych:

  • przekrój: różne przedmioty w tym samym czasie; pomyśl o tym jak o jednym wierszu z wieloma kolumnami odpowiadającymi różnym tematom;
  • szeregi czasowe: ten sam przedmiot w różnych momentach; pomyśl o tym jak o jednej kolumnie z rzędami odpowiadającymi różnym punktom czasowym;
  • panel (podłużny): wiele przedmiotów w różnych momentach, masz ten sam przedmiot w różnych czasach i masz wiele przedmiotów w tym samym czasie; pomyśl o tym jak o tabeli, w której wiersze są punktami czasowymi, a kolumny tematami.
Aksakal
źródło
2
Na podstawie twoich komentarzy wydaje się, że dane podłużne to zestaw wielu danych szeregów czasowych zebranych od różnych podmiotów?
pytając
1
Zasadniczo tak, dane każdego badanego można traktować jako szeregi czasowe. W praktyce dane podłużne często mają bardzo niewiele punktów czasowych dla każdego pacjenta. Nazywają fale punktów czasowych . Na przykład może to być badanie medyczne, w którym każdy pacjent ma 4-5 obserwacji w odstępach miesięcznych i setki pacjentów na przestrzeni lat. W ten sposób zestawy danych panelu są często niezrównoważone (pomyśl o bardzo rzadkiej tabeli), więc badania podłużne mają swoje ulubione metody radzenia sobie z tym.
Aksakal
Jest to pomocne, biorąc pod uwagę pytanie, ale istnieje wiele innych rodzajów zestawów danych, które nie należą do żadnego z tych nagłówków. Nie wydają się one jednak mieć związku z tym pytaniem, a próba sklasyfikowania każdego możliwego zestawu danych byłaby tutaj daremna. Przykłady: dowolny zestaw danych, w którym podstawowa struktura jest przedmiotem x temat; każdy zestaw danych, który nie jest dwuwymiarowy.
Nick Cox
@NickCox, prawda, ale jestem w ekonometrii, a te trzy są z rozwiniętymi teoriami i są najczęściej używane w naszej dziedzinie
Aksakal
2
Bez wątpienia jesteś, ale nic w tym pytaniu nie zobowiązuje ani nawet nie zachęca do wąsko ekonometrycznego punktu widzenia, ani twoja konkretna perspektywa nie została wyraźnie wyrażona.
Nick Cox
3

Te dwa terminy mogą nie być powiązane w sposób, w jaki zakłada OP - tzn. Nie sądzę, aby były to konkurencyjne tryby analiz.

Zamiast tego analiza szeregów czasowych opisuje zestaw technik niższego poziomu, które mogą być przydatne do analizy danych w badaniu podłużnym.

Przedmiotem badań w analizie szeregów czasowych jest pewien sygnał zależny od czasu.

Większość technik analizy i modelowania / przewidywania tych sygnałów zależnych od czasu opiera się na założeniu, że sygnały te ulegają rozkładowi na różne składniki. Dwa najważniejsze to:

  • składniki cykliczne (np. dzienne, tygodniowe, miesięczne, sezonowe); i

  • tendencja

Innymi słowy, analiza szeregów czasowych opiera się na wykorzystaniu cyklicznej natury sygnału zależnego od czasu w celu wyodrębnienia sygnału bazowego.

doug
źródło
0

Dla uproszczenia przyjmuję badanie poszczególnych osób, ale to samo dotyczy każdej jednostki analizy. Nie jest to skomplikowane, szeregi czasowe to dane gromadzone w czasie, zwykle implikujące ten sam pomiar z równoważnej populacji w oddzielnych odstępach czasu - lub gromadzone w sposób ciągły, ale analizowane w odstępach czasowych.
Dane podłużne mają znacznie szerszy zakres. Równoważną populację zastępuje się identyczną populacją, więc poszczególne dane można sparować lub połączyć z czasem. Dane podłużne mogą być powtarzane lub nie, w zależności od celu badania. Kiedy dane podłużne wyglądają jak szeregi czasowe, wtedy mierzymy to samo w czasie. Duża różnica polega na tym, że w szeregu czasowym możemy zmierzyć całkowitą zmianę pomiaru w czasie (lub według grupy), podczas gdy w analizie podłużnej faktycznie masz pomiar zmiany na poziomie indywidualnym. Masz więc znacznie większy potencjał do analizy, a pomiar zmiany jest bezbłędny, jeśli próbkowanie jest włączone, więc badanie podłużne może być bardziej precyzyjne i informacyjne.

dre0303
źródło
0

Jakie są dane podłużne?

Dane podłużne, czasami nazywane danymi panelowymi, śledzą tę samą próbkę w różnych punktach czasowych. Próbka może składać się z osób, gospodarstw domowych, zakładów i tak dalej. Natomiast powtarzające się dane przekrojowe, które dostarczają również dane długoterminowe, dają to samo badanie różnym próbkom w czasie.

Dane podłużne mają wiele zalet w porównaniu z powtarzającymi się danymi przekrojowymi. Dane podłużne pozwalają na pomiar zmiany wewnątrz próby w czasie, umożliwiają pomiar czasu trwania zdarzeń i rejestrują czas różnych zdarzeń. Załóżmy na przykład, że stopa bezrobocia pozostawała wysoka przez długi okres czasu. Można użyć danych podłużnych, aby sprawdzić, czy ta sama grupa osób pozostaje bezrobotna przez cały okres, czy też różne grupy osób przemieszczają się i wyprowadzają z bezrobocia w danym okresie.

Źródło

Vin
źródło