Mówiąc o danych podłużnych, możemy odnosić się do danych zebranych w czasie wielokrotnie od tego samego przedmiotu / jednostki badawczej, dlatego istnieją korelacje dla obserwacji w obrębie tego samego przedmiotu, tj. Podobieństwo wewnątrz podmiotu.
Mówiąc o danych szeregów czasowych, odnosimy się również do danych zebranych w szeregu czasowym i wydaje się bardzo podobny do wspomnianego powyżej ustawienia podłużnego.
Zastanawiam się, czy ktoś może wyjaśnić te dwa pojęcia, jaki jest związek i jakie są różnice?
Odpowiedzi:
Wątpię, czy istnieją ścisłe, formalne definicje, na które zgadza się szeroki zakres analityków danych.
Ogólnie jednak szeregi czasowe oznaczają pojedynczą jednostkę badawczą obserwowaną w regularnych odstępach czasu przez bardzo długi okres czasu. Prototypowym przykładem może być roczny wzrost PKB kraju w ciągu dziesięcioleci, a nawet ponad stu lat. Dla analityka pracującego dla prywatnej firmy mogą to być miesięczne przychody ze sprzedaży przez cały okres istnienia firmy. Ponieważ jest tak wiele obserwacji, dane są analizowane bardzo szczegółowo, szukając takich rzeczy jak sezonowość w różnych okresach (np. Miesięcznie: większa sprzedaż na początku miesiąca tuż po wypłacie osób; rocznie: większa sprzedaż w listopadzie i Grudzień, kiedy ludzie robią zakupy w okresie świątecznym) i być może zmiany w systemie. Prognozy są często bardzo ważne, jak zauważa @StephanKolassa.
Podłużne zwykle odnosi się do mniejszej liczby pomiarów w większej liczbie jednostek badawczych. Prototypowym przykładem może być badanie leku, w którym setki pacjentów mierzy się na początku (przed leczeniem) i co miesiąc przez kolejne 3 miesiące. Przy zaledwie 4 obserwacjach każdej jednostki w tym przykładzie nie jest możliwe wykrycie rodzajów cech, którymi są zainteresowani analitycy szeregów czasowych. Z drugiej strony, z pacjentami przypuszczalnie zrandomizowanymi do grupy leczenia i kontroli, przyczynowość można wywnioskować raz rozwiązano kwestię braku niezależności. Jak to sugeruje, często brak niezależności jest uważany za prawie uciążliwy, a nie za główny przedmiot zainteresowania.
źródło
Istnieją w przybliżeniu trzy rodzaje zestawów danych:
źródło
Te dwa terminy mogą nie być powiązane w sposób, w jaki zakłada OP - tzn. Nie sądzę, aby były to konkurencyjne tryby analiz.
Zamiast tego analiza szeregów czasowych opisuje zestaw technik niższego poziomu, które mogą być przydatne do analizy danych w badaniu podłużnym.
Przedmiotem badań w analizie szeregów czasowych jest pewien sygnał zależny od czasu.
Większość technik analizy i modelowania / przewidywania tych sygnałów zależnych od czasu opiera się na założeniu, że sygnały te ulegają rozkładowi na różne składniki. Dwa najważniejsze to:
składniki cykliczne (np. dzienne, tygodniowe, miesięczne, sezonowe); i
tendencja
Innymi słowy, analiza szeregów czasowych opiera się na wykorzystaniu cyklicznej natury sygnału zależnego od czasu w celu wyodrębnienia sygnału bazowego.
źródło
Dla uproszczenia przyjmuję badanie poszczególnych osób, ale to samo dotyczy każdej jednostki analizy. Nie jest to skomplikowane, szeregi czasowe to dane gromadzone w czasie, zwykle implikujące ten sam pomiar z równoważnej populacji w oddzielnych odstępach czasu - lub gromadzone w sposób ciągły, ale analizowane w odstępach czasowych.
Dane podłużne mają znacznie szerszy zakres. Równoważną populację zastępuje się identyczną populacją, więc poszczególne dane można sparować lub połączyć z czasem. Dane podłużne mogą być powtarzane lub nie, w zależności od celu badania. Kiedy dane podłużne wyglądają jak szeregi czasowe, wtedy mierzymy to samo w czasie. Duża różnica polega na tym, że w szeregu czasowym możemy zmierzyć całkowitą zmianę pomiaru w czasie (lub według grupy), podczas gdy w analizie podłużnej faktycznie masz pomiar zmiany na poziomie indywidualnym. Masz więc znacznie większy potencjał do analizy, a pomiar zmiany jest bezbłędny, jeśli próbkowanie jest włączone, więc badanie podłużne może być bardziej precyzyjne i informacyjne.
źródło
Jakie są dane podłużne?
Dane podłużne, czasami nazywane danymi panelowymi, śledzą tę samą próbkę w różnych punktach czasowych. Próbka może składać się z osób, gospodarstw domowych, zakładów i tak dalej. Natomiast powtarzające się dane przekrojowe, które dostarczają również dane długoterminowe, dają to samo badanie różnym próbkom w czasie.
Dane podłużne mają wiele zalet w porównaniu z powtarzającymi się danymi przekrojowymi. Dane podłużne pozwalają na pomiar zmiany wewnątrz próby w czasie, umożliwiają pomiar czasu trwania zdarzeń i rejestrują czas różnych zdarzeń. Załóżmy na przykład, że stopa bezrobocia pozostawała wysoka przez długi okres czasu. Można użyć danych podłużnych, aby sprawdzić, czy ta sama grupa osób pozostaje bezrobotna przez cały okres, czy też różne grupy osób przemieszczają się i wyprowadzają z bezrobocia w danym okresie.
Źródło
źródło