Jaka byłaby „rozsądna” minimalna liczba obserwacji w celu znalezienia trendu w czasie z regresją liniową? co z dopasowaniem modelu kwadratowego?
Pracuję ze złożonymi wskaźnikami nierówności w zdrowiu (SII, RII) i mam tylko 4 fale ankiety, czyli 4 punkty (1997,2001,2004,2008).
Nie jestem statystykiem, ale mam intuicyjne wrażenie, że 4 punkty nie są wystarczające. Czy masz odpowiedź i / lub referencje?
Wielkie dzięki,
Françoise
regression
Francoise
źródło
źródło
Odpowiedzi:
Praktyczna reguła Petersa wynosząca 10 na zmienną towarzyszącą jest rozsądną zasadą. Prostą linię można idealnie dopasować do dowolnych dwóch punktów, niezależnie od wielkości szumu w wartościach odpowiedzi, a kwadrat można idealnie dopasować za pomocą zaledwie 3 punktów. Tak wyraźnie w prawie każdych okolicznościach należałoby powiedzieć, że 4 punkty są niewystarczające. Jednak, jak większość praktycznych zasad, nie obejmuje każdej sytuacji. Przypadki, w których składnik szumu w modelu ma dużą wariancję, będą wymagały więcej próbek niż podobny przypadek, w którym wariancja błędu jest niewielka.
Wymagana liczba punktów próbkowania zależy od obiektów. Jeśli przeprowadzasz analizę eksploracyjną, aby sprawdzić, czy jeden model (powiedzmy liniowy w zmiennej towarzyszącej) wygląda lepiej niż inny (powiedzmy funkcja kwadratowa zmiennej towarzyszącej), mniej niż 10 punktów może wystarczyć. Ale jeśli chcesz bardzo dokładnych szacunków współczynników korelacji i regresji dla zmiennych towarzyszących, możesz potrzebować więcej niż 10 na zmienną towarzyszącą. Dokładność kryterium prognozy może wymagać nawet większej liczby próbek niż dokładnych oszacowań parametrów. Należy zauważyć, że wariancja oszacowań i prognoz obejmuje wariancję terminu błędu modelu.
źródło