Potrzebuję wskazówek na temat odpowiedniego poziomu puli, aby użyć do testów różnicy średnich danych szeregów czasowych. Niepokoi mnie pseudo-replikacja czasowa i ofiarna, która wydaje się być napięta w przypadku tej aplikacji. Odnosi się to raczej do badania mensuralnego niż do eksperymentu manipulacyjnego.
Rozważ ćwiczenie monitorowania : system czujników mierzy zawartość rozpuszczonego tlenu (DO) w wielu miejscach na całej szerokości i głębokości stawu. Pomiary dla każdego czujnika są rejestrowane dwa razy dziennie, ponieważ wiadomo, że DO zmienia się dobowo. Dwie wartości są uśredniane w celu zarejestrowania wartości dziennej. Raz w tygodniu codzienne wyniki są agregowane przestrzennie, aby osiągnąć jedno tygodniowe stężenie DO dla całego stawu.
Te tygodniowe wyniki są raportowane okresowo i dalej agregowane - tygodniowe wyniki są uśredniane, aby dać miesięczne stężenie DO dla stawu. Miesięczne wyniki są uśredniane, aby dać wartość roczną. Średnie roczne same w sobie są uśredniane w celu zgłoszenia dekadalnych stężeń DO dla stawu.
Celem jest udzielenie odpowiedzi na pytania takie jak: Czy stężenie DO w stawie w roku X było wyższe, niższe czy takie samo jak stężenie w roku Y? Czy średnie stężenie DO z ostatnich dziesięciu lat różni się od stężenia z poprzedniej dekady? Stężenia DO w stawie reagują na wiele czynników o dużej wielkości, a zatem znacznie się różnią. Konieczny jest test istotności. Metoda polega na użyciu porównania średnich w teście. Biorąc pod uwagę, że wartości dekadowe są średnią wartości rocznych, a wartości roczne są średnią wartości miesięcznych, wydaje się to właściwe.
Oto pytanie - możesz obliczyć średnie dziesiętne i wartości T tych średnich na podstawie miesięcznych wartości DO lub rocznych wartości DO. Średnia nie zmienia się oczywiście, ale zmienia się szerokość przedziału ufności i wartość T. Ze względu na rząd wielkości wyższy N osiągnięty przy użyciu wartości miesięcznych, CI często znacznie się zacieśnia, jeśli jedziesz tą drogą. Może to dać przeciwny wniosek w porównaniu z wykorzystaniem wartości rocznych w odniesieniu do istotności statystycznej zaobserwowanej różnicy średnich, przy użyciu tego samego testu na tych samych danych. Jaka jest prawidłowa interpretacja tej rozbieżności?
Jeśli używasz wyników miesięcznych do obliczania statystyk testowych dla różnicy w średnich dziesiętnych, czy cierpisz z powodu pseudoreplikacji czasowej? Jeśli wykorzystujesz wyniki roczne do obliczenia testów dekadalnych, czy poświęcasz informacje, a tym samym pseudoreplikację?
Odpowiedzi:
Uważam, że próbujesz zastosować metody statystyczne odpowiednie dla niezależnych obserwacji, skorelując dane, zarówno tymczasowo, jak i przestrzennie. Jeśli masz obserwacje mówione przez 5 godzin i zdecydujesz się na powtórzenie tego jako 241 obserwacji wykonywanych co minutę, tak naprawdę nie masz 240 stopni swobody w odniesieniu do średniej z tych 241 wartości. Autokorelacja potencjalnie prowadzi do zawyżenia wielkości „N”, a tym samym tworzy fałszywe stwierdzenia niepewności. To, co musisz zrobić, to znaleźć kogoś / jakiś podręcznik / jakąś stronę internetową / ...., aby nauczyć cię danych o szeregach czasowych i ich analizy. Jednym ze sposobów jest GOOGLE „pomóż mi zrozumieć szeregi czasowe” i zacznij czytać / uczyć się. W Internecie dostępnych jest wiele materiałów.http://www.autobox.com/AFSUniversity/afsuFrameset.htm . Wspominam o tym, ponieważ nadal jestem związany z tą firmą i jej produktami, dlatego moje komentarze są „stronnicze i opiniotwórcze”, ale nie wyłącznie samolubne.
źródło