ANOVA ze stałymi efektami (lub jej równoważnik regresji liniowej) zapewnia potężną rodzinę metod analizy tych danych. Aby to zilustrować, oto zestaw danych zgodny z wykresem średniego HC na wieczór (jeden wykres na kolor):
| Color
Day | B G R | Total
-------+---------------------------------+----------
1 | 117 176 91 | 384
2 | 208 193 156 | 557
3 | 287 218 257 | 762
4 | 256 267 271 | 794
5 | 169 143 163 | 475
6 | 166 163 163 | 492
7 | 237 214 279 | 730
8 | 588 455 457 | 1,500
9 | 443 428 397 | 1,268
10 | 464 408 441 | 1,313
11 | 470 473 464 | 1,407
12 | 171 185 196 | 552
-------+---------------------------------+----------
Total | 3,576 3,323 3,335 | 10,234
ANOVA count
przeciw day
i color
tworzy tę tabelę:
Number of obs = 36 R-squared = 0.9656
Root MSE = 31.301 Adj R-squared = 0.9454
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 605936.611 13 46610.5085 47.57 0.0000
|
day | 602541.222 11 54776.4747 55.91 0.0000
colorcode | 3395.38889 2 1697.69444 1.73 0.2001
|
Residual | 21554.6111 22 979.755051
-----------+----------------------------------------------------
Total | 627491.222 35 17928.3206
Wartość model
p 0,0000 pokazuje, że dopasowanie jest bardzo znaczące. Wartość day
p 0,0000 jest również bardzo istotna: możesz wykryć codzienne zmiany. Jednak color
wartości p (semestru) 0,2001 nie należy uważać za znaczącą: nie można wykryć systematycznej różnicy między trzema semestrami, nawet po kontrolowaniu zmienności z dnia na dzień.
Test HSD Tukeya („uczciwa znacząca różnica”) identyfikuje następujące znaczące zmiany (między innymi) w środkach dnia (niezależnie od semestru) na poziomie 0,05:
1 increases to 2, 3
3 and 4 decrease to 5
5, 6, and 7 increase to 8,9,10,11
8, 9, 10, and 11 decrease to 12.
Potwierdza to, co oko widzi na wykresach.
Ponieważ wykresy podskakują dość często, nie ma sposobu na wykrycie codziennych korelacji (korelacja szeregowa), co stanowi cały punkt analizy szeregów czasowych. Innymi słowy, nie przejmuj się technikami szeregów czasowych: nie ma tutaj wystarczającej ilości danych, aby zapewnić lepszy wgląd.
Zawsze należy się zastanawiać, jak bardzo wierzyć w wyniki jakiejkolwiek analizy statystycznej. Różne metody diagnostyczne dotyczące heteroscedastyczności (takie jak test Breuscha-Pagana ) nie pokazują niczego złego. Resztki nie wyglądają bardzo normalnie - zbrylają się w niektóre grupy - więc wszystkie wartości p należy przyjąć ziarenkiem soli. Niemniej jednak wydaje się, że zapewniają one rozsądne wskazówki i pomagają w określeniu ilości danych, które możemy uzyskać na podstawie wykresów.
Możesz przeprowadzić równoległą analizę minimów dziennych lub maksymalnych dziennych. Pamiętaj, aby zacząć od podobnego wykresu jako przewodnika i sprawdzić wyniki statystyczne.
Sarah, weź swoje 36 liczb (12 wartości na cykl; 3 cykle) i zbuduj model regresji z 11 wskaźnikami odzwierciedlającymi możliwy efekt tygodnia w semestrze, a następnie określ wszelkie niezbędne serie interwencji (impulsy, przesunięcia poziomu) niezbędne do renderowania średnia reszt będzie wszędzie 0,0 lub przynajmniej nie będzie statystycznie istotnie różna od 0,0. Na przykład, jeśli zidentyfikujesz przesunięcie poziomu w okresie 13, może to sugerować statystycznie znaczącą różnicę między średnią pierwszego semestru, tj. Pierwszych 12 wartości) w porównaniu do średniej z dwóch ostatnich semestrów (ostatnich 24 wartości). Możesz być w stanie wyciągnąć wnioski lub przetestować hipotezę o braku tygodnia efektu semestru. Dobry pakiet szeregów czasowych może być dla Ciebie przydatny w tym względzie. W przeciwnym razie może być konieczne znalezienie kogoś, kto udzieli pomocy na tej arenie analitycznej.
źródło