Porównuję dwa urządzenia do kontroli temperatury, oba zaprojektowane w celu utrzymania temperatury ciała dokładnie 37 stopni u znieczulonych pacjentów. Urządzenia dopasowano do 500 pacjentów tworzących dwie grupy. Grupa A (400 pacjentów) - urządzenie 1, grupa B (100 pacjentów) - urządzenie 2. Każdy pacjent mierzył swoją temperaturę raz na godzinę przez 36 godzin, co dało mi 18000 punktów danych w dwóch grupach. Muszę ustalić, które urządzenie bardziej precyzyjnie kontroluje temperaturę ciała pacjenta w okresie 36 godzin. Skonstruowałem wykresy liniowe łączące wartości środkowe w każdym punkcie czasowym z słupkami kwartylowymi i wizualnie wydaje się, że jest różnica. Jak powinienem analizować moje dane, aby udowodnić różnicę statystyczną?
10
Odpowiedzi:
Kiedy formułujesz tego rodzaju miary, domyślnie przyjmujesz „funkcję karną”, która karze temperatury, które odbiegają od pożądanej temperatury. Jedną z opcji byłoby zmierzenie „precyzji” przez niższą wariancję wokół pożądanej temperatury (traktując to jako stałą średnią do obliczenia wariancji). Wariancja karana jest przez błąd kwadratu, co daje rozsądną karę za duże odchylenia. Inną opcją byłoby bardziej dotkliwe ukaranie (np. Błąd w kostkach). Inną opcją byłoby po prostu zmierzenie czasu, w jakim każde urządzenie ma pacjenta poza zakresem temperatur, który jest bezpieczny z medycznego punktu widzenia. W każdym razie cokolwiek wybierzesz, powinno odzwierciedlać postrzegane niebezpieczeństwa odchylenia od pożądanej temperatury.
Po ustaleniu, co stanowi miarę „dobrej precyzji”, sformułujesz coś w rodzaju „testu heteroscedastyczności”, sformułowanego w szerszym znaczeniu, pozwalając na użycie jakiejkolwiek miary precyzji, której używasz. Nie jestem pewien, czy zgadzam się z komentarzem Whubera dotyczącym dostosowania do autokorelacji. To naprawdę zależy od tego, jak sformułujesz stratę - w końcu przebywanie w wysokim zakresie temperatur przez dłuższy czas może być najbardziej niebezpieczne, więc jeśli wrócisz do autokorelacji, możesz skończyć nie udało się wystarczająco ukarać wysoce niebezpiecznych wyników.
źródło
To jest test homoscedastyczności. A ponieważ jest to szereg czasowy, właściwym wyborem jest test Breuscha-Pagana , a nie test F. Ten test odpowiada TYLKO na pytanie o równości precyzji między dwoma urządzeniami. Poziom precyzji jest innym sposobem myślenia o wariancji.
[Edytuj: Zmieniłem test na poprawny, biorąc pod uwagę zależność czasową]
źródło
Jeśli jesteś zainteresowany tym, jak dobrze urządzenia utrzymują temperaturę 37 ° C, możesz:
Dane naturalnie nadają się do leczenia z powtarzanymi pomiarami. Traktując próby osobiste jako klastry, zmniejszysz prawdopodobieństwo fałszywie oszacowanego przedziału ufności wokół efektu urządzenia. Ponadto można przetestować wpływ czasu między obydwoma urządzeniami lub interakcję z urządzeniem, aby ustalić, czy utrzymanie temperatury w czasie było dobre. Znalezienie sposobu na wizualizację tego wszystkiego ma kluczowe znaczenie i może sugerować jedno podejście nad drugim. Coś w stylu:
źródło