Wyobraź sobie, że powtarzasz eksperyment trzy razy. W każdym eksperymencie zbierasz trzykrotnie pomiary. Trzy powtórzenia wydają się być dość blisko siebie, w porównaniu do różnic między trzema średnimi eksperymentalnymi. Obliczenie wielkiego środka jest dość łatwe. Ale jak obliczyć przedział ufności dla wielkiej średniej?
Przykładowe dane:
Eksperyment 1: 34, 41, 39
Eksperyment 2: 45, 51, 52
Eksperyment 3: 29, 31, 35
Załóżmy, że powtórzone wartości w eksperymencie są zgodne z rozkładem Gaussa, podobnie jak średnie wartości z każdego eksperymentu. SD wariancji w eksperymencie jest mniejsza niż SD wśród średnich eksperymentalnych. Załóżmy również, że w każdym eksperymencie nie ma kolejności trzech wartości. Kolejność trzech wartości w każdym rzędzie od lewej do prawej jest całkowicie dowolna.
Prostym podejściem jest najpierw obliczyć średnią z każdego eksperymentu: 38,0, 49,3 i 31,7, a następnie obliczyć średnią z 95% przedziału ufności tych trzech wartości. Przy użyciu tej metody średnia wynosi 39,7, a przedział ufności 95% wynosi od 17,4 do 61,9.
Problem z tym podejściem polega na tym, że całkowicie ignoruje zmienność pomiędzy trzema powtórzeniami. Zastanawiam się, czy nie ma dobrego sposobu na uwzględnienie tej odmiany.
źródło
Odpowiedzi:
Istnieje naturalny dokładny przedział ufności dla babci w zrównoważonym losowym jednokierunkowym modelu ANOVA Rzeczywiście łatwo jest sprawdzić, czy rozkład obserwowanych średnich ˉ y i ∙ wynosi ˉ y i ∙ ∼ iid N ( μ , τ 2 ) przy τ 2 = σ 2 b + σ 2 w
Zauważ, że ten przedział ufności jest niczym innym, jak klasycznym przedziałem dla średniej Gaussa, biorąc pod uwagę jedynie grupę oznacza jako obserwacjey¯i ∙ . Zatem proste podejście, o którym wspominasz:
jest w porządku. Twoja intuicja dotycząca ignorowanej odmiany:
jest źle. Wspominam również o poprawności takiego uproszczenia w /stats//a/72578/8402
Aktualizacja 12.04.2014
Niektóre szczegóły są teraz zapisane na moim blogu: Zmniejszenie modelu, aby uzyskać przedziały ufności .
źródło
Jest to kwestia oceny w ramach liniowego modelu efektów mieszanych. Problem polega na tym, że wariancja średniej średniej jest ważoną sumą dwóch składników wariancji, które należy osobno oszacować (za pomocą ANOVA danych). Szacunki mają różne stopnie swobody. Dlatego chociaż można próbować skonstruować przedział ufności dla średniej za pomocą zwykłych wzorów małej próby (Student t), jest mało prawdopodobne, aby osiągnąć jego nominalny zasięg, ponieważ odchylenia od średniej nie będą dokładnie zgodne z rozkładem t Studenta.
Niedawny (2010) artykuł Evy Jarosova, Estimation with the Linear Mixed Effects Model , omawia ten problem. (Od 2015 r. Wydaje się, że nie jest już dostępny w Internecie.) W kontekście „małego” zestawu danych (nawet trzykrotnie większego niż ten) używa symulacji do oceny dwóch przybliżonych obliczeń CI (studnia - znane przybliżenie Satterthwaite i „metoda Kenwarda-Rogera”). Jej wnioski obejmują
Krótko mówiąc, wydaje się , że to dobre podejście
Oblicz konwencjonalny CI, używając oszacowań składników wariancji i udając, że obowiązuje rozkład t.
Oblicz także co najmniej jeden z dostosowanych CI.
Jeśli obliczenia są „zamknięte”, zaakceptuj konwencjonalne CI. W przeciwnym razie zgłoś, że nie ma wystarczających danych, aby stworzyć wiarygodny CI.
źródło
Nie możesz mieć jednego przedziału ufności, który rozwiązuje oba problemy. Musisz wybrać jeden. Możesz albo wyprowadzić jeden ze średniego błędu kwadratowego wariancji w obrębie wariantu eksperymentu, który pozwala ci powiedzieć coś o tym, jak dokładnie możesz oszacować wartości w eksperymencie, albo możesz to zrobić pomiędzy i będzie to dotyczyło między eksperymentami. Gdybym właśnie to zrobił, chciałbym raczej narysować go wokół 0, a nie wokół wielkiej średniej, ponieważ nie mówi ona nic o rzeczywistej wartości średniej, tylko o efekcie (w tym przypadku 0). Lub możesz po prostu wykreślić oba i opisać, co robią.
Masz kontrolę nad tym. W tym przypadku jest to jak obliczenie terminu błędu w ANOVA w celu uzyskania MSE do pracy, a stamtąd SE dla CI jest po prostu sqrt (MSE / n) (n = 3 w tym przypadku).
źródło
Myślę, że CI dla średniej średniej jest zbyt szeroki [17,62], nawet dla zakresu oryginalnych danych.
Te eksperymenty są BARDZO powszechne w chemii. Na przykład przy certyfikacji materiałów referencyjnych musisz losowo zbierać niektóre butelki z całej partii i przeprowadzać analizę replikacji na każdej butelce. Jak obliczyć wartość odniesienia i jej niepewność? Jest na to wiele sposobów, ale najbardziej wyrafinowane (i poprawne, jak sądzę) jest stosowanie metaanalizy lub ML (Dersimonian-Laird, Vangel-Rukhin itp.)
Co z szacunkami bootstrap?
źródło