Analiza okresowa to analiza danych w jednym lub więcej punktach czasowych przed oficjalnym zamknięciem badania z zamiarem np. Ewentualnego wcześniejszego zakończenia badania.
Według Piantadosi, S. ( Badania kliniczne - perspektywa metodologiczna ): „ Oszacowanie efektu leczenia będzie tendencyjne, gdy badanie zostanie zakończone na wczesnym etapie. Im wcześniej decyzja, tym większy błąd ”.
Czy możesz mi wyjaśnić to twierdzenie. Mogę łatwo zrozumieć, że wpłynie to na dokładność, ale twierdzenie o stronniczości nie jest dla mnie oczywiste ...
clinical-trials
bias
ocram
źródło
źródło
Odpowiedzi:
Przede wszystkim należy zwrócić uwagę na kontekst: ma to zastosowanie tylko wtedy, gdy badanie zostało przerwane wcześniej ze względu na tymczasowe monitorowanie skuteczności / daremności, a nie z jakiegoś losowego powodu zewnętrznego. W takim przypadku oszacowanie wielkości efektu będzie tendencyjne w całkowicie statystycznym sensie. Jeśli zatrzymałeś się na skuteczność, szacowany efekt będzie zbyt wysoki (zakładając, że jest pozytywny), jeśli zatrzymasz się na marność, będzie on zbyt niski.
Piantodosi podaje również intuicyjne wyjaśnienie (Sec 10.5.4 w moim wydaniu). Załóżmy, że prawdziwa różnica na dwa sposoby wynosi 1 jednostkę. Kiedy przeprowadzasz wiele prób i patrzysz na nie w czasie analizy tymczasowej, niektóre z nich zaobserwują rozmiary efektów znacznie powyżej 1, niektóre znacznie poniżej jednego, a większość około 1 - rozkład będzie szeroki, ale symetryczny. Szacowany rozmiar efektu w tym momencie nie byłby bardzo dokładny, ale byłby obiektywny. Jednak zatrzymujesz się i zgłaszasz rozmiar efektu tylko wtedy, gdy różnica jest znacząca (skorygowana o wielokrotne testowanie), to znaczy, że szacunek jest zawyżony. We wszystkich innych przypadkach kontynuujesz i nie zgłaszasz szacunków. Oznacza to, że pod warunkiem wcześniejszego zatrzymania, rozkład wielkości efektu nie jest symetryczny, a jego oczekiwana wartość jest wyższa od prawdziwej wartości oszacowania.
Fakt, że ten efekt jest silniejszy na początku, wynika z większej przeszkody w zatrzymaniu próby, a zatem większa część rozkładu jest wyrzucana podczas kondycjonowania.
źródło
Oto ilustracja tego, jak stronniczość może wynikać z wniosków i dlaczego może to nie być pełna historia. Załóżmy, że masz sekwencyjne badanie leku, który powinien mieć pozytywny (+1) efekt, ale może mieć negatywny efekt (-1). Pięć świnek morskich bada się jedna po drugiej. Nieznane prawdopodobieństwo pozytywnego wyniku w pojedynczym przypadku wynosi w rzeczywistości i wynik negatywny134 .14
Zatem po pięciu próbach prawdopodobieństwo różnych wyników jest
więc ogólne prawdopodobieństwo pozytywnego wyniku wynosi 918/1024 = 0,896, a średni wynik wynosi +2,5. Dzieląc przez 5 prób, jest to średnio wynik +0,5 na próbę.
Jest to postać obiektywna, ponieważ jest to również .+1×34−1×14
Załóżmy, że w celu ochrony świnek morskich badanie zostanie zakończone, jeśli na dowolnym etapie łączny wynik będzie ujemny. Wtedy stają się prawdopodobieństwa
więc ogólne prawdopodobieństwo pozytywnego wyniku wynosi 702/1024 = 0,6855, a średni wynik to +1.953. Gdybyśmy oceniali średnią wartość wyniku na próbę w poprzednim obliczeniu, tj. Używając ,+3+55 ,+1+35 ,-1+15 ,-1−15 i-1−13 wtedy otrzymalibyśmy +0,184.−11
Są to zmysły, w których występuje uprzedzenie poprzez zatrzymanie się na wczesnym etapie drugiego schematu, a uprzedzenie jest w przewidywanym kierunku. Ale to nie jest pełna historia.
Dlaczego myśl i prawdopodobieństwo logiczne, że wczesne zatrzymanie powinno przynosić obiektywne wyniki? Wiemy, że oczekiwany wynik prób w drugim schemacie wynosi +1.953. Oczekiwana liczba prób to 3,906. Dzieląc jeden za drugim, otrzymujemy +0,5, dokładnie tak jak poprzednio i to, co zostało określone jako obiektywne.
źródło
Cóż, moja wiedza na ten temat pochodzi z Harveian oracji w 2008 http://bookshop.rcplondon.ac.uk/details.aspx?e=262 Zasadniczo, do mojej najlepszej skupienia wyniki będą tendencyjne jak 1) zatrzymanie na początku zazwyczaj oznacza, że albo leczenie było mniej lub bardziej skuteczne, niż się spodziewano, a jeśli jest to pozytywne, możesz wykorzystać przypadek. Uważam, że wartości p są obliczane na podstawie planowanej wielkości próby (ale mogę się mylić w tym zakresie), a także jeśli ciągle sprawdzasz swoje wyniki, aby zobaczyć, czy jakieś efekty zostały pokazane, musisz poprawić wielokrotne porównania w celu zapewnienia, że nie znajdziesz jedynie efektu szansy. Na przykład, jeśli sprawdzisz 20 razy wartości p poniżej 0,05, a następnie statystycznie, prawie na pewno znajdziesz jeden znaczący wynik.
źródło
Nie zgodziłbym się z tym twierdzeniem, chyba że „stronniczość” Piantadosi oznacza tę część dokładności, która jest powszechnie nazywana stronniczością. Wnioskowanie nie będzie „stronnicze”, ponieważ zdecydowałeś się zatrzymać per se: będzie „stronnicze”, ponieważ masz mniej danych. Tak zwana „zasada prawdopodobieństwa” stanowi, że wnioskowanie powinno zależeć tylko od danych, które zaobserwowano, a nie od danych, które można było zaobserwować, ale nie. LP mówi
źródło
nie będzie mieć nastawienie (w „sensie statystycznym”), jeżeli zakończenie studiów nie jest przypadkowa.
W zestawie eksperymentów do konkluzji, „wczesne” wyniki (a) niektórych eksperymentów, które ostatecznie okażą „brak efektu”, pokażą pewien efekt (w wyniku przypadku) i (b) niektóre eksperymenty, które ostatecznie znajdą efekt pokaże „brak efektu” (prawdopodobnie w wyniku braku mocy). W świecie, w którym kończysz próby, jeśli przestaniesz (a) częściej niż (b), skończysz w serii badań z uprzedzeniami na rzecz znalezienia efektu. (Ta sama logika dotyczy wielkości efektów ; kończenie badań, które wykazują efekt „większy niż oczekiwano” wcześniej niż częściej niż te, które wykazują „zgodnie z oczekiwaniami lub mniej” spowoduje zawyżenie liczby wyników „dużego efektu”).
Jeśli w rzeczywistości badania medyczne zostaną zakończone, gdy wczesne wyniki wykażą pozytywny efekt - w celu udostępnienia leczenia osobom w grupie placebo lub innym - ale nie wtedy, gdy wczesne wyniki nie przyniosą jednoznacznych rezultatów, w takich testach wystąpi więcej błędów typu 1 niż byłoby, gdyby wszystkie eksperymenty zostały zakończone. Ale to nie znaczy, że praktyka jest zła; koszt błędu typu 1, moralnie rzecz biorąc, może być niższy niż odmowa leczenia tak szybko, jak w innym przypadku dla zabiegów, które naprawdę okazałyby się skuteczne pod koniec pełnego badania.
źródło