Opis badania:
Zauważyłem częsty błąd w metaanalizach w odniesieniu do obsługi replikacji w ramach badania. Nie jest dla mnie jasne, czy błąd unieważnia badania po sformułowaniu założeń. Jednak, jak rozumiem, założenia te naruszają podstawową przesłankę statystyki.
Na przykład, badania Badania efektów chemicznej w reakcji .Y
Analiza jest przeprowadzana na logarytmicznym stosunku odpowiedzi: stosunek leczenia (w obecności ) do kontroli (bez ): X Y 0 X
Niektóre z tych badań zawarte w meta-analizy zawierają wiele zabiegów, na przykład różne poziomy lub chemiczne formy . Dla każdego leczenia istnieje inna wartość , chociaż zawsze używa tej samej wartości .R R Y 0
Metody określają:
odpowiedzi na różne terapie (poziomy i formy ) w ramach jednego badania uznano za niezależne obserwacje.
Pytania:
- Czy to nie jest pseudoreplikacja?
- Czy jest to niewłaściwe, nawet jeśli w metodach stwierdzono naruszenie niezależności?
- Jaki byłby łatwy sposób (np. W ramach możliwości prostego pakietu oprogramowania do metaanalizy) obsługi replikacji badania?
Wstępne przemyślenia:
- Podsumuj wyniki każdego badania, np. Biorąc średnią odpowiedź
- Wybrać tylko jeden zabieg z każdego badania w oparciu o kryteria a priori (np. Najwyższa dawka, pierwszy pomiar)?
Czy są jakieś inne rozwiązania?
źródło
Odpowiedzi:
Tak, jest to problem, ponieważ w odpowiedziach należy wziąć pod uwagę zależność próbkowania (chociaż czasami efekt może być nieistotny i cały czas naruszamy założenie podczas przeprowadzania analiz statystycznych). Istnieją metody, aby sobie z tym poradzić, jednym podejściem jest uwzględnienie kowariancji między powiązanymi eksperymentami (bloki nie przekątne) w macierzy wariancji błędu-kowariancji (patrz np. Hedges i in., 2010). Na szczęście przy stosunkach logów jest to dość łatwe. Można uzyskać przybliżone kowariancje między eksperymentami, ponieważ wariancja (var) log R wynosi (jeśli Yx i Y0 są niezależnymi grupami): log Yx - log Y0, aby postępować zgodnie z zapisem w pytaniu, Yx odnosi się do grupy eksperymentalnej, a Y0 Grupa kontrolna. Kowariancja (cov) między dwiema wartościami (np. Leczenie 1 i leczenie 2) dla log R wynosi cov (loge Yx_1 - log Y0, log Yx_2 - log Y0), który jest równy var (log Y0), i jest obliczany jako SD_Y0 / (n_Y0 * Y0), gdzie SD_Y0 jest standardowym odchyleniem Y0, n_Y0 jest rozmiarem próbki w traktowaniu kontrolnym, a Y0 wynosi wartość w leczeniu kontrolnym. Teraz możemy podłączyć całą macierz wariancji-kowariancji do naszego modelu, zamiast używać tylko wariancji (ei), co jest klasycznym sposobem przeprowadzania metaanalizy. Przykład tego można znaleźć wLimpens i in. 2011 przy użyciu pakietu metahdep w R (na bioprzewodniku) lub Stevens i Taylor 2009 dla Hedge's D.
Jeśli chcesz to uprościć, pokusiłbym się zignorować problem i spróbować ocenić efekt zależności próbkowania (np. Ile zabiegów jest w ramach badań? Jak zmieniają się wyniki, jeśli używam tylko jednego leczenia? Itp.) .
źródło
Tak, to jest problem.
Tak, jest nieodpowiedni, chociaż przynajmniej jest przejrzysty na temat tego, co robi (dostaje punkty za przejrzystość, ale nadal nie jest zadowalający).
Wątpię, czy istnieje „łatwy sposób”, aby to naprawić. Nie wiem wiele na temat podejść do metaanalizy, ale jeśli istnieje specjalne oprogramowanie do metaanalizy, a badania tego typu są tworzone przy jego użyciu i publikowane, może to być wspólne podejście. Każda z proponowanych odpowiedzi traci pewną ziarnistość informacji z każdego badania (tj. Odwrotny problem tego, co zrobili wydawcy).
Oczywistym rozwiązaniem jest model z efektami mieszanymi (tj. Wielopoziomowy) z badaniem jako czynnikiem losowym. Sugerowałbym użycie do tego specjalistycznego pakietu statystycznego, jeśli oprogramowanie do metaanalizy nie może tego zrobić. Nadal możesz używać oprogramowania do metaanalizy do przechowywania i przetwarzania danych, a także eksportować dane do R, Stata lub SAS w celu przeprowadzenia analizy.
źródło