Tło:
Typowa metaanaliza w psychologii może próbować modelować korelację między dwiema zmiennymi X i Y. Analiza zazwyczaj obejmuje uzyskanie zestawu odpowiednich korelacji z literatury wraz z wielkością próby. Następnie można zastosować formuły do obliczenia średniej ważonej korelacji. Następnie można przeprowadzić analizy, aby sprawdzić, czy korelacje różnią się w poszczególnych badaniach o więcej niż wynikałoby to z samych efektów losowego próbkowania.
Ponadto analizy mogą być znacznie bardziej złożone. Szacunki można skorygować pod kątem niezawodności, ograniczenia zasięgu i innych parametrów. Korelacje mogą być stosowane w połączeniu do badania modelowania równań meta strukturalnych lub regresji meta itd.
Jednak wszystkie te analizy są przeprowadzane przy użyciu statystyk podsumowujących (np. Korelacji, ilorazów szans, znormalizowanych średnich różnic) jako danych wejściowych. Wymaga to zastosowania specjalnych formuł i procedur, które akceptują statystyki podsumowujące.
Alternatywne podejście do metaanalizy
Tak więc myślałem o alternatywnym podejściu do metaanalizy, w którym surowe dane są wykorzystywane jako dane wejściowe. To znaczy, dla korelacji dane wejściowe byłyby surowymi danymi użytymi do utworzenia korelacji. Oczywiście w większości metaanaliz nie jest dostępnych kilka, jeśli nie większość rzeczywistych danych surowych. Tak więc podstawowa procedura może wyglądać następująco:
- Skontaktuj się ze wszystkimi opublikowanymi autorami poszukującymi surowych danych, a jeśli tak, użyj rzeczywistych surowych danych .
- W przypadku autorów, którzy nie dostarczają surowych danych, należy przeprowadzić symulację surowych danych, aby uzyskać identyczne statystyki podsumowujące jak zgłoszone. Takie symulacje mogą również obejmować wszelką wiedzę uzyskaną z surowych danych (np. Jeśli wiadomo, że zmienna jest wypaczona itp.).
Wydaje mi się, że takie podejście może przynieść kilka korzyści:
- Do analiz można wykorzystać narzędzia statystyczne wykorzystujące surowe dane
- Dzięki uzyskaniu przynajmniej niektórych rzeczywistych surowych danych autorzy metaanaliz byliby zmuszeni rozważyć kwestie związane z rzeczywistymi danymi (np. Wartości odstające, rozkłady itp.).
Pytanie
- Czy są jakieś problemy z przeprowadzeniem badań metaanalizy na połączeniu prawdziwych surowych danych i danych symulowanych w celu uzyskania identycznych statystyk podsumowujących z istniejącymi opublikowanymi badaniami?
- Czy takie podejście byłoby lepsze niż istniejące metody przeprowadzania metaanaliz na podstawie statystyk podsumowujących?
- Czy istnieje jakaś literatura omawiająca, popierająca lub krytykująca to podejście?
źródło
Odpowiedzi:
Istnieją już podejścia, które mają na celu zsyntetyzowanie danych indywidualnych i zbiorczych osób. The Sutton i in. (2008) w pracy zastosowano podejście bayesowskie, które (IMHO) ma pewne podobieństwa do twojego pomysłu.
Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., i Boutitie, F. (2007). Metaanaliza wyników ciągłych łączących dane poszczególnych pacjentów i dane zagregowane. Statystyka w medycynie, 27 (11), 1870–1893. doi: 10.1002 / sim.3165 PDF
Riley, RD i Steyerberg, EW (2010). Metaanaliza wyniku binarnego z wykorzystaniem danych poszczególnych uczestników i danych zagregowanych. Research Synthesis Methods, 1 (1), 2–19. doi: 10.1002 / jrsm.4
Sutton, AJ, Kendrick, D., i Coupland, CAC (2008). Metaanaliza danych na poziomie indywidualnym i zagregowanym. Statystyka w medycynie, 27 (5), 651–669.
źródło
Dziękuję @Bernd za skierowanie mnie we właściwym kierunku. Oto kilka uwag na temat odniesień, o których wspomniał w swojej odpowiedzi, a także niektórych odniesień wymienionych w tych artykułach.
Sutton i in. (2008)
Sutton i wsp. Używają w kontekście zdrowia terminów dane poszczególnych pacjentów w porównaniu do danych zbiorczych .
Zauważają, że analiza danych poszczególnych pacjentów jest często uważana za złoty standard metaanalizy, powołując się na Stewarta i Clarka (1995). Jest to szczególnie przydatne do oceny jakości danych i wykonywania analiz wartości niezgłoszonych w istniejących raportach (np. Analizy poszczególnych podgrup). Oczywiście zauważają problemy, takie jak niemożność w niektórych przypadkach uzyskania wszystkich indywidualnych danych pacjenta i dodatkowe koszty przetwarzania takich danych. Zauważają również, że w przypadku prostych modeli, w których dostępne są statystyki podsumowujące, wyniki często będą podobne lub takie same.
Obserwują także rzadką metaanalizę poszczególnych pacjentów, powołując się na recenzję Simmondsa i in. (2005). Wspominają także artykuł przeglądowy z metaanalizy łączącej dane poszczególnych pacjentów z danymi zbiorczymi autorstwa Riley RD, Simmonds i in. (2008)
Riley Lambert Abo-Zaid (2010)
W tym artykule Riley i wsp. Opisują więcej na temat metaanalizy danych poszczególnych uczestników. Wskazują zalety metaanalizy danych poszczególnych uczestników (np. Spójne przetwarzanie danych, modelowanie brakujących danych, weryfikacja pierwotnie zgłoszonych wyników, więcej opcji analizy itp.)
Stewart i Tierney (2002)
Stewart i Tierney dokonują przeglądu zalet i wad metaanalizy danych poszczególnych pacjentów, koncentrując się szczególnie na kwestiach praktycznych.
Riley Lambert i in. (2007)
Opisują metody łączenia danych poszczególnych pacjentów z danymi zbiorczymi w kategoriach podejścia jedno- i dwuetapowego.
Cooper & Patall (2009)
Cooper i Patall napisali artykuł jako część specjalnego wydania na temat metaanalizy danych na poziomie indywidualnym w Metodach Psychologicznych (podsumowanie znajduje się w Shrout, 2009). Cooper i Patall opisują syntezę badań jako jeden na drugim etapie przejścia:
ciąg dalszy nastąpi...
Bibliografia
źródło