Dlaczego nie przeprowadzić metaanalizy danych częściowo symulowanych?

11

Tło:

Typowa metaanaliza w psychologii może próbować modelować korelację między dwiema zmiennymi X i Y. Analiza zazwyczaj obejmuje uzyskanie zestawu odpowiednich korelacji z literatury wraz z wielkością próby. Następnie można zastosować formuły do ​​obliczenia średniej ważonej korelacji. Następnie można przeprowadzić analizy, aby sprawdzić, czy korelacje różnią się w poszczególnych badaniach o więcej niż wynikałoby to z samych efektów losowego próbkowania.

Ponadto analizy mogą być znacznie bardziej złożone. Szacunki można skorygować pod kątem niezawodności, ograniczenia zasięgu i innych parametrów. Korelacje mogą być stosowane w połączeniu do badania modelowania równań meta strukturalnych lub regresji meta itd.

Jednak wszystkie te analizy są przeprowadzane przy użyciu statystyk podsumowujących (np. Korelacji, ilorazów szans, znormalizowanych średnich różnic) jako danych wejściowych. Wymaga to zastosowania specjalnych formuł i procedur, które akceptują statystyki podsumowujące.

Alternatywne podejście do metaanalizy

Tak więc myślałem o alternatywnym podejściu do metaanalizy, w którym surowe dane są wykorzystywane jako dane wejściowe. To znaczy, dla korelacji dane wejściowe byłyby surowymi danymi użytymi do utworzenia korelacji. Oczywiście w większości metaanaliz nie jest dostępnych kilka, jeśli nie większość rzeczywistych danych surowych. Tak więc podstawowa procedura może wyglądać następująco:

  1. Skontaktuj się ze wszystkimi opublikowanymi autorami poszukującymi surowych danych, a jeśli tak, użyj rzeczywistych surowych danych .
  2. W przypadku autorów, którzy nie dostarczają surowych danych, należy przeprowadzić symulację surowych danych, aby uzyskać identyczne statystyki podsumowujące jak zgłoszone. Takie symulacje mogą również obejmować wszelką wiedzę uzyskaną z surowych danych (np. Jeśli wiadomo, że zmienna jest wypaczona itp.).

Wydaje mi się, że takie podejście może przynieść kilka korzyści:

  • Do analiz można wykorzystać narzędzia statystyczne wykorzystujące surowe dane
  • Dzięki uzyskaniu przynajmniej niektórych rzeczywistych surowych danych autorzy metaanaliz byliby zmuszeni rozważyć kwestie związane z rzeczywistymi danymi (np. Wartości odstające, rozkłady itp.).

Pytanie

  • Czy są jakieś problemy z przeprowadzeniem badań metaanalizy na połączeniu prawdziwych surowych danych i danych symulowanych w celu uzyskania identycznych statystyk podsumowujących z istniejącymi opublikowanymi badaniami?
  • Czy takie podejście byłoby lepsze niż istniejące metody przeprowadzania metaanaliz na podstawie statystyk podsumowujących?
  • Czy istnieje jakaś literatura omawiająca, popierająca lub krytykująca to podejście?
Jeromy Anglim
źródło
1
Do nr 1: przez większość czasu wydaje się, że niezwykle trudno byłoby zmusić wszystkie dane do tego samego formatu! Do nr 2: tak będzie, chyba że a) użyjesz szczególnie złych metod lub b) statystyki podsumowujące są również wystarczającą statystyką dla parametrów, którymi jesteś zainteresowany.
Andy McKenzie,
1
@Andy McKenzie Re # 1: Właśnie to robię (tj. Metaanaliza IPD). Biorąc pod uwagę, że moje statystyki wyników pochodzą z modeli regresji, wydaje mi się to najbardziej użytecznym podejściem. Wiem, że pisałeś „przez większość czasu” :-)
Bernd Weiss,

Odpowiedzi:

6

Istnieją już podejścia, które mają na celu zsyntetyzowanie danych indywidualnych i zbiorczych osób. The Sutton i in. (2008) w pracy zastosowano podejście bayesowskie, które (IMHO) ma pewne podobieństwa do twojego pomysłu.

  • Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., i Boutitie, F. (2007). Metaanaliza wyników ciągłych łączących dane poszczególnych pacjentów i dane zagregowane. Statystyka w medycynie, 27 (11), 1870–1893. doi: 10.1002 / sim.3165 PDF

  • Riley, RD i Steyerberg, EW (2010). Metaanaliza wyniku binarnego z wykorzystaniem danych poszczególnych uczestników i danych zagregowanych. Research Synthesis Methods, 1 (1), 2–19. doi: 10.1002 / jrsm.4

  • Sutton, AJ, Kendrick, D., i Coupland, CAC (2008). Metaanaliza danych na poziomie indywidualnym i zagregowanym. Statystyka w medycynie, 27 (5), 651–669.

Bernd Weiss
źródło
10

Dziękuję @Bernd za skierowanie mnie we właściwym kierunku. Oto kilka uwag na temat odniesień, o których wspomniał w swojej odpowiedzi, a także niektórych odniesień wymienionych w tych artykułach.

Sutton i in. (2008)

Sutton i wsp. Używają w kontekście zdrowia terminów dane poszczególnych pacjentów w porównaniu do danych zbiorczych .

Zauważają, że analiza danych poszczególnych pacjentów jest często uważana za złoty standard metaanalizy, powołując się na Stewarta i Clarka (1995). Jest to szczególnie przydatne do oceny jakości danych i wykonywania analiz wartości niezgłoszonych w istniejących raportach (np. Analizy poszczególnych podgrup). Oczywiście zauważają problemy, takie jak niemożność w niektórych przypadkach uzyskania wszystkich indywidualnych danych pacjenta i dodatkowe koszty przetwarzania takich danych. Zauważają również, że w przypadku prostych modeli, w których dostępne są statystyki podsumowujące, wyniki często będą podobne lub takie same.

Obserwują także rzadką metaanalizę poszczególnych pacjentów, powołując się na recenzję Simmondsa i in. (2005). Wspominają także artykuł przeglądowy z metaanalizy łączącej dane poszczególnych pacjentów z danymi zbiorczymi autorstwa Riley RD, Simmonds i in. (2008)

Riley Lambert Abo-Zaid (2010)

W tym artykule Riley i wsp. Opisują więcej na temat metaanalizy danych poszczególnych uczestników. Wskazują zalety metaanalizy danych poszczególnych uczestników (np. Spójne przetwarzanie danych, modelowanie brakujących danych, weryfikacja pierwotnie zgłoszonych wyników, więcej opcji analizy itp.)

Stewart i Tierney (2002)

Stewart i Tierney dokonują przeglądu zalet i wad metaanalizy danych poszczególnych pacjentów, koncentrując się szczególnie na kwestiach praktycznych.

Riley Lambert i in. (2007)

Opisują metody łączenia danych poszczególnych pacjentów z danymi zbiorczymi w kategoriach podejścia jedno- i dwuetapowego.

Cooper & Patall (2009)

Cooper i Patall napisali artykuł jako część specjalnego wydania na temat metaanalizy danych na poziomie indywidualnym w Metodach Psychologicznych (podsumowanie znajduje się w Shrout, 2009). Cooper i Patall opisują syntezę badań jako jeden na drugim etapie przejścia:

Pierwszym przejściem jest narracyjny przegląd badań - w którym nieprzezroczyste reguły algebry poznawczej są wykorzystywane do syntezy wyników badań - do metaanalizy [danych zagregowanych]. Drugi etap obejmuje przejście od metaanalizy [danych zagregowanych] do gromadzenia [danych na poziomie poszczególnych uczestników].

ciąg dalszy nastąpi...

Bibliografia

  • Cooper, H. i Patall, EA (2009). Względne korzyści metaanalizy przeprowadzonej z danymi poszczególnych uczestników w porównaniu do danych zagregowanych. Metody psychologiczne, 14 (2), 165–176. doi: 10.1037 / a0015565
  • Riley, RD, Lambert, PC, Staessen, JA, Wang, J., Gueyffier, F., Thijs, L., i Boutitie, F. (2007). Metaanaliza wyników ciągłych łączących dane poszczególnych pacjentów i dane zagregowane. Statystyka w medycynie, 27 (11), 1870–1893. doi: 10.1002 / sim.3165 [PDF] (http://www.staessen.net/publications/2006-2010/08-21-P.pdf)
  • Riley, RD, Lambert, PC, i Abo-Zaid, G. (2010). Metaanaliza danych poszczególnych uczestników: uzasadnienie, postępowanie i sprawozdawczość, BMJ, 340, 221.
  • Riley RD, Simmonds MC, Look MP. (2007) Synteza dowodów łącząca dane poszczególnych pacjentów i dane zbiorcze: przegląd systematyczny zidentyfikował aktualną praktykę i możliwe metody. Journal of Clinical Epidemiology, w prasie i na wczesnym etapie.
  • Riley, RD i Steyerberg, EW (2010). Metaanaliza wyniku binarnego z wykorzystaniem danych poszczególnych uczestników i danych zagregowanych. Research Synthesis Methods, 1 (1), 2–19. doi: 10.1002 / jrsm.4
  • Shrout, PE (2009). Krótkie i długie widoki integracyjnej analizy danych: komentarze na temat wkładu do wydania specjalnego. Metody psychologiczne, 14, 177.
  • Simmonds MC, Higgins JPT, Stewart LA, Tierney JF, Clarke MJ, Thompson SG. (2005). Metaanaliza danych poszczególnych pacjentów z randomizowanych badań: przegląd metod stosowanych w praktyce. Badania kliniczne ; 2: 209–217.
  • Stewart LA, Clarke MJ. Praktyczna metodologia metaanaliz (przeglądów) z wykorzystaniem zaktualizowanych danych poszczególnych pacjentów. Grupa robocza Cochrane. Statystyka w medycynie 1995; 14: 2057–2079.
  • Stewart LA, Tierney JF. Do IPD czy nie do IPD? Zalety i wady systematycznych przeglądów z wykorzystaniem danych poszczególnych pacjentów. Eval Health Prof 2002; 25: 76-97.
  • Sutton, AJ, Kendrick, D., i Coupland, CAC (2008). Metaanaliza danych na poziomie indywidualnym i zagregowanym. Statystyka w medycynie, 27 (5), 651–669.
Jeromy Anglim
źródło
Świetna odpowiedź, Jeromy! Właściwie powinna to być najlepsza odpowiedź ... Oto kilka innych dokumentów, których brakuje na twojej liście.
Bernd Weiss,
Dzięki. Robię tylko notatki, kiedy czytam referencje. Te dodatkowe odniesienia są szczególnie przydatne dzięki.
Jeromy Anglim,