W większości sytuacji mamy do czynienia tylko z jedną zmienną wynik / odpowiedź, taką jak . Jednak w niektórych scenariuszach, szczególnie w danych klinicznych, zmienne wynikowe mogą być wielowymiarowe / wielowymiarowe. Jak na przykład, gdzie zawiera , i zmienne i te wyniki są ze sobą skorelowane. Gdyby oznacza otrzymywanie leczenia (tak / nie), jak mogę zasymulować ten typ danych w R?
Przykład z życia, każdy pacjent otrzymuje jeden z 2 rodzajów operacji bypassu, a badacze mierzą każdego pacjenta pod kątem bólu, obrzęku, zmęczenia ... itd. Po operacji bypassu (każdy wskaźnik objawów od 0 do 10). „Zakładam”, że wyniki (nasilenie objawów) są wielowymiarowe normalne. Mam nadzieję, że ten prawdziwy przykład może wyjaśnić moje pytanie. Z góry bardzo dziękuję.
źródło
Odpowiedzi:
Symuluj wielowymiarowe wartości normalne za pomocą
mvtnorm::rmvnorm
. Wydaje się, że nie działa całkiem jak jednoczynnikowe generatory liczb losowych, które pozwalają określić wektory parametrów, ale to ograniczenie jest łatwe do obejścia.Rozważmy na przykład model
gdziey ma wielowymiarowy rozkład normalny i Var(yi)=1 , Cov(y1,y2)=Cov(y2,y3)=0.5 , i Cov(y1,y3)=0 . Określmy tę macierz kowariancji w R:
Aby eksperymentować, wygenerujmy dane dla tego modelu, pozwalającx różni się 1 przez 10 , z trzema powtórzeniami za każdym razem. Musimy również uwzględnić stałe warunki:
Model określa środki:
Obejściem generowania wielu wyników na wielu odmianach jest użycie
apply
:źródło
Sieci bayesowskie (BN) są powszechnie używane w opisywanym kontekście. Jako model generatywny BN pozwoliłby przedstawić zależności statystyczne między zmiennymi domenowymi, które w twoim przypadku można podzielić na 1) wstępne leczenie, 2) leczenie i 3) zmienne po leczeniu. Możesz wytrenować swój model na istniejących danych pacjenta, a następnie wprowadzić dowody (wypełnić obserwowane wartości) dla konkretnego pacjenta, aby zbadać, w jaki sposób zaobserwowane wartości wpływają na inne zmienne (w tym te oznaczone jako wynik, tj. Po leczeniu).
Jedną z ciekawych sztuczek jest to, że faktycznie można ocenić wpływ różnych rodzajów leczenia na zmienne wyniku. To się nazywa interwencja . Jeżeli zainteresowany, mamy odpowiedni papier tutaj .
źródło