Pytanie dotyczy marginalnych efektów (X na Y), jak sądzę, nie tyle interpretacji poszczególnych współczynników. Jak zauważyli ludzie, tylko czasami można je zidentyfikować za pomocą wielkości efektu, np. Gdy istnieją relacje liniowe i addytywne.
Jeśli to jest najważniejsze, wydaje się, że (koncepcyjnie, jeśli nie praktycznie) najprostszy sposób myślenia o problemie jest następujący:
Aby uzyskać efekt krańcowy X na Y w modelu regresji liniowej normalnego bez interakcji, to może wystarczy spojrzeć na współczynnik na X ale to nie dosyć, ponieważ szacuje się, nie wiadomo. W każdym razie tak naprawdę chce się efektów marginalnych, jest jakiś wykres lub podsumowanie, które zapewnia prognozę Y dla zakresu wartości X i miarę niepewności. Zazwyczaj można chcieć przewidywanej średniej Y i przedziału ufności, ale można również przewidzieć całkowity rozkład warunkowy Y dla X. Rozkład ten jest szerszy niż oszacowanie sigma dopasowanego modelu, ponieważ uwzględnia niepewność co do współczynników modelu .
Istnieją różne rozwiązania w formie zamkniętej dla prostych modeli takich jak ten. Dla obecnych celów możemy je zignorować i zamiast tego zastanowić się bardziej ogólnie, jak uzyskać ten wykres efektów krańcowych przez symulację, w sposób, który dotyczy dowolnie złożonych modeli.
Załóżmy, że chcesz mieć wpływ zmiany X na średnią Y i z przyjemnością naprawisz wszystkie inne zmienne przy pewnych znaczących wartościach. Dla każdej nowej wartości X pobierz próbkę wielkości B z rozkładu współczynników modelu. Łatwym sposobem na zrobienie tego w R jest założenie, że jest to Normalny z coef(model)
macierzą średnich i kowariancji vcov(model)
. Oblicz nowe oczekiwane Y dla każdego zestawu współczynników i podsumuj partię z interwałem. Następnie przejdź do następnej wartości X.
Wydaje mi się, że na tę metodę nie powinny mieć wpływu żadne fantazyjne transformacje zastosowane do żadnej ze zmiennych, pod warunkiem, że zastosujesz je (lub ich odwrotności) na każdym etapie próbkowania. Tak więc, jeśli dopasowany model ma log (X) jako predyktor, to zaloguj nowy X przed pomnożeniem go przez współczynnik próbkowany. Jeśli dopasowany model ma sqrt (Y) jako zmienną zależną, to przed obliczeniem ich jako interwału każdy kwadrat przewiduje średnią w próbce.
Krótko mówiąc, więcej programowania, ale mniej obliczeń prawdopodobieństwa i w rezultacie klinicznie zrozumiałe efekty marginalne. Ta „metoda” jest czasami określana jako CLARIFY w literaturze nauk politycznych, ale jest dość ogólna.