Czytam Multivariable Model Building: Pragmatyczne podejście do analizy regresji w oparciu o ułamkowe wielomiany do modelowania zmiennych ciągłych przez Patrick Royston i Willie Sauerbrei. Jak dotąd jestem pod wrażeniem i jest to interesujące podejście, którego wcześniej nie rozważałem.
Ale autorzy nie zajmują się brakującymi danymi. Rzeczywiście, na str. 17 twierdzą, że brakujące dane „wprowadzają wiele dodatkowych problemów. Nie uwzględniono ich tutaj”.
Czy wielokrotna imputacja działa z wielomianami ułamkowymi>
FP jest pod pewnymi względami (ale nie wszystkimi) alternatywą dla splajnów. Czy łatwiej jest radzić sobie z brakującymi danymi dla regresji splajnu?
regression
missing-data
fractional-polynomial
Peter Flom - Przywróć Monikę
źródło
źródło
Odpowiedzi:
Wielokrotna imputacja może być stosowana w przypadku ułamkowych wielomianów i splajnów. Powiedzmy, że reprezentuje twoją funkcjonalną formę (np. ). Niech będzie funkcją oszacowaną w każdej z próbek syntetycznych, wtedy twoja funkcja to .f(x) f(x)=x+x.5 fm() M 1M∑Mmfm(x)
Zakładając, że oprogramowanie, którego używasz, może zapewnić standardowe oszacowanie błędu dla każdej unikalnej wartości x, możesz użyć formuły Rubina (wielokrotna imputacja dla braku odpowiedzi w ankietach; 1987) do obliczenia standardowych błędów. Istnieją małe i duże wzory prób dla stopni swobody z wielokrotnym przypisaniem. Duża próbka (również w Rubinie) pobiera te same dane co standardowy błąd, więc można jej również użyć. Mały przypadek próbki przyjmuje na wejściu stopnie swobody modelu; nie jest dla mnie oczywiste, czy można tu zastosować tę formułę.
źródło