Mam model nieliniowy , gdzie jest cdf standardowego rozkładu normalnego if jest nieliniowe (patrz poniżej). Chcę przetestować poprawność dopasowania tego modelu za pomocą parametru do moich danych , po użyciu oszacowania maksymalnego prawdopodobieństwa, aby znaleźć . Jaki byłby odpowiedni test? Chciałbym użyć tego testu do oznaczenia złego dopasowania jako złego i ustalenia, czy należy zgromadzić więcej danych.
Spojrzałem na użycie dewiacji, która porównuje ten model z modelem nasyconym, z odpowiadającym mu testem dobroci dopasowania przy użyciu . Czy byłoby to właściwe? Większość tego, co przeczytałem o dewiacji, stosuje ją do GLM, co nie jest tym, co mam. Jeśli test dewiacji jest odpowiedni, jakie założenia należy przyjąć, aby test był ważny?
Aktualizacja: dla na wypadek, gdyby to pomogło.
źródło
Odpowiedzi:
Jeśli używasz platformy R., użyj pakietu „npcmstest” w bibliotece „NP”. Ostrzeżenie: Ta funkcja może potrwać kilka minut, aby ocenić model.
Można również rozważyć teoretyczne porównanie rozkładu odpowiedzi i rozkładu predykcyjnego (tj. Rozbieżność KL, entropia krzyżowa itp.)
źródło
lm
lubglm
. Jak to by działało w przypadku modelu nieliniowego? (Tak, używam R.) Dodałem do mojego pytania na wypadek, gdyby to pomogło.gam
lub jak (mgcv
pakiet)? Jeśli nie, powinieneś to sprawdzić.Oto jak bym to zrobił, w zasadzie test współczynnika prawdopodobieństwa. Pamiętaj jednak, że „kluczem” do zrozumienia dobroci testu dopasowania jest zrozumienie klasy alternatyw, na których testujesz. Teraz mamy prawdopodobieństwo dla każdego pojedynczego punktu danych jako:
Gdzie jest prawdopodobieństwem terminu błędu w twoim modelu, a jest prognozą modelu dla i-tego punktu danych, biorąc pod uwagę oraz . Teraz dla każdego punktu danych możemy wybrać takie, że - ten „nasycony model” jak to nazwać. Więc test jest odpowiedni tutaj, jeśli chcesz przetestować tylko alternatywy w klasie tych z tym samym prawdopodobieństwem błędu, , i masz niezależność od każdego z prawdopodobieństw (tj. Wiedząc inny nie byłby pomocny w przewidywaniug(ϵ) fi=xi−1ax2i+1√ xi a (xi,yi) a fi=yi χ2 g(ϵ) xj,yj yi , dane ). a
źródło
W kontekście regresji liniowej testowanie dopasowania jest często przeprowadzane w porównaniu z bardziej skomplikowaną alternatywą. Masz regresję liniową - rzuć kilkoma terminami wielomianowymi, aby sprawdzić, czy forma liniowa jest wystarczająca. Ponieważ masz już nieliniową formę funkcjonalną, skomplikowaną alternatywą, którą musisz rozważyć, musiałaby być regresja nieparametryczna . Nie będę próbował przedstawiać tego tematu, ponieważ wymaga on własnego sposobu myślenia i warto go osobno wprowadzić. W przypadku testu regresji parametrycznej vs. nieparametrycznej, Wooldridge (1992) lub Hardle i Mammen (1993) , robią bardzo podobne rzeczy. Hardle napisał także świetną książkę na ten temat.
źródło