Nazywam się Hugh i jestem doktorantem używającym uogólnionych modeli addytywnych w celu przeprowadzenia analizy eksploracyjnej.
Nie jestem pewien, jak interpretować wartości p pochodzące z pakietu MGCV i chciałem sprawdzić swoje zrozumienie (używam wersji 1.7-29 i zapoznałem się z dokumentacją Simona Wooda). Najpierw szukałem innych pytań CV, ale te najbardziej odpowiednie wydają się dotyczyć ogólnych regresji, a nie w szczególności wartości p GAM.
Wiem, że GAM ma wiele różnych argumentów, a wartości p są jedynie przybliżone. Zaczynam jednak po prostu sprawdzać, czy istnieje jakikolwiek „sygnał” dla moich zmiennych towarzyszących. Na przykład:
Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) + s (d, k = 3) + s (e, k = 3)
Przybliżone wartości p terminów gładkich:
s (a) = 0,000473
s (b) = 1,13e-05
s (c) = 0,000736
s (d) = 0,887579
s (e) = 0,234017
R ² (skorygowany) = 0,62 Wyjaśnienie Deviance = 63,7%
wynik GCV = 411,17 Szacunkowa skala = 390,1 n = 120
Wycinam kolumny df itp. Ze względu na formatowanie. Interpretuję wartości p dla każdej zmiennej towarzyszącej jako test, czy odpowiadająca jej funkcja gładka znacznie zmniejsza odchylenie modelu, gdzie p jest prawdopodobieństwem uzyskania danych co najmniej tak „mało prawdopodobnym”, jak to zaobserwowane przy zerowym modelu 0.
Oznaczałoby to, że (np. Przy alfa = 0,05) wygładzone funkcje nie zmniejszyły odchylenia dla „d” i „e” w porównaniu z modelem zerowym, podczas gdy zrobiły to dla innych terminów. Stąd (d) i (e) nie dodają istotnych informacji do regresji, a wyjaśnione odchylenie sprowadza się do (a) (b) (c)?
Wszelkie porady będą mile widziane i powodzenia w twoich badaniach.