Jak interpretować wartości P GAM?

10

Nazywam się Hugh i jestem doktorantem używającym uogólnionych modeli addytywnych w celu przeprowadzenia analizy eksploracyjnej.

Nie jestem pewien, jak interpretować wartości p pochodzące z pakietu MGCV i chciałem sprawdzić swoje zrozumienie (używam wersji 1.7-29 i zapoznałem się z dokumentacją Simona Wooda). Najpierw szukałem innych pytań CV, ale te najbardziej odpowiednie wydają się dotyczyć ogólnych regresji, a nie w szczególności wartości p GAM.

Wiem, że GAM ma wiele różnych argumentów, a wartości p są jedynie przybliżone. Zaczynam jednak po prostu sprawdzać, czy istnieje jakikolwiek „sygnał” dla moich zmiennych towarzyszących. Na przykład:

Y ~ s (a, k = 3) + s (b, k = 3) + s (c, k = 3) + s (d, k = 3) + s (e, k = 3)

Przybliżone wartości p terminów gładkich:

s (a) = 0,000473
s (b) = 1,13e-05
s (c) = 0,000736
s (d) = 0,887579
s (e) = 0,234017

R ² (skorygowany) = 0,62 Wyjaśnienie Deviance = 63,7%
wynik GCV = 411,17 Szacunkowa skala = 390,1 n = 120

Wycinam kolumny df itp. Ze względu na formatowanie. Interpretuję wartości p dla każdej zmiennej towarzyszącej jako test, czy odpowiadająca jej funkcja gładka znacznie zmniejsza odchylenie modelu, gdzie p jest prawdopodobieństwem uzyskania danych co najmniej tak „mało prawdopodobnym”, jak to zaobserwowane przy zerowym modelu 0.

Oznaczałoby to, że (np. Przy alfa = 0,05) wygładzone funkcje nie zmniejszyły odchylenia dla „d” i „e” w porównaniu z modelem zerowym, podczas gdy zrobiły to dla innych terminów. Stąd (d) i (e) nie dodają istotnych informacji do regresji, a wyjaśnione odchylenie sprowadza się do (a) (b) (c)?

Wszelkie porady będą mile widziane i powodzenia w twoich badaniach.

użytkownik45178
źródło

Odpowiedzi:

8

Artykuł opisujący ich działanie znajduje się tutaj .

Są to wartości p związane z testami Walda, że ​​cała funkcja s (.) = 0. Niskie wartości p wskazują na małe prawdopodobieństwo, że splajny tworzące funkcję są łącznie równe zero.

Skomplikowane jest to, że dotyczą one pseudoinwersu o niższej randze. Typowy test Walda tofa^(V.β)-1fa^. Od razu widać, że jest to test t w przypadku zmiennej zmiennej (tj. Nie macierzy, ale beta i wariancja). Daje to naprawdę niską moc w przypadku karanych splajnów, ponieważ te współczynniki są karane. Pseudoinwersja ranga-r odpowiada za to. Artykuł jest naprawdę dość gęsty, ale kiedy uzyskasz ogólną istotę - poprawa mocy testu poprzez uwzględnienie EDF zamiast rangi matrycy - staje się możliwe przestrzeganie formalizmu.

użytkownik_ogólny
źródło