Wygląda na to, że możesz użyć kodowania dla jednej zmiennej jakościowej, ale mam dwie zmienne jakościowe i jedną zmienną predykcyjną ciągłą. Czy mogę użyć do tego wielokrotnej regresji w SPSS, a jeśli tak, to w jaki sposób?
Wygląda na to, że możesz użyć kodowania dla jednej zmiennej jakościowej, ale mam dwie zmienne jakościowe i jedną zmienną predykcyjną ciągłą. Czy mogę użyć do tego wielokrotnej regresji w SPSS, a jeśli tak, to w jaki sposób?
Chciałbym zadać to pytanie w dwóch częściach. Oba dotyczą uogólnionego modelu liniowego, ale pierwszy dotyczy wyboru modelu, a drugi dotyczy regularyzacji. Tło: Używam modeli GLM (liniowych, logistycznych, regresji gamma) zarówno do prognozowania, jak i do opisu. Kiedy odnoszę się do „ normalnych...
Powiedzmy, że jest funkcją liniową i manekina d . Moja hipoteza jest taka, że d sama jest jak hedonistyczny indeks wektora innych zmiennych, Z . Mam poparcie dla tego podejścia w MANOVA z Z (tj z_1 , z_2 , ..., z_n ) na d . Czy istnieje sposób przetestowania równoważności tych dwóch...
Cały sens AIC lub innego kryterium informacyjnego polega na tym, że im mniej, tym lepiej. Więc jeśli mam dwa modele M1: y = a0 + XA + e i M2: y = b0 + ZB + u, a jeśli AIC pierwszego (A1) jest mniejszy niż drugiego (A2), to M1 ma lepsze dopasowanie z punktu widzenia teorii informacji. Ale czy...
Z ekonometrii , autor: Fumio Hayashi (rozdział 1): Bezwarunkowa homoskedastyczność: Drugi moment wyrażenia błędu E (εᵢ²) jest stały we wszystkich obserwacjach Forma funkcjonalna E (εᵢ² | xi) jest stała we wszystkich obserwacjach Warunkowa homoskedastyczność: Zniesiono ograniczenie, że drugi...
Obecnie używam analizy głównych komponentów, aby wybrać zmienne do zastosowania w modelowaniu. W tej chwili wykonuję pomiary A, B i C w swoich eksperymentach - tak naprawdę chcę wiedzieć: czy mogę wykonać mniej pomiarów i przestać rejestrować C i lub B, aby zaoszczędzić czas i wysiłek? Uważam, że...
Czy ktoś zna znaczenie średnich efektów cząstkowych? Co to dokładnie jest i jak mogę je obliczyć? Oto odniesienie, które może
Jestem bardzo zainteresowany potencjałem analizy statystycznej do symulacji / prognozowania / szacowania funkcji itp. Jednak niewiele wiem na ten temat, a moja wiedza matematyczna jest wciąż dość ograniczona - jestem młodym studentem inżynierii oprogramowania. Szukam książki, w której zacznę od...
Zastanawiam się, jakie są różnice między testem t a ANOVA w regresji liniowej? Czy test t sprawdza, czy którykolwiek z nachyleń i przecięcia ma średnią zero, podczas gdy ANOVA sprawdza, czy wszystkie nachylenia mają średnią zero? Czy to jedyna różnica między nimi? W prostej regresji liniowej, tj....
Czy istnieje metoda zrozumienia, czy dwie linie są (mniej więcej) równoległe? Mam dwie linie wygenerowane z regresji liniowych i chciałbym zrozumieć, czy są one równoległe. Innymi słowy, chciałbym uzyskać inne nachylenie tych dwóch linii. Czy istnieje funkcja R do obliczenia tego? EDYCJA: ... i...
Jeśli Hosmer-Lemeshow wskazuje na brak dopasowania, ale AIC jest najniższy spośród wszystkich modeli ... czy nadal powinieneś używać tego modelu? Jeśli usunę zmienną, statystyka Hosmera-Lemeshowa nie będzie znacząca (co oznacza, że nie ma rażącego braku dopasowania). Ale AIC wzrasta. Edycja :...
Próbuję zrozumieć cross-validation dla porządkowej regresji logistycznej. Celem gry jest sprawdzenie modelu zastosowanego w analizie ... Najpierw buduję zestaw danych zabawek: set.seed(1) N <- 10000 # predictors x1 <- runif(N) x2 <- runif(N) x3 <- runif(N) # coeffs in the model a...
Jestem bardzo nowy w częściowych najmniejszych kwadratach (PLS) i staram się zrozumieć wynik funkcji R plsr()w plspakiecie. Symulujmy dane i uruchom PLS: library(pls) n <- 50 x1 <- rnorm(n); xx1 <- scale(x1) x2 <- rnorm(n); xx2 <- scale(x2) y <- x1 + x2 + rnorm(n,0,0.1); yy...
Oto lista współczynników regresji logistycznej (pierwszy to przechwycenie) -1059.61966694592 -1.23890500515482 -8.57185269220438 -7.50413155570413 0 1.03152408392552 1.19874787949191 -4.88083274930613 -5.77172565873336 -1.00610998453393 Dziwne wydaje mi się, że przecięcie jest tak niskie i...
Tradycyjne podejście do wyboru zmiennych polega na znalezieniu zmiennych, które najbardziej przyczyniają się do przewidywania nowej odpowiedzi. Ostatnio dowiedziałem się o alternatywie. W modelowaniu zmiennych, które określają efekt leczenia - jak na przykład w badaniu klinicznym farmaceutyka -...
Biorąc pod uwagę następujące dwa szeregi czasowe ( x , y ; patrz poniżej), jaka jest najlepsza metoda modelowania związku między długoterminowymi trendami w tych danych? Oba szeregi czasowe mają znaczące testy Durbina-Watsona, gdy są modelowane jako funkcja czasu i żadne z nich nie jest...
W poprzednim poście zastanawiałem się, jak radzić sobie z wynikami EQ-5D . Ostatnio natknąłem się na logistyczną regresję kwantyli zaproponowaną przez Bottai i McKeown, która wprowadza elegancki sposób radzenia sobie z ograniczonymi rezultatami. Formuła jest prosta: l o gi t ( y) = l o g( y- ym i...
Czytając podręcznik regresji napotkałem następujący akapit: Oszacowanie najmniejszych kwadratów wektora współczynników regresji liniowej ( ) toββ\beta β^= ( XtX)- 1Xtyβ^=(XtX)-1Xty \hat{\beta} = (X^{t}X)^{-1}{X^t}y która, widziana jako funkcja danych (z uwzględnieniem predyktorów X jako...
Wykonuję wielokrotną regresję liniową. Mam 21 obserwacji i 5 zmiennych. Moim celem jest po prostu znalezienie relacji między zmiennymi Czy moje dane są wystarczające do przeprowadzenia wielokrotnej regresji? Wynik testu t ujawnił, że 3 z moich zmiennych nie są znaczące. Czy muszę ponownie wykonać...
Uwaga: to pytanie jest repost, ponieważ moje poprzednie pytanie musiało zostać usunięte ze względów prawnych. Porównując PROC MIXED z SAS z funkcją lmez nlmepakietu w R, natknąłem się na pewne dość mylące różnice. Mówiąc dokładniej, stopnie swobody w różnych testach różnią się między PROC MIXEDi...