Rozumiem, że oznacza to, że model źle prognozuje poszczególne punkty danych, ale ustanowił silny trend (np. Y rośnie, gdy x
Rozumiem, że oznacza to, że model źle prognozuje poszczególne punkty danych, ale ustanowił silny trend (np. Y rośnie, gdy x
Powiedzmy, że mamy wejściowe (predyktor) i wyjściowe (odpowiedź) punkty danych A, B, C, D, E i chcemy dopasować linię przez te punkty. Jest to prosty problem do zilustrowania pytania, ale można go również rozszerzyć na większe wymiary. Opis problemu Bieżące najlepsze dopasowanie lub hipoteza...
Ostatnio byłem zainteresowany wdrożeniem modelu regresji beta, dla wyniku, który jest proporcjonalny. Zauważ, że wynik ten nie mieści się w kontekście dwumianowym, ponieważ w tym kontekście nie ma sensownego pojęcia dyskretnego „sukcesu”. W rzeczywistości wynik jest faktycznie czasem trwania;...
Mam pewne dane, które pasują do z grubsza liniowej linii: Kiedy wykonuję regresję liniową tych wartości, otrzymuję równanie liniowe: y= 0,997 x - 0,0136y=0,997x-0,0136y = 0.997x-0.0136 W idealnym świecie równanie powinno wynosić .y= xy=xy = x Oczywiście moje wartości liniowe są zbliżone do...
Pytanie jest proste: czy właściwe jest stosowanie regresji liniowej, gdy Y jest ograniczone i dyskretne (np. Wynik testu 1 ~ 100, niektóre predefiniowane rangi 1 ~ 17)? Czy w takim przypadku „regresja liniowa nie jest dobra”, czy też jest całkowicie
Mam regresję wielowymiarową, która obejmuje interakcje. Na przykład, aby uzyskać oszacowanie efektu leczenia dla najbiedniejszego kwintylu, muszę dodać współczynniki z regresora leczenia do współczynnika ze zmiennej interakcji (która oddziałuje na leczenie i kwintyl 1). Jak dodając dwa...
Jednym z założeń regresji logistycznej jest liniowość logitu. Po uruchomieniu modelu testuję nieliniowość za pomocą testu Box-Tidwell. Jeden z moich ciągłych predyktorów (X) dał wynik dodatni pod kątem nieliniowości. Co mam teraz zrobić? Ponieważ jest to naruszenie założeń, muszę pozbyć się...
Jakie są zalety i wady korzystania z LARS [1] w porównaniu ze stosowaniem opadania współrzędnych w celu dopasowania regresji liniowej regulowanej przez L1? Interesują mnie głównie aspekty wydajności (moje problemy występują zwykle Nw setkach tysięcy i p<20). Jednak wszelkie inne spostrzeżenia...
Dopasowuję krokową regresję logistyczną dla zestawu danych w SPSS. W procedurze dopasowuję mój model do losowego podzbioru, który jest ok. 60% całej próby, co stanowi około 330 przypadków. Interesujące jest dla mnie to, że za każdym razem, gdy ponownie próbkuję moje dane, pojawiają się różne...
Chciałbym uzyskać współczynniki dla problemu LASSO | | Y- Xβ| | +λ | | β| |1.||Y−Xβ||+λ||β||1.||Y-X\beta||+\lambda ||\beta||_1. Problem polega na tym, że funkcje glmnet i lars dają różne odpowiedzi. Dla funkcji glmnet proszę o współczynniki λ / | | Y| |λ/||Y||\lambda/||Y||zamiast po prostu...
Szukam metod, które można wykorzystać do oszacowania modelu błędu pomiaru „OLS”. x i = X i + e x , i Y i = α + β X iyi=Yi+ey,iyi=Yi+ey,iy_{i}=Y_{i}+e_{y,i} xi=Xi+ex,ixi=Xi+ex,ix_{i}=X_{i}+e_{x,i} Yi=α+βXiYi=α+βXiY_{i}=\alpha + \beta X_{i} Gdzie błędy są niezależne normalne z nieznanymi...
Widzę model regresji, który regresuje zwroty z indeksu giełdowego z opóźnieniem (12 miesięcy) Rentowność z tego samego indeksu giełdowego, marżę kredytową (różnica między średnią miesięczną wolną od ryzyka obligacją a obligacją korporacyjną) plony), wskaźnik inflacji r / r oraz wskaźnik produkcji...
Mam pytanie dotyczące koncepcji „podstawowych statystyk”. Jako student chciałbym wiedzieć, czy myślę o tym całkowicie źle i dlaczego, jeśli tak: Powiedzmy, że próbuję hipotetycznie spojrzeć na związek między „problemami zarządzania gniewem” i powiedzieć rozwód (tak / nie) w regresji logistycznej...
Doradzałem studentowi badawczemu z konkretnym problemem i chciałem uzyskać wkład innych na tej stronie. Kontekst: Badacz miał trzy typy zmiennych predykcyjnych. Każdy typ zawiera inną liczbę zmiennych predykcyjnych. Każdy predyktor był zmienną ciągłą: Społecznościowe: S1, S2, S3, S4 (tj. Cztery...
Jaka jest różnica między endogennością a nieobserwowaną heterogenicznością? Wiem, że endogenność pochodzi na przykład z pominiętych zmiennych? Ale o ile rozumiem, nieobserwowana heterogeniczność powoduje ten sam problem. Ale gdzie dokładnie leży różnica między tymi dwoma...
Załóżmy, że mam dwa zestawy danych z n obserwacjami par danych zmiennej niezależnej x i zmiennej zależnej y . Załóżmy dalej, że chcę wygenerować rozkład nachyleń regresji dla każdego zestawu danych, ładując obserwacje (z zamianą) N razy i obliczając regresję y = a + bxza każdym razem. Jak porównać...
Mamy 100 uczestników w dwóch grupach, n = 50n=50n=50w każdej grupie. Zastosowaliśmy ocenę zdolności podstawowego funkcjonowania w 4 punktach czasowych. Ocena składa się z 6 pytań, każde z wynikiem 0–5. Nie mamy indywidualnych wyników dla każdego pytania, tylko łączne wyniki z zakresu od 0 do 30....
Próbuję po prostu zrozumieć, jaki jest związek między normalną regresją wielokrotną / prostą a regresją wielokrotną / prostą, gdy zmienne są różnicowane. Na przykład analizuję związek między saldem depozytów ( ) a stopami rynkowymi ( ) Jeśli uruchomię prostą regresję liniową, korelacja jest ujemna...
Przepraszam, jeśli to nowe pytanie; Po raz pierwszy próbuję nauczyć się statystyki. Myślę, że mam podstawową procedurę, ale staram się ją wykonać z R. Próbuję więc ocenić znaczenie współczynników regresji w wielokrotnej regresji liniowej formy y^= Xβ^y^=Xβ^ \hat y = X \hat \beta Myślę, że...
Jestem zainteresowany wykorzystaniem regresji kwantylowej dla niektórych moich modeli, ale chciałbym uzyskać wyjaśnienia na temat tego, co mogę osiągnąć przy użyciu tej metodologii. Rozumiem mogę uzyskać bardziej solidną analizę IV / DV relacji , zwłaszcza w obliczu skrajnych i...