Próbuję zrozumieć, jak działają funkcje wpływu. Czy ktoś mógłby wyjaśnić w kontekście prostej regresji OLS yi=α+β⋅xi+εiyi=α+β⋅xi+εi\begin{equation} y_i = \alpha + \beta \cdot x_i + \varepsilon_i \end{equation} gdzie chcę funkcję wpływu dla
Próbuję zrozumieć, jak działają funkcje wpływu. Czy ktoś mógłby wyjaśnić w kontekście prostej regresji OLS yi=α+β⋅xi+εiyi=α+β⋅xi+εi\begin{equation} y_i = \alpha + \beta \cdot x_i + \varepsilon_i \end{equation} gdzie chcę funkcję wpływu dla
Czy istnieje jakiś powód tego, co mogę wymyślić, aby przekształcić dane pierwiastkiem kwadratowym? Chodzi mi o to, że zawsze obserwuję wzrost R ^ 2. Ale to prawdopodobnie tylko z powodu centrowania danych! Każda myśl jest
Byłbym zainteresowany znalezieniem sposobów na R efektywnego aktualizowania modelu liniowego po dodaniu obserwacji lub predyktora. biglm ma możliwość aktualizacji podczas dodawania obserwacji, ale moje dane są na tyle małe, że mieszczą się w pamięci (chociaż mam wiele instancji do aktualizacji)....
Powiedzmy, że mam N obserwacji, być może wiele czynników, i powtarzam każdą obserwację dwa razy (lub M razy), jak regresja na tym nowym zestawie wielkości NM porównałaby się z regresją na samych oryginalnych
Pracuję z zestawem danych o wartości N około 200 000. W regresjach widzę bardzo małe wartości istotności << 0,001 związane z bardzo małymi wielkościami efektów, np. R = 0,028. Chciałbym wiedzieć, czy istnieje zasadniczy sposób decydowania o odpowiednim progu istotności w odniesieniu do...
Zastanawiam się, dlaczego metody wyboru modeli LASSO i LARS są tak popularne, mimo że są to po prostu warianty stopniowego wybierania do przodu (a zatem cierpią na zależność od ścieżki)? Podobnie, dlaczego metody Ogólnego do Specyficznego (GETS) wyboru modelu są w większości ignorowane, nawet...
Mam na myśli skorygowane wzory R-kwadrat zaproponowane przez: Ezekiel (1930), który moim zdaniem jest obecnie używany w SPSS. R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Olkin and Pratt (1958)...
Jestem zaznajomiony z wykorzystaniem wielu regresji liniowych do tworzenia modeli różnych zmiennych. Byłem jednak ciekawy, czy testy regresji są kiedykolwiek wykorzystywane do wykonywania podstawowych testów hipotez. Jeśli tak, to jak wyglądałyby te scenariusze /
Korzystam z rlm w pakiecie R MASS do regresji wielowymiarowego modelu liniowego. Działa dobrze dla wielu próbek, ale otrzymuję quasi-zerowe współczynniki dla konkretnego modelu: Call: rlm(formula = Y ~ X1 + X2 + X3 + X4, data = mymodel, maxit = 50, na.action = na.omit) Residuals: Min 1Q Median 3Q...
Czy istnieje jakaś standardowa procedura (taka, że można ją przytoczyć jako odniesienie) do wybierania podzbioru punktów danych z większej puli o największej korelacji (tylko w dwóch wymiarach)? Załóżmy na przykład, że masz 100 punktów danych. Potrzebujesz podzbioru 40 punktów o najsilniejszej...
W ramach zadania musiałem dopasować model do dwóch zmiennych predykcyjnych. Następnie musiałem narysować wykres reszt modelu w oparciu o jeden z zawartych predyktorów i na tej podstawie dokonać zmian. Na wykresie pokazano trend krzywoliniowy, dlatego włączyłem kwadratowy termin dla tego predyktora....
Niedawno przyszedł do mnie klient, aby przeprowadzić analizę ładowania początkowego, ponieważ recenzent FDA stwierdził, że ich regresja błędów w zmiennych była nieprawidłowa, ponieważ podczas łączenia danych z witryn analiza obejmuje łączenie danych z trzech witryn, w których dwie witryny zawierały...
Próbuję użyć losowej regresji leśnej w scikits-learn. Problem polega na tym, że otrzymuję naprawdę wysoki błąd testu: train MSE, 4.64, test MSE: 252.25. Tak wyglądają moje dane: (niebieski: dane rzeczywiste, zielony: przewidywane): Używam 90% na szkolenie i 10% na test. Oto kod, którego używam...
Pakiet kreślarski R ggplot2 ma niesamowitą funkcję o nazwie stat_smooth do kreślenia linii regresji (lub krzywej) z powiązanym pasmem ufności. Trudno mi jednak dokładnie ustalić, w jaki sposób generowany jest ten przedział ufności, dla każdej linii regresji (lub „metody”). Jak mogę znaleźć te...
Obecnie pracuję nad modelem regresji, w którym jako zmienne niezależne mam tylko zmienne kategorialne / czynnikowe. Moja zmienna zależna to stosunek przekształcony logit. Całkiem łatwo jest uruchomić normalną regresję w R, ponieważ R automatycznie wie, jak zakodować manekiny, gdy tylko będą miały...
O ile rozumiem, wyjaśnia, jak dobrze model przewiduje obserwację. Skorygowane to takie, które uwzględnia więcej obserwacji (lub stopni swobody). Więc skorygowany lepiej przewiduje model? Dlaczego więc jest to mniej niż ? Wydaje się, że często powinno być
Dane, które posiadam, to wartość nachylenia regresji wynosząca y ~ czas, błąd standardowy, wartość n oraz wartość ap, dla określonego gatunku w dwóch różnych obszarach. Chcę sprawdzić, czy nachylenie regresji dla jednego obszaru znacznie różni się od nachylenia regresji dla drugiego obszaru - czy...
Jeśli mam rację, „klasyfikacja bez nadzoru” jest taka sama jak klastrowanie. Czy zatem istnieje „regresja bez nadzoru”?
Mam pewne dane, które są ograniczone od 0 do 1. Użyłem betaregpakietu w R, aby dopasować model regresji z ograniczonymi danymi jako zmienną zależną. Moje pytanie brzmi: jak interpretować współczynniki z
Z Wikipedii Obserwacje wpływowe to te obserwacje, które mają stosunkowo duży wpływ na przewidywania modelu regresji. Z Wikipedii Punkty dźwigni to ewentualne obserwacje dokonane przy ekstremalnych lub odległych wartościach zmiennych niezależnych, tak że brak obserwacji sąsiednich oznacza,...