Ok, więc trochę mgliste w kilku sprawach, każda pomoc byłaby mile widziana. Rozumiem, że model regresji liniowej jest przewidziany przez oczekiwanie warunkowe
- Czy zakładamy, że zarówno jak i są zmiennymi losowymi o nieznanym rozkładzie prawdopodobieństwa? Rozumiałem, że tylko reszty i szacowane współczynniki beta są zmiennymi losowymi. jeśli tak, jako przykład, jeśli otyłość i wiek, jeśli weźmiemy warunkowe oczekiwanie , jaka jest oczekiwana wartość otyłości, jeśli osoba ma lat w próbie, czy wystarczy wziąć średnią (średnią arytmetyczną) y dla tych obserwacji, w których ? jednak czy oczekiwana wartość nie oznacza, że musimy ją pomnożyć przez prawdopodobieństwo wystąpienia? ale jak w tym sensie znaleźć prawdopodobieństwo-wartość zmienna występująca, jeśli reprezentuje coś takiego jak wiek?
- Gdyby reprezentował kurs walutowy, czy byłby to klasyfikowany jako przypadkowy? jak, u licha, znalazłbyś oczekiwaną wartość tego, nie wiedząc jednak o prawdopodobieństwie? lub czy oczekiwana wartość byłaby równa średniej w limicie.
- Jeśli nie założymy, że zmienne zależne same w sobie są zmiennymi losowymi, ponieważ nie odwracamy prawdopodobieństwa, co zakładamy, że są? właśnie ustalone wartości czy coś? ale jeśli tak jest, w jaki sposób możemy zacząć od zmiennej nieprzypadkowej? co sądzimy o rozkładzie zmiennych niezależnych?
Przepraszamy, jeśli coś nie ma sensu lub jest oczywiste dla każdego.
regression
William Carulli
źródło
źródło
Odpowiedzi:
W modelu prawdopodobieństwa leżącym u podstaw regresji liniowej X i Y są zmiennymi losowymi.
Zgadza się. Zasadniczo nie można oczekiwać, że będziesz mieć wystarczającą ilość danych przy każdej określonej wartości X, lub może to być niemożliwe, jeśli X może przyjmować ciągły zakres wartości. Ale koncepcyjnie jest to poprawne.
Jest to różnica między bezwarunkowym oczekiwaniem a warunkowym oczekiwaniem E [ Y ∣ X = x ] . Relacja między nimi jestE[Y] E[Y∣X=x]
które jest prawem całkowitego oczekiwania.
Zasadniczo nie stosuje się regresji liniowej. Ponieważ próbujemy ustalić , nie musimy znać P r [ X = x ] .E[Y∣X] Pr[X=x]
My nie zakładamy, że Y jest zmienną losową. Jednym ze sposobów myślenia o regresji liniowej jest model prawdopodobieństwa dlaY
Co oznacza, że gdy poznasz wartość X, losowa zmienność Y jest ograniczona do sumy .N(0,σ)
źródło
Będzie wiele odpowiedzi na to pytanie, ale nadal chcę je dodać, ponieważ podałeś kilka interesujących kwestii. Dla uproszczenia rozważam tylko prosty model liniowy.
Podstawowym równaniem prostej analizy regresji liniowej jest: Równanie to znaczy, że przeciętna wartość Y jest liniowa od wartości X . Można również zauważyć, że oczekiwana wartość jest również liniowa dla parametrów β 0 i β 1 , dlatego model nazywany jest liniowym. To podstawowe równanie można przepisać jako: Y = β 0 + β 1 X + ϵ , gdzie ϵ jest zmienną losową ze średnią zerową: E ( ϵ ) =
Warunkowy średni estymator najmniejszych kwadratów ma wyrażenie równe opisanemu, jeśli twój model traktuje różne wagi jako poziomy pojedynczego czynnika. Modele te znane są również jako jednokierunkowa ANOVA, co jest szczególnym przypadkiem (nie prostego) modelu liniowego.
źródło