Szukam metod, które można wykorzystać do oszacowania modelu błędu pomiaru „OLS”.
x i = X i + e x , i Y i = α + β X i
Gdzie błędy są niezależne normalne z nieznanymi wariancjami i . „Standardowy” OLS nie będzie w tym przypadku działał. σ 2 x
Wikipedia ma kilka nieprzyjemnych rozwiązań - dwie podane siły zmuszają cię do założenia, że albo „współczynnik wariancji” lub „ współczynnik niezawodności " jest znany, gdzie jest wariantem prawdziwego regresora . Nie jestem tym usatysfakcjonowany, ponieważ jak ktoś, kto nie zna różnic, może poznać ich stosunek? λ=σ 2 X σ 2 X Xi
W każdym razie, czy są jakieś inne rozwiązania oprócz tych dwóch, które nie wymagają ode mnie „znajomości” parametrów?
Rozwiązania tylko dla przechwytywania i nachylenia są w porządku.
źródło
Odpowiedzi:
Istnieje szereg możliwości opisanych przez JW Gillarda w historycznym przeglądzie regresji liniowej z błędami w obu zmiennych
Jeśli nie interesują Cię szczegóły ani powody, dla których wybierasz jedną metodę zamiast drugiej, po prostu wybierz najprostszą, czyli narysuj linię przez środek ciężkości z nachyleniem , tj. stosunek zaobserwowanych odchyleń standardowych (czyniąc znak nachylenia tym samym co znak kowariancji i ); jak zapewne możesz się poćwiczyć, daje to przecięcie osiβ = y r / y x x Y Y α = ˉ Y - β ˉ x .(x¯,y¯) β^=sy/sx x y y α^=y¯−β^x¯.
Zalety tego konkretnego podejścia są następujące
Nachylenie jest średnią geometryczną nachyleń dwóch zwykłych nachyleń regresji liniowej. Jest też, co można uzyskać, jeśli standaryzowany przez i obserwacje, narysował linię pod kątem 45 ° (lub 135 °, jeśli istnieje korelacja ujemna), a następnie de-standaryzowany linię. Można to również uznać za równoważne z domniemanym założeniem, że wariancje dwóch zestawów błędów są proporcjonalne do wariancji dwóch zestawów obserwacji; o ile mogę powiedzieć, twierdzisz, że nie wiesz, w którą stronę jest to źle.yx y
Oto kod R do zilustrowania: czerwona linia na wykresie to regresja OLS dla na , niebieska linia to regresja OLS dla na , a zielona linia to ta prosta metoda. Pamiętaj, że nachylenie powinno wynosić około 5.X X YY X X Y
źródło