Wiem, że znormalizowane pozostałości Pearson uzyskuje się w tradycyjny probabilistyczny sposób:
i Pozostałości dewiacji są uzyskiwane w bardziej statystyczny sposób (udział każdego punktu w prawdopodobieństwie):
gdzie = 1 jeśli = 1 oraz = -1 jeśli = 0.
Czy możesz mi intuicyjnie wyjaśnić, jak interpretować wzór na resztki odchyleń?
Co więcej, jeśli chcę wybrać jeden, który jest bardziej odpowiedni i dlaczego?
BTW, niektóre referencje twierdzą, że otrzymujemy wartości odchylenia na podstawie tego terminu
gdzie jest wspomniany powyżej.
Odpowiedzi:
Regresja logistyczna dąży do maksymalizacji funkcji prawdopodobieństwa logarytmu
gdzie jest przewidywane prawdopodobieństwo przypadku i jest Y = 1 ; k oznacza liczbę przypadków obserwowano Y = 1 , a R jest liczbą (reszta) przypadkach obserwowano Y = 0 .Pi Y^=1 k Y=1 r Y=0
To wyrażenie jest równe
ponieważ rezydualne odchylenie przypadku jest zdefiniowane jako:
Zatem binarna regresja logistyczna dąży bezpośrednio do zminimalizowania sumy kwadratów odchyleń odchylenia. Resztki dewiacji są implikowane w algorytmie ML regresji.
źródło