Dlaczego problemy regresji nazywane są problemami „regresji”?

Odpowiedzi:

34

Termin „regresja” został użyty przez Francisa Galtona w jego artykule z 1886 r. „Regresja w kierunku mierności w dziedzicznej postawie”. O ile mi wiadomo, użył tego terminu jedynie w kontekście regresji w kierunku średniej . Termin ten został następnie przyjęty przez innych, aby uzyskać mniej więcej znaczenie, jakie ma dziś jako ogólna metoda statystyczna.

NRH
źródło
15
W tym artykule Galton wyprowadził przybliżenie liniowe, aby oszacować wzrost syna na podstawie wzrostu ojca. Jego równanie zostało dopasowane, aby ojciec o średnim wzroście miał syna o średnim wzroście, ale ojciec wyższy niż przeciętny miałby syna, który byłby wyższy od średniej o 2/3 w stosunku do jego ojca. To samo z krótszym niż średnia. Można to argumentować jako prostą regresję liniową (dzisiejsze znaczenie). I oczywiście dzisiaj regresja ma jeszcze szersze znaczenie: jest to dowolny model, który dokonuje ciągłych prognoz. Ciekawe, jak bardzo zmieniło się jego pierwotne użycie tego słowa.
rm999
3
Odpowiedź NRH jest prawidłowa. Poniższy link zawiera dużo więcej szczegółów na temat artykułu Francisa Galtona „Regresja w kierunku mierności w dziedzicznej postawie” blog.minitab.com/blog/statistics-and-quality-data-analysis/...
Gaurav Singhal
czy nadszedł czas, aby społeczność statystyczna zastąpiła słowo „regresja” bardziej prostym i jasnym terminem, może „predyktorem formalnym”?
Aviad Rozenhek
4

W przeciwieństwie do postępów, wracamy do średniej, tj. Cofania się. Stąd termin regresja! Myślę, że to coś, co zostało złapane i utknęło.

thethakuri
źródło
2

@ Mark White wspomniał już o linku, ale dla tych z was, którzy nie mają dużo czasu na sprawdzenie linku, oto dokładnie poprawnie wymieniona odpowiedź:

Geneza „regresji”

Termin „regresja” został wymyślony przez Francisa Galtona w XIX wieku w celu opisania zjawiska biologicznego. Zjawisko polegało na tym, że wysokości potomków wysokich przodków zmniejszają się w kierunku normalnej średniej (zjawisko znane również jako regresja w kierunku średniej) (Galton, przedruk 1989). Dla Galtona regresja miała tylko to znaczenie biologiczne (Galton, 1887) , ale jego praca została później rozszerzona przez Udny'ego Yule i Karla Pearsona na bardziej ogólny kontekst statystyczny (Pearson, 1903).

Referencje

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877). Typowe prawa dziedziczenia. III.Nature, 15 (389), 512-514.

Galton, F. (przedruk 1989). Pokrewieństwo i korelacja.Nauka statystyczna, 4 (2), 80–86.

Pearson, K. (1903). Prawo dziedziczności. Biometrika, 2 (2), 211–228.

PsychometStats
źródło
Regresja Galtona jak w „regresji do średniej” ma sens. jednak nie rozumiem użycia słowa „regresja” w znaczeniu „ucz się formuły od zmiennych niezależnych do zmiennej
wynikowej
1
Ogólnie rzecz biorąc oznacza to, że choć uczenie maszynowe wykorzystuje regresję, ale regresja nie jest techniką uczenia maszynowego, pomimo popularnych, błędnych opinii. Uczenie statystyczne jest odrębne od uczenia maszynowego, ale ogólnie rzecz biorąc, zwolennicy ML przyjmują metody statystyczne i błędnie opisują je jako ML, więc pojawiają się pozorne niezgodności. Regresja Galtona jest regresją; ma to związek z modelowaniem / prognozowaniem tendencji.
LSC
0

„Regresja” pochodzi od „regresu”, który z kolei pochodzi od łacińskiego „regressus” - powrotu (do czegoś).

W tym sensie regresja jest techniką, która pozwala „wrócić” z nieporządnych, trudnych do interpretacji danych do bardziej przejrzystego i bardziej znaczącego modelu. Jako fizyk podoba mi się ten pomysł, ponieważ fizycy postrzegają zjawiska naturalne jako wiele możliwych rezultatów stosunkowo prostego prawa naturalnego.

Innymi słowy, regresja słów wydaje się sugerować, że dane są tylko widocznym, namacalnym efektem „modelu statystycznego”. Innymi słowy, model jest na pierwszym miejscu, a Twoim pragnieniem jest wykorzystanie danych „do powrotu” do tego, co je stworzyło.

famargar
źródło
0

Jak wiem, słowo regressionw znaczeniu statystycznym to pomiar relacji między średnią wartością jednej zmiennej a odpowiadającymi jej wartościami innych zmiennych.

aan
źródło