Kontekst:
Z pytania dotyczącego wymiany stosów matematycznych (czy mogę zbudować program) , ktoś ma zestaw punktów i chce dopasować do niego krzywą, liniową, wykładniczą lub logarytmiczną. Zwykłą metodą jest rozpoczęcie od wybrania jednego z nich (który określa model), a następnie wykonanie obliczeń statystycznych.
Ale tak naprawdę potrzebne jest znalezienie „najlepszej” krzywej z liniowej, wykładniczej lub logarytmicznej.
Pozornie można wypróbować wszystkie trzy i wybrać najlepiej dopasowaną krzywą z trzech zgodnie z najlepszym współczynnikiem korelacji.
Ale jakoś czuję, że to nie jest całkiem koszerne. Ogólnie przyjętą metodą jest najpierw wybranie modelu, jednej z tych trzech (lub innej funkcji łącza), a następnie na podstawie danych obliczyć współczynniki. I zbieranie po fakcie to, co najlepsze, to zbieranie wiśni. Ale dla mnie, czy określasz funkcję lub współczynniki na podstawie danych, to wciąż jest to samo, twoja procedura odkrywa najlepszą ... rzecz (powiedzmy, która funkcja jest również -wykryj inny współczynnik).
Pytania:
- Czy właściwe jest wybranie najlepszego modelu spośród modeli liniowych, wykładniczych i logarytmicznych na podstawie porównania statystyk dopasowania?
- Jeśli tak, jaki jest najbardziej odpowiedni sposób to zrobić?
- Jeśli regresja pomaga znaleźć parametry (współczynniki) w funkcji, to dlaczego nie może istnieć dyskretny parametr do wyboru, z której z trzech rodzin krzywych najlepiej pochodzić?
Odpowiedzi:
źródło
To pytanie jest ważne w bardzo różnych domenach.
Najlepszy model to taki, który może przewidzieć punkty danych, które nie zostały użyte podczas estymacji parametru. Idealnie byłoby obliczyć parametry modelu z podzestawem zestawu danych i ocenić wydajność dopasowania w innym zestawie danych. Jeśli jesteś zainteresowany szczegółami, wyszukaj za pomocą „cross-validation”.
Tak więc odpowiedź na pierwsze pytanie brzmi „nie”. Nie możesz po prostu wybrać najlepiej dopasowanego modelu. Obraz, w którym dopasowujesz wielomian o stopniu N do N punktów danych. Będzie to idealne dopasowanie, ponieważ cały model dokładnie przekaże wszystkie punkty danych. Jednak ten model nie uogólnia na nowe dane.
O ile mogę powiedzieć, najodpowiedniejszym sposobem jest obliczenie, ile twój model może uogólnić na inne zbiory danych przy użyciu mierników, które karzą jednocześnie amplitudę reszt i liczbę parametrów w twoim modelu. AIC i BIC to niektóre z tych wskaźników, o których wiem.
źródło
Ponieważ wiele osób rutynowo sprawdza dopasowanie różnych krzywych do swoich danych, nie wiem, skąd pochodzą Twoje rezerwacje. To prawda, że istnieje kwadrat, który zawsze będzie pasował co najmniej tak samo, jak liniowy, i sześcienny, co najmniej tak samo jak kwadrat, więc istnieją sposoby na przetestowanie istotności statystycznej dodania takiego nieliniowego terminu, a tym samym unikaj niepotrzebnej złożoności. Ale podstawową praktyką testowania wielu różnych form relacji jest po prostu dobra praktyka. W rzeczywistości można zacząć od bardzo elastycznej regresji lessowej, aby zobaczyć, jaki rodzaj krzywej jest najbardziej prawdopodobny do dopasowania.
źródło
Naprawdę musisz znaleźć równowagę między nauką / teorią, która prowadzi do danych, a tym, co one mówią. Jak powiedzieli inni, jeśli pozwolisz sobie dopasować się do jakiejkolwiek możliwej transformacji (wielomianów dowolnego stopnia itp.), Skończy się to zbytnim dopasowaniem i otrzymaniem czegoś, co nie będzie przydatne.
Jednym ze sposobów przekonania się o tym jest symulacja. Wybierz jeden z modeli (liniowy, wykładniczy, log) i wygeneruj dane zgodne z tym modelem (z wyborem parametrów). Jeśli twoja warunkowa wariancja wartości y jest niewielka w stosunku do rozprzestrzeniania się zmiennej x, wówczas prosty wykres pokaże, który model został wybrany i czym jest „prawda”. Ale jeśli wybierzesz taki zestaw parametrów, że nie będzie to oczywiste na podstawie wykresów (prawdopodobnie w przypadku, gdy interesujące jest rozwiązanie analityczne), przeanalizuj każdy z 3 sposobów i sprawdź, który daje „najlepsze” dopasowanie. Oczekuję, że przekonasz się, że „najlepsze” dopasowanie często nie jest „prawdziwym” dopasowaniem.
Z drugiej strony czasami chcemy, aby dane mówiły nam tyle, ile to możliwe, i możemy nie mieć wiedzy naukowej / teorii, aby w pełni określić naturę relacji. Oryginalny artykuł Boxa i Coxa (JRSS B, t. 26, nr 2, 1964) omawia sposoby porównania kilku przekształceń zmiennej y, ich podany zestaw przekształceń ma charakter liniowy i logarytmiczny jako przypadki szczególne (ale nie wykładnicze) , ale nic w teorii papieru nie ogranicza się tylko do ich rodziny transformacji, tę samą metodologię można rozszerzyć o porównanie między 3 modelami, którymi jesteś zainteresowany.
źródło