Wyjaśnij krótko Co należy rozumieć przez interpolację. Jak wiąże się to z pojęciem regresji?
interpolacja to sztuka czytania między wierszami tabeli, a w matematyce elementarnej termin ten zwykle oznacza proces obliczania wartości pośrednich funkcji z zestawu danych lub tabelarycznych wartości tej funkcji.
Nie mogę udzielić odpowiedzi na drugie pytanie. Proszę pomóż
Odpowiedzi:
Główną różnicą między interpolacją a regresją jest definicja problemu, który rozwiązują.
Biorąc pod uwagę punktów danych, interpolując, szukasz funkcji, która ma jakąś predefiniowaną formę, która ma wartości w tych punktach dokładnie tak, jak określono. Oznacza to, że w danych parach ( x i , y i ) szukasz F w jakiejś predefiniowanej formie, która spełnia F ( x i ) = y i . Myślę, że najczęściej F.n (xi,yi) F F(xi)=yi F jest wybierane jako wielomianowe, wielowypustowe (wielomiany niskiego stopnia w odstępach między podanymi punktami).
Wykonując regresję, szukasz funkcji, która minimalizuje niektóre koszty, zwykle sumę kwadratów błędów. Nie potrzebujesz, aby funkcja miała dokładne wartości w danych punktach, po prostu chcesz mieć dobre przybliżenie. Ogólnie rzecz biorąc, znaleziona funkcja może nie spełniać F ( x i ) = y i dla dowolnego punktu danych, ale funkcja kosztu, tj. ∑ n i = 1 ( F ( x i ) - y i ) 2, będzie najmniejsza z możliwych wszystkich funkcji danej formy.F F(xi)=yi ∑ni=1(F(xi)−yi)2
Dobrym przykładem tego, dlaczego warto jedynie przybliżać zamiast interpolować, są ceny na giełdzie. Możesz wziąć ceny w niektórych ostatnich jednostkach czasu i spróbować interpolować je, aby uzyskać prognozę ceny w następnej jednostce czasu. Jest to raczej zły pomysł, ponieważ nie ma powodu, aby sądzić, że relacje między cenami można dokładnie wyrazić wielomianem. Ale regresja liniowa może załatwić sprawę, ponieważ ceny mogą mieć pewne „nachylenie”, a funkcja liniowa może być dobrym przybliżeniem, przynajmniej lokalnie (wskazówka: nie jest to takie łatwe, ale regresja jest zdecydowanie lepszym pomysłem niż interpolacja w tym przypadku ).k
źródło
Dwie poprzednie odpowiedzi wyjaśniły związek między interpolacją liniową a regresją liniową (lub nawet interpolacją ogólną i regresją wielomianową). Ale ważnym połączeniem jest to, że po dopasowaniu modelu regresji można go użyć do interpolacji między danymi punktami danych.
źródło
Mam nadzieję, że przyjdzie to dość szybko z prostym przykładem i wizualizacją.
Załóżmy, że masz następujące dane:
Możemy użyć regresji do modelowania Y jako odpowiedzi na X. Używając R:
lm(y ~ x)
Wyniki to przecięcie 5, a współczynnik dla x równy 1. Oznacza to, że dowolne Y można obliczyć dla danego X jako X + 5. Na zdjęciu można to zobaczyć w ten sposób:
Zauważ, że jeśli poszedłeś do osi X, gdziekolwiek wzdłuż niej i narysowałeś linię do dopasowanej linii, a następnie narysowałeś linię do osi Y, możesz uzyskać wartość, niezależnie od tego, czy podałem punkt wartości dla Y. Regresja wygładza się na obszarach bez danych poprzez oszacowanie podstawowej zależności.
źródło
podstawowa różnica b / w Interpolacja i regresja jest następująca: Interpolacja: załóżmy, że jest n punktów (np .: 10 punktów danych), w interpolacji dopasujemy krzywą przechodzącą przez wszystkie punkty danych (tj. tutaj 10 punktów danych) za pomocą stopień wielomianu (liczba punktów danych -1; tzn. tutaj jest to 9). gdzie, jak w regresji, nie wszystkie dane wskazują tylko ich zestaw potrzebny do dopasowania krzywej.
generalnie kolejność interpolacji i regresji będzie wynosić (1,2 lub 3), jeśli kolejność jest większa niż 3, więcej krzywych będzie widocznych na krzywej.
źródło
Regresja to proces znajdowania linii najlepszego dopasowania [1]. Interpolacja to proces polegający na użyciu linii najlepszego dopasowania do oszacowania wartości jednej zmiennej na podstawie wartości innej, pod warunkiem, że używana wartość mieści się w zakresie danych. Jeśli jest poza zakresem, użyłbyś ekstrapolacji [1].
[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html
źródło
Dzięki interpolacji lub dopasowaniu splajnu otrzymujemy dane liczbowe (interpolowany zakład ween każdej pary oryginalnych danych) o większym rozmiarze, które po wykreśleniu generują efekt gładkiej krzywej. W rzeczywistości między każdą parą oryginalnych danych dopasowywany jest inny wielomian, dlatego cała krzywa po interpolacji jest ciągłą krzywą po kawałku, przy czym każdy kawałek jest utworzony z innego wielomianu.
Jeśli ktoś szuka parametrycznej reprezentacji oryginalnych danych liczbowych, należy wykonać regresję. Możesz także spróbować dopasować wielomian wysokiego stopnia do splajnu. W każdym razie reprezentacja będzie miała charakter przybliżony. Możesz także sprawdzić, jak dokładne jest przybliżenie.
źródło
Zarówno regresja, jak i interpolacja służą do przewidywania wartości zmiennej (Y) dla danej wartości innej zmiennej (X). W regresji możemy przewidzieć dowolną wartość zmiennej zależnej (Y) dla danej wartości zmiennej niezależnej (X) Nawet jeśli jest ona poza zakresem wartości tabelarycznych, ale w przypadku interpolacji możemy przewidzieć tylko wartości zmiennej zależnej (Y) dla wartości zmiennej niezależnej (X), która mieści się w zakresie podanych wartości X.
źródło
Interpolacja to proces dopasowywania pewnej liczby punktów między x = ai x = b dokładnie do interpolującego wielomianu. Interpolacji można użyć do znalezienia przybliżonej wartości (lub brakującej wartości) y w dziedzinie x = [a, b] z większą dokładnością niż technika regresji.
Z drugiej strony regresja jest procesem dopasowywania pewnej liczby punktów do krzywej przechodzącej przez punkty lub w ich pobliżu z minimalnym błędem do kwadratu. Regresja nie przybliży wartości y w dziedzinie x = [a, b] tak dokładnej jak interpolacja, jednak regresja zapewnia lepsze przewidywania niż interpolacja dla wartości y w dziedzinie między x = (- nieskończoność, a) i x = ( b, + nieskończoność).
Podsumowując, interpolacja zapewnia lepszą dokładność wartości y w dziedzinie o znanym zakresie x, podczas gdy regresja zapewnia lepsze przewidywania y w dziedzinie poniżej i poza znanym zakresem x.
źródło