W literaturze statystycznej istnieje wiele odniesień do „ danych funkcjonalnych ” (tj. Danych, które są krzywymi), a równolegle do „ danych wielowymiarowych ” (tj. Gdy dane są wektorami wielowymiarowymi). Moje pytanie dotyczy różnicy między tymi dwoma typami danych.
Mówiąc o zastosowanych metodologiach statystycznych, które mają zastosowanie w przypadku 1, można rozumieć jako przeformułowanie metodologii z przypadku 2 poprzez rzut na skończoną podprzestrzeń wymiarową przestrzeni funkcji, mogą to być wielomiany, splajny, falka, Fouriera, ... ... i przełoży problem funkcjonalny na skończony wymiarowy problem wektorowy (ponieważ w stosowanej matematyce wszystko staje się w pewnym momencie skończone).
Moje pytanie brzmi: czy możemy powiedzieć, że jakakolwiek procedura statystyczna, która ma zastosowanie do danych funkcjonalnych, może być również stosowana (prawie bezpośrednio) do danych o dużych wymiarach i że każda procedura dedykowana do danych o dużych wymiarach może być (prawie bezpośrednio) stosowana do danych funkcjonalnych?
Jeśli odpowiedź brzmi „nie”, czy możesz to zilustrować?
EDYCJA / AKTUALIZACJA za pomocą odpowiedzi Simona Byrne'a:
- „gładkość” jest stosowana jako strukturalne założenie w funkcjonalnej analizie danych.
Z drugiej strony odwrotna transformata Fouriera i odwrotna transformata falkowa przekształcają rzadkość w gładkość, a gładkość jest przekształcana w rzadkość przez falkę i transformatę Fouriera. Czy to sprawia, że krytyczna różnica wspomniana przez Simona nie jest tak istotna?
źródło
Odpowiedzi:
Dane funkcjonalne często dotyczą różnych pytań. Czytam Analiza danych funkcjonalnych, Ramseya i Silvermana, i spędzają oni wiele czasu na omawianiu rejestracji krzywej, wypaczaniu funkcji i szacowaniu pochodnych krzywych. Są to zwykle inne pytania niż pytania osób zainteresowanych badaniem danych wielowymiarowych.
źródło
Tak i nie. Na poziomie teoretycznym oba przypadki mogą korzystać z podobnych technik i ram (doskonałym przykładem jest regresja procesu Gaussa).
Krytyczną różnicą są założenia zastosowane w celu zapobiegania nadmiernemu dopasowaniu (regularyzacji):
W przypadku funkcjonalnym zwykle przyjmuje się pewne założenie gładkości, innymi słowy wartości występujące blisko siebie powinny być w pewien systematyczny sposób podobne. Prowadzi to do zastosowania technik takich jak splajny, lessy, procesy gaussowskie itp.
W przypadku wielowymiarowym zwykle zakłada się rzadkość: to znaczy, tylko podzbiór wymiarów będzie miał jakikolwiek sygnał. Prowadzi to do technik mających na celu identyfikację tych wymiarów (Lasso, LARS, priory typu slab-and-spike itp.)
AKTUALIZACJA:
Tak naprawdę nie myślałem o metodach wavelet / Fouriera, ale tak, techniki progowe stosowane w takich metodach mają na celu rzadkość w rzutowanej przestrzeni. I odwrotnie, niektóre techniki wielowymiarowe zakładają rzut na wielowymiarowy rozmaitość (np. Analiza głównego składnika), co jest rodzajem założenia gładkości.
źródło