Muszę rozwiązać skomplikowany problem regresji na dysku jednostki. Oryginalne pytanie przyciągnęło kilka interesujących komentarzy, ale niestety nie otrzymano odpowiedzi. Tymczasem nauczyłem się czegoś więcej na temat tego problemu, dlatego spróbuję podzielić oryginalny problem na podproblemy i zobaczę, czy tym razem będę miał więcej szczęścia.
Mam 40 czujników temperatury regularnie rozmieszczonych w wąskim pierścieniu wewnątrz dysku urządzenia:
Czujniki te rejestrują temperaturę w czasie. Ponieważ jednak zmiana czasu jest znacznie mniejsza niż zmiana przestrzeni, uprośćmy problem, ignorując zmienność czasu i załóżmy, że każdy czujnik daje mi tylko średnią czasową. Oznacza to, że mam 40 próbek (po jednej dla każdego czujnika) i nie mam powtarzanych próbek.
Chciałbym zbudować powierzchnię regresji z danych czujnika. Regresja ma dwa cele:
- Muszę oszacować średni profil temperatury radialnej . Dzięki regresji liniowej już oszacowałem powierzchnię, która jest powierzchnią średniej temperatury, dlatego muszę tylko zintegrować moją powierzchnię względem , prawda? Jeśli używam wielomianów do regresji, ten krok powinien być bułką z masłem.
- Muszę oszacować profil temperatury radialnej , tak że w każdej pozycji promieniowej .
Biorąc pod uwagę te dwa cele, jakiej techniki powinienem użyć do regresji na dysku jednostki? Oczywiście procesy regresji Gaussa są powszechnie stosowane do regresji przestrzennej. Jednak definicja dobrego jądra dla dysku jednostki nie jest trywialna, dlatego chciałbym zachować prostotę i używać wielomianów, chyba że uważasz, że jest to strategia przegrana. Czytałem o wielomianach Zernike . Wielomiany Zernike wydają się być odpowiednie do regresji na dysku jednostki, ponieważ są one okresowe w .
Po wybraniu modelu muszę wybrać procedurę szacowania. Ponieważ jest to problem regresji przestrzennej, błędy w różnych lokalizacjach powinny być skorelowane. Zwykłe najmniejsze kwadraty zakładają nieskorelowane błędy, więc myślę, że Uogólnione najmniejsze kwadraty byłyby bardziej odpowiednie. GLS wydaje się stosunkowo powszechną techniką statystyczną, biorąc pod uwagę, że istnieje gls
funkcja w standardowym rozkładzie R. Jednak nigdy nie korzystałem z GLS i mam wątpliwości. Na przykład, jak oszacować macierz kowariancji? Sprawdzony przykład, nawet z kilkoma czujnikami, byłby świetny.
PS Zdecydowałem się na wielomiany Zernike i GLS, ponieważ wydaje mi się to logiczne. Jednak nie jestem ekspertem i jeśli uważasz, że idę w złym kierunku, możesz zastosować zupełnie inne podejście.
źródło
Odpowiedzi:
Myślę, że jesteś na dobrej drodze, by myśleć o czymś takim, jak wielomiany Zernike. Jak zauważono w odpowiedzi jwimberly, są one przykładem systemu bazowych funkcji ortogonalnych na dysku. Nie jestem zaznajomiony z wielomianami Zernike, ale wiele innych rodzin funkcji ortogonalnych (w tym funkcji Bessela) powstaje naturalnie w klasycznej fizyce matematycznej jako funkcje własne dla niektórych równań różniczkowych cząstkowych (w momencie pisania tego tekstu nawet animacja na górze tego łącza pokazuje przykład wibrującej głowicy bębna).
Przychodzą mi na myśl dwa pytania. Po pierwsze, jeśli szukasz jedynie profilu promieniowego ( uśrednionego), to ile potrzebujesz ograniczenia w układzie przestrzennym? Po drugie, jakie rodzaje zmienności występują w danych czasoprzestrzennych?θ
Jeśli chodzi o pierwsze pytanie, przychodzą mi na myśl dwie obawy. Ze względu na współrzędne biegunowe obszar podparcia dla każdego czujnika ma tendencję do . Drugą kwestią byłaby możliwość aliasingu , zasadniczo niewłaściwego ustawienia czujników w stosunku do fazy wzoru (w celu zastosowania analogii Fouriera / Bessela). Zauważ, że aliasing będzie prawdopodobnie główną niepewnością w ograniczaniu temperatur szczytowych (tj. ).r T95
Jeśli chodzi o to drugie pytanie, zmienność danych mogłaby faktycznie pomóc w rozwiązaniu problemów z aliasingiem, zasadniczo umożliwiając uśrednienie każdego błędnego wyrównania dla różnych pomiarów. (Zakładając, że nie będzie systematycznego uprzedzenia ... ale byłoby to problemem dla każdej metody, bez np. Modelu fizycznego zapewniającego więcej informacji).
Tak więc jedną z możliwości byłoby zdefiniowanie przestrzennych funkcji ortogonalnych wyłącznie w lokalizacjach czujników. Te „empiryczne funkcje ortogonalne” można obliczyć za pomocą PCA na macierzy danych czasoprzestrzennych. (Być może można by użyć pewnego ważenia, aby uwzględnić zmienne obszary podparcia czujnika, ale biorąc pod uwagę jednolitą siatkę biegunową i cel średnich promieniowych, może to nie być wymagane).
Należy zauważyć, że jeśli dostępne są jakiekolwiek dane modelowania fizycznego dla „oczekiwanych” zmian temperatury, dostępne na gęstej przestrzenno-skroniowej siatce obliczeniowej, wówczas do tych danych można zastosować tę samą procedurę PCA w celu uzyskania funkcji ortogonalnych. (Zwykle nazywa się to „ prawidłowym rozkładem ortogonalnym ” w inżynierii, gdzie stosuje się go do redukcji modeli, np. Kosztowny model obliczeniowej dynamiki płynów można destylować do wykorzystania w dalszych działaniach projektowych.)
Ostatni komentarz, jeśli chcesz zważyć dane czujnika według obszaru podparcia (tj. Rozmiaru komórki polarnej), byłby to rodzaj kowariancji ukośnej w ramach GLS . (Dotyczyłoby to bardziej twojego problemu prognozowania, chociaż ważona PCA byłaby ściśle powiązana).
Mam nadzieję, że to pomoże!
Aktualizacja: W moim przekonaniu twój nowy schemat rozmieszczenia czujników znacznie zmienia rzeczy. Jeśli chcesz oszacować temperaturę we wnętrzu dysku, będziesz potrzebował znacznie więcej informacji niż po prostu „zestaw funkcji ortogonalnych na dysku jednostki”. Po prostu za mało informacji w danych czujnika.
Jeśli naprawdę chcesz oszacować przestrzenne wahania temperatury na dysku, jedynym rozsądnym sposobem, jaki widzę, byłoby potraktowanie problemu jako jednego z asymilacji danych . W tym przypadku musisz przynajmniej ograniczyć parametryczną formę rozkładu przestrzennego w oparciu o niektóre rozważania fizyki (mogą to być symulacje lub dane z pokrewnych danych w systemach o podobnej dynamice).
Nie znam konkretnej aplikacji, ale jeśli jest coś takiego jak to , to bym sobie wyobrazić, istnieje obszerna literatura inżynieria, że można czerpać, aby wybrać odpowiednie wcześniejsze ograniczenia. (Aby uzyskać szczegółową wiedzę na temat domeny, prawdopodobnie nie jest to najlepsza witryna StackExchange, o którą można zapytać).
źródło
Wielomiany podobne do Zernów nie brzmią jak zły wybór, ponieważ mają już gotową zależność i i ortogonalność. Jednakże, ponieważ studiujesz temperaturę, prawdopodobnie bardziej odpowiednim i lepiej znanym wyborem byłyby funkcje Bessela . Pojawiają się one w badaniu przepływu ciepła w obiektach cylindrycznych / układach współrzędnych, więc istnieje szansa, że są one fizycznie bardziej odpowiednie. N-ta funkcja Bessela dałaby zależność promieniową związaną z odpowiednią funkcją trygonometryczną dla zależności biegunowej; szczegóły znajdziesz w wielu podręcznikach fizyki i PDE.r θ
źródło