Regresja na dysku jednostkowym, zaczynając od próbek „równomiernie rozmieszczonych”

9

Muszę rozwiązać skomplikowany problem regresji na dysku jednostki. Oryginalne pytanie przyciągnęło kilka interesujących komentarzy, ale niestety nie otrzymano odpowiedzi. Tymczasem nauczyłem się czegoś więcej na temat tego problemu, dlatego spróbuję podzielić oryginalny problem na podproblemy i zobaczę, czy tym razem będę miał więcej szczęścia.

Mam 40 czujników temperatury regularnie rozmieszczonych w wąskim pierścieniu wewnątrz dysku urządzenia: wprowadź opis zdjęcia tutaj

Czujniki te rejestrują temperaturę w czasie. Ponieważ jednak zmiana czasu jest znacznie mniejsza niż zmiana przestrzeni, uprośćmy problem, ignorując zmienność czasu i załóżmy, że każdy czujnik daje mi tylko średnią czasową. Oznacza to, że mam 40 próbek (po jednej dla każdego czujnika) i nie mam powtarzanych próbek.

Chciałbym zbudować powierzchnię regresji z danych czujnika. Regresja ma dwa cele:T=f(ρ,θ)+ϵ

  1. Muszę oszacować średni profil temperatury radialnej . Dzięki regresji liniowej już oszacowałem powierzchnię, która jest powierzchnią średniej temperatury, dlatego muszę tylko zintegrować moją powierzchnię względem , prawda? Jeśli używam wielomianów do regresji, ten krok powinien być bułką z masłem.Tmean=g1(ρ)+ϵθ
  2. Muszę oszacować profil temperatury radialnej , tak że w każdej pozycji promieniowej .T95=g2(ρ)+ϵP(T(ρ)<T95(ρ))=.95

Biorąc pod uwagę te dwa cele, jakiej techniki powinienem użyć do regresji na dysku jednostki? Oczywiście procesy regresji Gaussa są powszechnie stosowane do regresji przestrzennej. Jednak definicja dobrego jądra dla dysku jednostki nie jest trywialna, dlatego chciałbym zachować prostotę i używać wielomianów, chyba że uważasz, że jest to strategia przegrana. Czytałem o wielomianach Zernike . Wielomiany Zernike wydają się być odpowiednie do regresji na dysku jednostki, ponieważ są one okresowe w .θ

Po wybraniu modelu muszę wybrać procedurę szacowania. Ponieważ jest to problem regresji przestrzennej, błędy w różnych lokalizacjach powinny być skorelowane. Zwykłe najmniejsze kwadraty zakładają nieskorelowane błędy, więc myślę, że Uogólnione najmniejsze kwadraty byłyby bardziej odpowiednie. GLS wydaje się stosunkowo powszechną techniką statystyczną, biorąc pod uwagę, że istnieje glsfunkcja w standardowym rozkładzie R. Jednak nigdy nie korzystałem z GLS i mam wątpliwości. Na przykład, jak oszacować macierz kowariancji? Sprawdzony przykład, nawet z kilkoma czujnikami, byłby świetny.

PS Zdecydowałem się na wielomiany Zernike i GLS, ponieważ wydaje mi się to logiczne. Jednak nie jestem ekspertem i jeśli uważasz, że idę w złym kierunku, możesz zastosować zupełnie inne podejście.

DeltaIV
źródło
Na rysunku pokazano silnik o idealnej symetrii promieniowej. Ale czy położenie osi odnosi się do jakiejś fizycznej właściwości silnika, czy też jest naprawdę arbitralne? W drugim przypadku zmienna będzie miała znaczenie tylko w odniesieniu do konkretnego silnika. θ
Yves

Odpowiedzi:

2

Myślę, że jesteś na dobrej drodze, by myśleć o czymś takim, jak wielomiany Zernike. Jak zauważono w odpowiedzi jwimberly, są one przykładem systemu bazowych funkcji ortogonalnych na dysku. Nie jestem zaznajomiony z wielomianami Zernike, ale wiele innych rodzin funkcji ortogonalnych (w tym funkcji Bessela) powstaje naturalnie w klasycznej fizyce matematycznej jako funkcje własne dla niektórych równań różniczkowych cząstkowych (w momencie pisania tego tekstu nawet animacja na górze tego łącza pokazuje przykład wibrującej głowicy bębna).

Przychodzą mi na myśl dwa pytania. Po pierwsze, jeśli szukasz jedynie profilu promieniowego ( uśrednionego), to ile potrzebujesz ograniczenia w układzie przestrzennym? Po drugie, jakie rodzaje zmienności występują w danych czasoprzestrzennych?θ

Jeśli chodzi o pierwsze pytanie, przychodzą mi na myśl dwie obawy. Ze względu na współrzędne biegunowe obszar podparcia dla każdego czujnika ma tendencję do . Drugą kwestią byłaby możliwość aliasingu , zasadniczo niewłaściwego ustawienia czujników w stosunku do fazy wzoru (w celu zastosowania analogii Fouriera / Bessela). Zauważ, że aliasing będzie prawdopodobnie główną niepewnością w ograniczaniu temperatur szczytowych (tj. ).rT95

Jeśli chodzi o to drugie pytanie, zmienność danych mogłaby faktycznie pomóc w rozwiązaniu problemów z aliasingiem, zasadniczo umożliwiając uśrednienie każdego błędnego wyrównania dla różnych pomiarów. (Zakładając, że nie będzie systematycznego uprzedzenia ... ale byłoby to problemem dla każdej metody, bez np. Modelu fizycznego zapewniającego więcej informacji).

Tak więc jedną z możliwości byłoby zdefiniowanie przestrzennych funkcji ortogonalnych wyłącznie w lokalizacjach czujników. Te „empiryczne funkcje ortogonalne” można obliczyć za pomocą PCA na macierzy danych czasoprzestrzennych. (Być może można by użyć pewnego ważenia, aby uwzględnić zmienne obszary podparcia czujnika, ale biorąc pod uwagę jednolitą siatkę biegunową i cel średnich promieniowych, może to nie być wymagane).

Należy zauważyć, że jeśli dostępne jakiekolwiek dane modelowania fizycznego dla „oczekiwanych” zmian temperatury, dostępne na gęstej przestrzenno-skroniowej siatce obliczeniowej, wówczas do tych danych można zastosować tę samą procedurę PCA w celu uzyskania funkcji ortogonalnych. (Zwykle nazywa się to „ prawidłowym rozkładem ortogonalnym ” w inżynierii, gdzie stosuje się go do redukcji modeli, np. Kosztowny model obliczeniowej dynamiki płynów można destylować do wykorzystania w dalszych działaniach projektowych.)

Ostatni komentarz, jeśli chcesz zważyć dane czujnika według obszaru podparcia (tj. Rozmiaru komórki polarnej), byłby to rodzaj kowariancji ukośnej w ramach GLS . (Dotyczyłoby to bardziej twojego problemu prognozowania, chociaż ważona PCA byłaby ściśle powiązana).

Mam nadzieję, że to pomoże!

Aktualizacja: W moim przekonaniu twój nowy schemat rozmieszczenia czujników znacznie zmienia rzeczy. Jeśli chcesz oszacować temperaturę we wnętrzu dysku, będziesz potrzebował znacznie więcej informacji niż po prostu „zestaw funkcji ortogonalnych na dysku jednostki”. Po prostu za mało informacji w danych czujnika.

Jeśli naprawdę chcesz oszacować przestrzenne wahania temperatury na dysku, jedynym rozsądnym sposobem, jaki widzę, byłoby potraktowanie problemu jako jednego z asymilacji danych . W tym przypadku musisz przynajmniej ograniczyć parametryczną formę rozkładu przestrzennego w oparciu o niektóre rozważania fizyki (mogą to być symulacje lub dane z pokrewnych danych w systemach o podobnej dynamice).

Nie znam konkretnej aplikacji, ale jeśli jest coś takiego jak to , to bym sobie wyobrazić, istnieje obszerna literatura inżynieria, że można czerpać, aby wybrać odpowiednie wcześniejsze ograniczenia. (Aby uzyskać szczegółową wiedzę na temat domeny, prawdopodobnie nie jest to najlepsza witryna StackExchange, o którą można zapytać).

GeoMatt22
źródło
Imponująca odpowiedź! Potrzebujesz czasu, aby go przetrawić. Zadajesz dwa pytania: nie jestem pewien, czy rozumiem pierwsze („ile potrzebujesz ograniczenia wzorca przestrzennego?”). Pomyślałem, że użycie danych ze wszystkich 40 czujników byłoby lepsze niż uśrednianie wzdłuż kierunku obwodowego i to pasuje ... czy mówisz, że to niekoniecznie prawda? W przypadku drugiego („jakie typy zmienności występują w danych czasoprzestrzennych”), w ciągu jednego lub dwóch dni przeanalizuję pierwszy silnik (faktycznie mam ich 5! Ale to będzie temat przyszłe pytanie ...) ctd ...
DeltaIV
... ctd, znormalizuję dane i zobaczę, co mogę opublikować na stronie publicznej. Niektóre wzorce przestrzenne i niektóre szeregi czasowe ... Myślę, że powinny dać ci wyobrażenie o tym, o co pytasz.
DeltaIV
1
Na moje pierwsze pytanie: jeśli twoim ostatecznym celem jest zasadniczo „przewidywanie wyników czujników dla nowego silnika” (wywnioskowanych z drugiego pytania), to czy naprawdę potrzebujesz jakichkolwiek informacji z „między czujnikami”? Mój komentarz na aliasing był przykładem, dlaczego byłoby potrzebne takie informacje, na przykład jeśli nie jest wiarygodnie zmierzona przy czujnikach. T95
GeoMatt22
1
BTW, jeśli jest to problem projektowy i istnieją powiązane symulacje typu CFD, to jest to znacznie więcej informacji, niż sugeruje to obecne pytanie. (Na przykład podejście do problemu, ponieważ asymilacja danych może wymagać różnych podejść).
GeoMatt22,
Twoja odpowiedź skłania mnie do myślenia: czy zamiast regresji jest jakiś ekwiwalent 2d dyskretnej transformacji Fouriera, którą można by wykonać? Np. Biorąc całkę punktów danych razy n-tą funkcję Bessela (odpowiednio zmodyfikowaną), a następnie uzyskując rozkład ortogonalny? Obawy będą dotyczyły 1) znalezienia odpowiedniej funkcji dyskretnej, być może w tym samym zakresie co odpowiedź, oraz 2) czy byłoby to zbyt wrażliwe na małą liczbę punktów próbkowania, a rozkład opierałby się na bardziej skomplikowanych warunkach wyższego rzędu .
jwimberley,
2

Wielomiany podobne do Zernów nie brzmią jak zły wybór, ponieważ mają już gotową zależność i i ortogonalność. Jednakże, ponieważ studiujesz temperaturę, prawdopodobnie bardziej odpowiednim i lepiej znanym wyborem byłyby funkcje Bessela . Pojawiają się one w badaniu przepływu ciepła w obiektach cylindrycznych / układach współrzędnych, więc istnieje szansa, że ​​są one fizycznie bardziej odpowiednie. N-ta funkcja Bessela dałaby zależność promieniową związaną z odpowiednią funkcją trygonometryczną dla zależności biegunowej; szczegóły znajdziesz w wielu podręcznikach fizyki i PDE.rθ

jwimberley
źródło
(+1) Połączenie równania biegunowego ze współrzędnymi biegunowymi jest dobre. Innym być może wartym wspomnienia jest to, że w procesach gaussowskich, które znam powszechnie na siatkach prostokątnych, macierz kowariancji jest krążąca i praktycznie stosuje się FFT. Funkcje Bessela byłyby więc potencjalnym kandydatem do podobnego podejścia na siatce polarnej.
GeoMatt22
Ciekawa propozycja! Jednak mierzę temperaturę w płynie roboczym, a nie w stałej części silnika. Dlatego interesuje mnie problem konwekcji, a nie problem przewodnictwa. Funkcje Bessela są z pewnością rozwiązaniami równania przewodzenia ciepła (Fouriera), ale nie sądzę, aby były również rozwiązaniami równania konwekcji ciepła, ponieważ konwekcja zależy od pola przepływu płynu. W każdym razie mogłem przynajmniej przetestować je w stosunku do Zernike. Co z GLS? Czy możesz również dodać coś w tej części pytania?
DeltaIV
@DeltaIV Nie znam się zbyt dobrze na GLS, ale jedno pytanie - dlaczego oczekujesz korelacji błędów w różnych punktach przestrzennych? Zgadzam się, że rzeczywiste fluktuacje będą skorelowane między punktami, ale uważam, że błędy (tj. Niepewność odczytów czujnika) byłyby nieskorelowane. Być może wahania regresji liczą się jako błędy? Zastanawiam się jednak nad dodaniem czegoś do warunków kary. Niezależnie od tego, jakiej podstawy użyjesz, masz tylko skończoną liczbę punktów próbkowania i możesz znaleźć bardzo dopasowaną funkcję Bessela o bardzo wysokim rzędzie, więc należy preferować warunki najniższego rzędu.
jwimberley,
@DeltaIV Odnośnie do fluktuacji, które wprowadziłyby korelacje między punktami przestrzennymi: twoim celem jest uzyskanie mapy temperatury, prawda? Nie chcesz zobaczyć, jakie zmiany występują? Czy model statystyczny mógłby nawet je uwzględnić, skoro fluktuacje byłyby napędzane dynamiką płynów i byłyby skomplikowane w przestrzeni i czasie? (Czy jest to związane z zależną od czasu częścią analizy, którą pominięto dla uproszczenia?)
jwimberley,
utworzono czat galerii .
DeltaIV