Oceniam dwa (2) czynniki chłodnicze (gazy), które zostały użyte w tym samym systemie chłodniczym. Do oceny mam dane dotyczące nasyconej temperatury ssania ( ), temperatury skraplania ( ) i natężenia prądu ( ). Istnieją dwa (2) zestawy danych; 1. czynnik chłodniczy ( ) i 2. czynnik chłodniczy ( ). Używam liniowego, wielowymiarowego ( & ) modelu wielomianowego trzeciego rzędu do analiz regresji. Chciałbym ustalić, o ile mniej / więcej natężenia prądu (lub podobnej miary jak porównanie wydajności) średnio jako procent jest pobierany przez drugi czynnik chłodniczy.D Y R 1 R 2 S D
Moją pierwszą myślą było:
- Określ model do użycia:
- Wyprowadź współczynniki ( ) z danych wyjściowych ( ).R 1
- Używając tych współczynników, dla każdego & w danych , obliczyć każdy oczekiwany remis wzmacniacza ( ), a następnie średnią.D R 2 Y
- Porównaj średnią z faktycznym średnim wzmacniacza ( ) danych . Y2R2
Ponieważ jednak drugi czynnik chłodniczy ma nieco inne właściwości termiczne i wprowadzono niewielkie zmiany w układzie chłodniczym (korekty TXV i przegrzania), nie sądzę, aby ta „podstawowa metoda porównania” była dokładna.
Kolejną moją myślą było wykonanie dwóch (2) oddzielnych analiz regresji:
a następnie, dla nasyconej temperatury ssania ( ), porównaj współczynniki ( vs ) w następujący sposób:
Jednak ponownie współczynniki te powinny być różnie ważone. Dlatego wyniki byłyby wypaczone.
Wydaje mi się, że mógłbym użyć testu Z do ustalenia, jak różnie ważone są współczynniki, ale nie jestem pewien, czy w pełni rozumiem znaczenie wyniku: . Ale nadal nie dałoby mi to wskaźnika wydajności, który jest ogólnym celem.
źródło
Odpowiedzi:
Z idealnego prawa gazu tutaj , , co sugeruje model proporcjonalny. Upewnij się, że twoje urządzenia są w temperaturze bezwzględnej. Pytanie o proporcjonalny wynik oznaczałoby proporcjonalny model błędu. Zastanów się, być może , a następnie w przypadku wielokrotnej regresji liniowej można użyć , biorąc logarytmy wartości Y, D i S, tak więc wygląda to tak, jakby , gdzie indeksy dolne oznaczają „logarytm z”. Teraz może to działać lepiej niż model liniowy, którego używasz, a odpowiedzi są wtedy typem błędu względnego.P.V.= n R T ln ( Y ) = ln ( a ) + b ln ( D ) +Y= a D.bS.do Y l = a l + b D l + c S l lln( Y) = ln( a ) + b ln( D ) + c ln( S) Yl= al+ b D.l+ c S.l l
Aby sprawdzić, jakiego typu modelu użyć, wypróbuj jeden i sprawdź, czy reszty są homoscedastyczne. Jeśli tak nie jest, to masz tendencyjny model , a następnie zrób coś innego, na przykład modeluj logarytmy, jak powyżej, jedną lub więcej odwrotności danych x lub y, pierwiastków kwadratowych, kwadratu, potęgowania itd., Aż reszty będą homoscedastyczne. Jeśli model nie może dać reszt homoscedastycznych, zastosuj wielokrotną liniową regresję Theila, z cenzurą w razie potrzeby.
To, jak normalnie dane są rozmieszczone na osi y, nie jest wymagane, ale wartości odstające mogą i często zniekształcają znacząco wyniki parametru regresji. Jeśli nie można znaleźć homoscedastyczności, nie należy stosować zwykłych najmniejszych kwadratów i należy wykonać inny rodzaj regresji, np. Regresja ważona, regresja Theil, najmniejszych kwadratów x, regresja Deminga i tak dalej. Ponadto błędy nie powinny być skorelowane szeregowo.
Znaczenie wyniku: , może, ale nie musi, być istotnych. Zakłada się, że całkowita wariancja jest sumą dwóch niezależnych wariancji. Innymi słowy, niezależność to ortogonalność (prostopadłość) na wykresie . Oznacza to, że całkowita zmienność (wariancja) jest następnie zgodna z twierdzeniem Pitagorasa, , co może, ale nie musi dotyczyć twoich danych. Jeżeli tak jest, wówczas -statistic jest względną odległość, to znaczy różnica sposób (odległość) podzielona przez pitagorejsko AKA wektora dodanie błąd standardowy (SE), przy czym odchylenia standardowego (SDS) podzielona autor:z=( a1-b1) /Smi2)za1+Smi2)b1)-----------√ x , y H.= + A2)+ O2)-------√ z N.--√ , gdzie SE są odległościami. Dzielenie jednej odległości przez drugą następnie normalizuje je, tj. Różnicę średnich podzieloną przez błąd całkowity (standardowy), który ma wówczas postać, aby można było zastosować ND (0,1) w celu znalezienia prawdopodobieństwa.
Co się stanie, jeśli miary nie będą niezależne, i jak można to sprawdzić? Możesz pamiętać z geometrii, że trójkąty, które nie są ustawione pod kątem prostym, dodają swoje boki jako , jeśli nie odśwież swoją pamięć tutaj . Oznacza to, że gdy między osiami jest coś innego niż kąt 90 stopni, musimy uwzględnić, jaki jest ten kąt w obliczeniach całkowitej odległości. Najpierw przypomnij sobie, czym jest korelacja, znormalizowana kowariancja. To dla całkowitego dystansu i korelacji staje sięσ T ρ A , B σ 2 T = σ 2 A + σ 2 B - 2 σ A σ B ρ A , Bdo2)= A2)+ B2)- 2 A B cos( θ ) , θ = ∠ ( A , B ) σT. ρA , B σ2)T.= σ2)ZA+ σ2)b- 2 σZAσbρA , B . Innymi słowy, jeśli twoje odchylenia standardowe są skorelowane (np. Parami), nie są one niezależne.
źródło