Ja nie wiem, stosowanej metody modelowania zależność pomiędzy dwoma zmiennymi ( i ) w doświadczeniu opisano w sposób następujący:
- Istnieją 3 zmienne: , i .
- Wartość jest ustawiana podczas przeprowadzania eksperymentu. Jednak i nie zawsze są równe.
- Współczynnik korelacji Pearsona między i wynosi około 0,9.
- Współczynnik korelacji Pearsona między i jest znacznie mniejsza: około 0,5.
- ma maksymalną możliwą wartość ( ), której nie można przekroczyć.
- Każdy punkt danych jest otrzymywany po ustawieniu i czytania i .
Chociaż współczynnik korelacji Pearsona między i nie jest wielki, wygląda na to ma tendencję wzrostową z .
Po wykonaniu prostych regresji liniowych i (i przekonwertowaniu tego ostatniego z powrotem na , aby wyświetlić na przykład na tym samym wykresie co ), oba nachylenia są dodatnie, ale nachylenie jest większe niż dla .
Czy sensowne jest powiedzenie czy ? ( byłby osiągnięty wcześniej w drugim przypadku.)
Biorąc pod uwagę, że jest ograniczone przez , co można powiedzieć o możliwej maksymalnej wartości którą można by osiągnąć?
O ile rozumiem, sensowne jest wykonanie regresji liniowej postaci gdy jest zmienną niezależną, a jest zmienną zależną. Jednak w tym kontekście nie jestem pewien, czy uzasadnione jest uznanie, że jest niezależne, a jest zależne.
Czy regresja łączna najmniejszych kwadratów byłaby bardziej odpowiednia? Czy istnieją inne metody określania, które wartości można osiągnąć (i z jakim prawdopodobieństwem)?
(Jeśli to sprawy, i nie wydają się podążać rozkład normalny, coraz próby zostały dokonane, aby spróbować osiągnąć wyższe wartości ).
źródło
Odpowiedzi:
Chcę zdobyć punkty @ Kinga. Jest bardzo intuicyjne, aby podejrzewać, że regresja na („regresja bezpośrednia”) i regresja na („regresja odwrotna”) powinny być takie same. Nie jest to jednak prawdą ani matematycznie, ani w odniesieniu do tego, w jaki sposób regresja jest związana z analizowaną sytuacją. Jeśli narysujesz na osi pionowej wykresu i na osi poziomej, zobaczysz, co się dzieje. Regresja bezpośrednia znajduje linię, która minimalizuje pionowe odległości między punktami danych a linią, podczas gdy regresja odwrotna minimalizuje odległości poziome. Linia, która minimalizuje jedną, zminimalizuje tylko drugą, jeśliy x x y y x rxy=1.0 . Musisz zdecydować, co chcesz wyjaśnić i czego chcesz użyć, aby to wyjaśnić. Odpowiedź na to pytanie podaje, która zmienna to i i określa twój model. Ponadto (ponownie po @King) nie zgadzam się z próbą powiedzenia z tych samych powodów. y x xmax=f−1(ymax)
Jeśli chodzi o kwestię zmiennej ograniczonej, zwykle można sobie wyobrazić, że „rzeczywista” kwota może wzrosnąć, ale po prostu nie można jej zmierzyć. Na przykład zewnętrzny termometr za moim okiem podnosi się do 120, ale w niektórych miejscach może wynosić 140, a twoim pomiarem byłoby tylko 120. Zatem zmienna miałaby górną granicę, ale to, o czym naprawdę chciałeś pomyśleć, nie ma. W takim przypadku istnieją modele tobit dla takich właśnie sytuacji.
Innym podejściem byłoby użycie czegoś bardziej niezawodnego, takiego jak less, który może być całkowicie odpowiedni do twoich potrzeb.
źródło
Po pierwsze, nie sądzę, aby sensowne było tutaj mówienie , to jak sugerowanie, że jest to funkcja jeden do jednego, chociaż jest wyjaśnione przez inne nieobserwowane zmienne.xmax=f−1(ymax) xmax
Po drugie, tak naprawdę zależy to od kontekstu, który należy traktować jako zmienną niezależną lub zależną. Z mojego doświadczenia, chyba że teoria zdecydowanie sugeruje jeden sposób; tak czy inaczej jest w porządku. Z twoich komentarzy z 7 października wynika, że jest zależne, podczas gdy jest niezależne.x y
Jeśli to możliwe, spójrz na pozostałości i sprawdź, czy możesz coś z tego wycisnąć. Może istnieć inna zmienna, o której zapomniałeś; lub może pomóc w transformacji zmiennych.
źródło