Mam pewne wysoce skorelowane dane. Jeśli przeprowadzę regresję liniową, otrzymam linię regresji o nachyleniu zbliżonym do jednego (= 0,93). Chciałbym przetestować, czy to nachylenie różni się znacznie od 1,0. Oczekuję, że tak nie jest. Innymi słowy, chciałbym zmienić hipotezę zerową regresji liniowej z nachylenia zera na nachylenie jednego. Czy to rozsądne podejście? Byłbym również bardzo wdzięczny za to, że w odpowiedzi mógłbyś podać kod R, aby móc wdrożyć tę metodę (lub lepszą, którą sugerujesz!). Dzięki.
regression
correlation
hypothesis-testing
Nick Crawford
źródło
źródło
Do tego rodzaju hipotez można użyć
linearHypothesis
funkcji z pakietu samochodu :źródło
Wygląda na to, że nadal próbujesz odrzucić hipotezę zerową. Jest z tym mnóstwo problemów, z których nie mniej ważne jest to, że nie masz wystarczającej mocy, aby zobaczyć, że różnisz się od 1. Wygląda na to, że nie obchodzi cię, że nachylenie różni się od 0,07 od 1. Ale co, jeśli tak naprawdę nie możesz powiedzieć? Co jeśli faktycznie szacujesz nachylenie, które zmienia się dziko i może być całkiem dalekie od 1 z czymś w rodzaju przedziału ufności ± 0,4. Twoja najlepsza taktyka tutaj nie polega na zmianie hipotezy zerowej, ale właściwie na rozsądnym oszacowaniu przedziału. Jeśli zastosujesz polecenie confint () w swoim modelu, możesz uzyskać 95% przedział ufności wokół swojego nachylenia. Następnie możesz użyć tego do omówienia nachylenia. Jeśli 1 mieści się w przedziale ufności, możesz stwierdzić, że mieści się w zakresie wartości, które Twoim zdaniem mogą zawierać prawdziwą wartość. Ale co ważniejsze, możesz również określić, jaki jest ten zakres wartości.
źródło
Chodzi o to, że chcesz odrzucić hipotezę zerową, a nie ją potwierdzić. Fakt, że nie ma znaczącej różnicy, nie jest w żaden sposób dowodem braku znaczącej różnicy. W tym celu musisz określić, jaki rozmiar efektu uważasz za rozsądny, aby odrzucić wartość null.
Teraz powinieneś zdawać sobie sprawę z faktu, że wielkość efektu, dla którego różnica staje się znacząca, jest
pod warunkiem, że mamy przyzwoity estymator błędu standardowego na zboczu. Dlatego jeśli zdecydujesz, że istotną różnicę należy wykryć tylko od 0,1, możesz obliczyć niezbędny DF w następujący sposób:
Pamiętaj, że to dość zależy od oszacowania seslope. Aby uzyskać lepsze oszacowanie na seslope, możesz dokonać ponownego próbkowania swoich danych. Naiwnym sposobem byłoby:
umieszczenie seslope2 w funkcji optymalizacji zwraca:
Wszystko to powie Ci, że Twój zestaw danych zwróci znaczący wynik szybciej, niż uważasz za niezbędny, i że potrzebujesz tylko 7 stopni swobody (w tym przypadku 9 obserwacji), jeśli chcesz mieć pewność, że nieistotne oznacza to, czego chcesz. znaczy.
źródło