Mam na myśli zbudowanie modelu przewidującego stosunek , gdzie a ≤ b oraz a > 0 i b > 0 . Tak więc stosunek wynosiłby od 0 do 1 .
Mógłbym użyć regresji liniowej, chociaż nie ogranicza się ona naturalnie do 0..1. Nie mam powodu, by sądzić, że związek jest liniowy, ale oczywiście i tak często jest używany jako prosty pierwszy model.
Mógłbym zastosować regresję logistyczną, chociaż zwykle służy ona do przewidywania prawdopodobieństwa wyniku dwustanowego, a nie do przewidywania ciągłej wartości z zakresu 0..1.
Nie wiedząc nic więcej, czy użyłbyś regresji liniowej, logistycznej lub ukrytej opcji c ?
Odpowiedzi:
Wybierz „ukrytą opcję c”, gdzie c oznacza regresję beta. Jest to rodzaj modelu regresji, który jest odpowiedni, gdy zmienna odpowiedzi jest dystrybuowana jako Beta . Możesz myśleć o tym jak o uogólnionym modelu liniowym . To jest dokładnie to, czego szukasz. Istnieje pakiet o
R
nazwie betareg, który sobie z tym radzi . Nie wiem, czy używaszR
, ale nawet jeśli nie możesz i tak przeczytać „winiet”, podadzą ci ogólne informacje na ten temat, a także sposób jego implementacjiR
(których nie potrzebujesz. ta walizka).Inną możliwością jest zastosowanie regresji liniowej, jeśli współczynniki można przekształcić tak, aby spełnić założenia standardowego modelu liniowego, chociaż nie byłbym optymistą co do tego, że faktycznie działa.
źródło
Czy są to sparowane próbki czy dwie niezależne populacje?
Punktem wyjścia dla tej regresji będzie log (B), a nachylenie będzie log (stosunek).
Zobacz więcej tutaj:
Beyene J, Moineddin R. Metody szacowania przedziału ufności parametru stosunku z zastosowaniem do ilorazów lokalizacji. Metodologia badań medycznych BMC. 2005; 5 (1): 32.
EDYCJA: Napisałem dodatek SPSS, aby to zrobić. Mogę się nim podzielić, jeśli jesteś zainteresowany.
źródło
REGRESSION
po transformacji dziennika danych. Od tego czasu napisałem bardziej wyrafinowaną wersję, która używaGLM
. Zajmuję się pomiarami emisji światła, a moje testy sugerowały, że regresja gamma z log-link była najmniej podatna na niekontrolowaną niepewność parametrów. W przypadku większości moich rzeczywistych danych odpowiedzi na użycie normalnego, ujemnego dwumianowego i gamma z log-link były bardzo podobne (przynajmniej z taką dokładnością, jakiej potrzebowałem)źródło