Próbowałem utworzyć dane testowe dla regresji logistycznej i znalazłem ten post Jak symulować sztuczne dane dla regresji logistycznej?
To ładna odpowiedź, ale tworzy tylko zmienne ciągłe. Co powiesz na zmienną kategorialną x3 z 5 poziomami (ABCDE) powiązanymi zy dla tego samego przykładu, co w łączu?
r
logistic
simulation
użytkownik1301295
źródło
źródło
Odpowiedzi:
Model
Niech jeśli ktoś ma kategorię „B”, a przeciwnym razie. Zdefiniuj , i . Jeśli , to mamy kategorię „A” (tzn. „A” jest poziomem odniesienia). Twój model można następnie zapisać jakoxb= 1 xb= 0 xdo xre xmi xb=xdo=xre=xmi= 0
Generowanie danych w R.
(za)
x
Wektor man
składniki (jeden dla każdego osobnika). Każdy element to „A”, „B”, „C”, „D” lub „E”. Każde z „A”, „B”, „C”, „D” i „E” jest równie prawdopodobne.(b)
dummy(x)
jest macierzą zn
wierszami (po jednej dla każdej osoby) i 5 kolumnami odpowiadającymi , , , i . Predyktory liniowe (jeden dla każdej osoby) można następnie zapisać jako(do)
Prawdopodobieństwa sukcesu wynikają z modelu logistycznego:
(re)
Teraz możemy wygenerować zmienną odpowiedzi binarnej. th odpowiedź pochodzi z dwustronną zmiennej losowej z , a :ja Bin (n,p) n = 1 p=
pi[i]
Kilka szybkich symulacji, aby to sprawdzić, jest w porządku
źródło