Patrzę na kilka problemów z regresją logistyczną. („zwykłe” i „warunkowe”).
Idealnie, chciałbym wyważyć każdą z wejściowych spraw, aby glm skupił się bardziej na prawidłowym przewidywaniu wyższych ważonych przypadków kosztem ewentualnego błędnego sklasyfikowania mniej ważonych przypadków.
Z pewnością zostało to już zrobione wcześniej. Czy ktoś może skierować mnie w stronę odpowiedniej literatury (lub ewentualnie zasugerować zmodyfikowaną funkcję prawdopodobieństwa).
Dzięki!
Odpowiedzi:
glm
posiada parametrweights
dokładnie do tego celu. Zapewniasz mu wektor liczb w dowolnej skali, który utrzymuje taką samą liczbę wag, jak masz obserwacje.Dopiero teraz zdaję sobie sprawę, że możesz nie mówić
R
. Jeśli nie, możesz chcieć.źródło
glm
aby (prawdopodobnie) znaleźć implementację C.Jeśli masz dostęp do SAS, można to bardzo łatwo osiągnąć za pomocą PROC GENMOD. Tak długo, jak każda obserwacja ma zmienną wagi, użycie instrukcji wagi pozwoli ci przeprowadzić analizę, której szukasz. Używałem go głównie przy użyciu wag z odwrotnym prawdopodobieństwem leczenia, ale nie widzę powodu, dla którego nie można przypisać wag do danych w celu podkreślenia niektórych rodzajów przypadków, o ile upewnisz się, że twoje N pozostaje stałe. Będziesz także musiał upewnić się, że zawierasz jakąś zmienną identyfikatora, ponieważ technicznie przypadki z podwyższoną ważnością są powtarzanymi obserwacjami. Przykładowy kod z identyfikatorem obserwacji „id” i zmienną wagową „wt”:
źródło