Co to jest „odrzucanie wnioskowania” i jak można go wykorzystać do zwiększenia dokładności modelu?

10

Czy ktoś może szczegółowo wyjaśnić:

Co oznacza odrzucenie wnioskowania?
Jak można go wykorzystać do zwiększenia dokładności mojego modelu?

Mam pomysł odrzucenia wnioskowania w aplikacji karty kredytowej, ale walczę z myślą o użyciu go do zwiększenia dokładności mojego modelu.

logistic ayush biyani
źródło

23

W budowaniu modelu kredytu wnioskowanie o odrzuceniu to proces wnioskowania o wydajności kont kredytowych, które zostały odrzucone w procesie składania wniosku.

Budując model ryzyka kredytowego aplikacji, chcemy zbudować model, który ma zastosowanie „ od drzwi ”, tj. Wprowadzamy wszystkie dane aplikacji do modelu ryzyka kredytowego, a model generuje ocenę ryzyka lub prawdopodobieństwo domyślnie. Problemem przy użyciu regresji do zbudowania modelu na podstawie danych z przeszłości jest to, że znamy wydajność konta tylko w przypadku wcześniej zaakceptowanych aplikacji. Jednak nie znamy wydajności odrzutów, ponieważ po złożeniu wniosku odesłaliśmy je z powrotem za drzwi. Może to spowodować stronniczość selekcji w naszym modelu, ponieważ jeśli użyjemy w przeszłości tylko „akceptacji” w naszym modelu, model może nie działać dobrze w populacji „od drzwi”.

Istnieje wiele sposobów radzenia sobie z wnioskami o odrzuceniu, wszystkie są kontrowersyjne. Wspomnę tutaj o dwóch prostych.

„Zdefiniuj odrzucenia z przeszłości jako złe”
Paczkowanie

„Zdefiniuj przeszłe odrzucenia jako złe” to po prostu wzięcie wszystkich odrzuconych danych aplikacji i zamiast odrzucania ich podczas budowania modelu, przypisuj je wszystkie jako złe. Ta metoda silnie przesuwa model w kierunku poprzedniej polityki akceptowania / odrzucania.

„Paczkowanie” jest nieco bardziej wyrafinowane. Składa się ona z

Zbuduj model regresji z przeszłością „akceptuje”
Zastosuj model do poprzednich odrzuceń, aby przypisać im oceny ryzyka
Korzystając z oczekiwanego prawdopodobieństwa niewykonania zobowiązania dla każdej oceny ryzyka, przypisz odrzucone aplikacje do dobrych lub złych. Np. Jeśli ocena ryzyka ma prawdopodobieństwo niewypłacalności 10% i istnieje 100 odrzuconych wniosków, które mieszczą się w tej ocenie ryzyka, przypisz 10 odrzuconych do „złych”, a 90 odrzuconych do „dobrych”.
Odbuduj model regresji za pomocą zaakceptowanych aplikacji i teraz wywnioskowanej wydajności odrzuconych aplikacji

Istnieją różne sposoby wykonywania przypisań do dobra lub zła w kroku 3, a proces ten można również zastosować iteracyjnie.

Jak wspomniano wcześniej, stosowanie wnioskowania o odrzuceniu jest kontrowersyjne i trudno jest udzielić prostej odpowiedzi na temat tego, w jaki sposób można go wykorzystać do zwiększenia dokładności modeli. Po prostu zacytuję kilka innych w tej sprawie.

Jonathan Crook i John Banasik, Czy odrzucenie wnioskowania naprawdę poprawia wydajność modeli oceniania aplikacji?

Po pierwsze, nawet w przypadku odrzucenia bardzo dużej części wnioskodawców, zakres udoskonalenia modelu sparametryzowanego tylko w przypadku przyjętych wydaje się niewielki. Tam, gdzie wskaźnik odrzucenia nie jest tak duży, zakres ten wydaje się być naprawdę bardzo mały.

David Hand, „Bezpośrednie wnioskowanie w operacjach kredytowych”, pojawiający się w Handbook of Credit Scoring, 2001

Kilka metod zostało zaproponowanych i jest stosowanych, i chociaż niektóre z nich są wyraźnie słabe i nigdy nie powinny być zalecane, nie ma unikalnej najlepszej metody uniwersalnego zastosowania, chyba że uzyskano dodatkowe informacje. Oznacza to, że najlepszym rozwiązaniem jest uzyskanie dodatkowych informacji (być może poprzez udzielenie pożyczek niektórym potencjalnym odrzuceniom) na temat wnioskodawców należących do regionu odrzuconego.

Derek Ploor
źródło

1

+1 za obszerny przegląd. Teraz też wiem, czym jest odrzucanie wnioskowania :)

mpiktas

1

dzięki. ale jak przypisać w kroku 3? Przeczytałem, że przy użyciu 1 lub 0 możesz użyć prawdopodobieństwa dla każdej linii. Będziesz miał tę samą osobę z 10% i 90%. Jak to może działać z tworzeniem nowego modelu logistycznego?

GabyLP,

1

@GabyLP w poprzednich komentarzach. W oparciu o moje doświadczenie możesz podzielić takich klientów na dwie części i przypisać wagi obu podziałom zgodnie z prawdopodobieństwem. Na przykład jeśli odrzucony klient ma 10% PD, możesz zrobić z niego dwóch klientów. Najpierw zmienna docelowa 1 i waga 0,1, a druga zmienna docelowa 0 i waga 0,9.

Cała zaakceptowana próba klientów będzie miała wagi == 1.

Chociaż działa to z regresją logistyczną, nie działa z modelami opartymi na drzewach.

MiksL
źródło

Czy masz źródło swojego oświadczenia?

T. Beige

Jeśli pytanie dotyczy tego, że nie działa na modelach opartych na drzewach, moja odpowiedź brzmi - osobiste doświadczenie. Próbowałem wdrożyć to podejście, ale mi się nie udało.

MiksL,

Co to jest „odrzucanie wnioskowania” i jak można go wykorzystać do zwiększenia dokładności modelu?

Odpowiedzi: