Regresja logistyczna dla danych z rozkładów Poissona

11

Z niektórych notatek dotyczących uczenia maszynowego mówiących o niektórych dyskryminujących metodach klasyfikacji, w szczególności regresji logistycznej, gdzie y jest etykietą klasy (0 lub 1), a x jest danymi, mówi się, że:

jeśli x|y=0Poisson(λ0) , a x|y=1Poisson(λ1) , wówczas p(y|x) będzie logistyczne.

Dlaczego to prawda?

sambajetson
źródło

Odpowiedzi:

16

Y składa się z dwóch możliwych wartości dla każdej wartości X . Zgodnie z założeniami

Pr(X=x|Y=0)=exp(λ0)λ0xx!

i

Pr(X=x|Y=1)=exp(λ1)λ1xx!.

Dlatego (jest to trywialny przypadek twierdzenia Bayesa) szansa, że uwarunkowana jest względnym prawdopodobieństwem tego ostatniego, a mianowicieY=1X=x

Pr(Y=1|X=x)=exp(λ1)λ1xx!exp(λ1)λ1xx!+exp(λ0)λ0xx!=11+exp(β0+β1x)

gdzie

β0=λ1λ0

i

β1=log(λ1/λ0).

To rzeczywiście jest standardowy model regresji logistycznej.

Whuber
źródło