Raportowanie wyników regresji logistycznej

13

Mam następujące dane wyjściowe regresji logistycznej:

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

Czy należy to zgłosić w następujący sposób:

Współczynnik beta, iloraz szans, wartość, wartość P. Jeśli tak, jak mogę uzyskać iloraz szans?

powyżej
źródło
Powiązane pytanie: Regresja logistyczna w R (iloraz szans) .
landroni

Odpowiedzi:

9

Sugerowane raportowanie tabeli wydaje się rozsądne, chociaż wartości Z i wartości P są zbędne. W wielu czasopismach, które znam, w ogóle nie podaje się wartości z / wartości p i używa się tylko gwiazdek do zgłaszania istotności statystycznej. Widziałem także tabele logistyczne tylko z podanymi ilorazami nieparzystych, chociaż osobiście wolę zarówno podawane logarytmiczne szanse, jak i iloraz szans, jeśli pozwala na to miejsce w tabeli.

Jednak w różnych miejscach mogą obowiązywać inne wytyczne dotyczące procedur sprawozdawczych, więc oczekiwania mogą się różnić. Jeśli przesyłam artykuł do czasopisma, często widzę, jak inne niedawne gazety zrobiły swoje tabele i naśladuję je. Jeśli jest to twój osobisty artykuł, pytanie, kto może go przejrzeć, byłoby uzasadnionym żądaniem. Jak wspomniałem powyżej, ograniczenia przestrzeni w niektórych miejscach mogą uniemożliwić zgłaszanie ostatecznie zbędnych informacji (takich jak logarytmiczne szanse i iloraz szans). Niektóre miejsca mogą zmusić Cię do zgłoszenia wyników w całości w tekście!

Pozostaje również pytanie, jakie inne podsumowania modeli należy zgłosić. Chociaż w wielu czasopismach, które znam często pseudo , tutaj jest wątek na stronie, który omawia słabości różnych miar. Osobiście wolę zgłaszanie współczynników klasyfikacji, ale znów podejrzewam, że różni się to w zależności od miejsca (mogę sobie wyobrazić, że niektóre czasopisma wyraźnie proszą o zgłoszenie jednego z pseudo wskaźników R 2 ).R2)R2)

miβ^miβ^exp(coefficient)

Dodatkowo, chociaż jest to obecnie akceptowana odpowiedź, zarówno Lejohn, jak i Frank Harrell udzielają bardzo przydatnych porad. Chociaż zazwyczaj zawsze chciałbym gdzieś podać gdzieś statystyki, inne odpowiedzi na porady dotyczące innych miar są użytecznymi sposobami oceny wielkości efektów w stosunku do innych oszacowanych efektów w modelu. Procedury graficzne są również przydatne do badania względnych wielkości efektów i zobacz te dwa artykuły na temat przekształcania tabel w wykresy jako przykłady ( Kastellec i Leoni, 2007 ; Gelman i in., 2002 )

Andy W.
źródło
Link Kastellec i Leoni, 2007 jest zepsuty, ale oto przykład z tego samego artykułu z kodem.
ACNB
11

Odpowiedź na to pytanie może zależeć od twojej dyscypliny.

Oto kilka ogólnych uwag.

Bety regresji logistycznej są dość trudne do bezpośredniej interpretacji. Dlatego jawne zgłaszanie ich ma bardzo ograniczone zastosowanie. Powinieneś trzymać się ilorazów szans, a nawet efektów krańcowych. Efekt krańcowy zmiennej x jest pochodną prawdopodobieństwa, że ​​twoje zmienne zależne są równe 1, w odniesieniu do x. Ten sposób prezentacji wyników jest bardzo popularny wśród ekonomistów. Osobiście uważam, że efekty marginalne są łatwiejsze do zrozumienia dla laików (ale nie tylko przez nich ...) niż iloraz szans.

Inną interesującą możliwością jest użycie wyświetlaczy graficznych. Miejscem, w którym znajdziesz kilka przykładów tego podejścia, jest książka Gelmana i Hilla . Uważam, że jest to nawet lepsze niż zgłaszanie efektów marginalnych.

Jeśli chodzi o pytanie, jak uzyskać iloraz szans, oto jak możesz to zrobić w R:

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))
Scortchi - Przywróć Monikę
źródło
Czy masz jakieś przykłady przekształcania oszacowań efektu krańcowego w tabele (lub konkretne odniesienia do stron w Gelman i Hill?)
Andy W
1
Gelman i Hill nie wykorzystują tak naprawdę efektów krańcowych, ale raczej wykresy oparte na przewidywanych prawdopodobieństwach. Spójrz na rozdział piąty, zaczynając od strony 79.
10

Tylko w szczególnych przypadkach współczynniki i ich logi (ilorazy szans) są dobrym podsumowaniem. Dzieje się tak, gdy relacje są liniowe i istnieje jeden współczynnik powiązany z predyktorem, a zmiana o jedną jednostkę stanowi dobrą podstawę do obliczenia ilorazu szans (bardziej OK dla wieku, nie tyle dla liczby krwinek białych o zakresie 500–100 000). Ogólnie rzecz biorąc, przydatne są rzeczy takie jak iloraz szans między kwartylami. Mam więcej szczegółów na ten temat na stronie http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf, a rmspakiet R robi to wszystko automatycznie (obsługuje nieliniowe warunki i interakcje, oblicza kwartyle X, itp.).

Frank Harrell
źródło
5

Prawdopodobnie zależy to od odbiorców i dyscypliny. Odpowiedź poniżej brzmi: co zwykle robi się w przypadku czasopism epidemiologicznych i, w mniejszym stopniu, czasopism medycznych.

Mówiąc wprost, nie dbamy o wartości p. Poważnie, my nie. Epidemiologia nie pozwala nawet na ich zgłaszanie, chyba że masz naprawdę pilną potrzebę, a dziedzina zasadniczo podąża za nimi.

W zależności od pytania możemy nawet nie przejmować się szacunkami wersji beta. Jeśli twój raport dotyczy czegoś bardziej metodologicznego lub symulacyjnego, prawdopodobnie zgłosiłbym oszacowanie beta i błąd standardowy. Jeśli próbujesz zgłosić efekt oszacowany w populacji, trzymałbym się współczynnika szans i 95% przedziału ufności. To podstawa twoich szacunków i tego, czego będą szukać czytelnicy w tej dziedzinie.

Odpowiedzi zostały opublikowane powyżej, jak uzyskać iloraz szans, ale dla OR i 95% CI:

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)
Fomite
źródło
Dziękuję za odpowiedź! czy mogę zapytać, co oznacza 1,96 w obliczeniach?
powyżej
1
Żaden problem :) Przedział ufności 95% to przedział, który powinien obejmować mniej więcej od 2,5 percentyla do 97,5 percentyla normalnego rozkładu oceny beta. Każdy z tych punktów wynosi około 1,96 standardowych odchyleń od średniej (w tym przypadku beta).
Fomite
tak, ale czy powinienem to zrobić dla każdego współczynnika beta? zmienia się również 1.96? to także dane dwumianowe, czy nadal są oparte na rozkładzie normalnym?
powyżej
2
Tak - dla każdego współczynnika beta można uzyskać iloraz szans i limit ufności 95%. 1,96 nie zmieni się, chyba że chcesz obliczyć inny percentyl dla przedziału ufności (90%, 99% itd.), Ale ponieważ 95% jest standardem, nie musisz tego robić. I tak długo, jak pracujesz na skali dziennika, parametry z modelu regresji logistycznej są zwykle dystrybuowane. Po ich potęgowaniu przestaje to być prawdą.
Fomite