Mam następujące dane wyjściowe regresji logistycznej:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.5716 0.1734 3.297 0.000978 ***
R1 -0.4662 0.2183 -2.136 0.032697 *
R2 -0.5270 0.2590 -2.035 0.041898 *
Czy należy to zgłosić w następujący sposób:
Współczynnik beta, iloraz szans, wartość, wartość P. Jeśli tak, jak mogę uzyskać iloraz szans?
Odpowiedzi:
Sugerowane raportowanie tabeli wydaje się rozsądne, chociaż wartości Z i wartości P są zbędne. W wielu czasopismach, które znam, w ogóle nie podaje się wartości z / wartości p i używa się tylko gwiazdek do zgłaszania istotności statystycznej. Widziałem także tabele logistyczne tylko z podanymi ilorazami nieparzystych, chociaż osobiście wolę zarówno podawane logarytmiczne szanse, jak i iloraz szans, jeśli pozwala na to miejsce w tabeli.
Jednak w różnych miejscach mogą obowiązywać inne wytyczne dotyczące procedur sprawozdawczych, więc oczekiwania mogą się różnić. Jeśli przesyłam artykuł do czasopisma, często widzę, jak inne niedawne gazety zrobiły swoje tabele i naśladuję je. Jeśli jest to twój osobisty artykuł, pytanie, kto może go przejrzeć, byłoby uzasadnionym żądaniem. Jak wspomniałem powyżej, ograniczenia przestrzeni w niektórych miejscach mogą uniemożliwić zgłaszanie ostatecznie zbędnych informacji (takich jak logarytmiczne szanse i iloraz szans). Niektóre miejsca mogą zmusić Cię do zgłoszenia wyników w całości w tekście!
Pozostaje również pytanie, jakie inne podsumowania modeli należy zgłosić. Chociaż w wielu czasopismach, które znam często pseudo , tutaj jest wątek na stronie, który omawia słabości różnych miar. Osobiście wolę zgłaszanie współczynników klasyfikacji, ale znów podejrzewam, że różni się to w zależności od miejsca (mogę sobie wyobrazić, że niektóre czasopisma wyraźnie proszą o zgłoszenie jednego z pseudo wskaźników R 2 ).R2) R2)
exp(coefficient)
Dodatkowo, chociaż jest to obecnie akceptowana odpowiedź, zarówno Lejohn, jak i Frank Harrell udzielają bardzo przydatnych porad. Chociaż zazwyczaj zawsze chciałbym gdzieś podać gdzieś statystyki, inne odpowiedzi na porady dotyczące innych miar są użytecznymi sposobami oceny wielkości efektów w stosunku do innych oszacowanych efektów w modelu. Procedury graficzne są również przydatne do badania względnych wielkości efektów i zobacz te dwa artykuły na temat przekształcania tabel w wykresy jako przykłady ( Kastellec i Leoni, 2007 ; Gelman i in., 2002 )
źródło
Odpowiedź na to pytanie może zależeć od twojej dyscypliny.
Oto kilka ogólnych uwag.
Bety regresji logistycznej są dość trudne do bezpośredniej interpretacji. Dlatego jawne zgłaszanie ich ma bardzo ograniczone zastosowanie. Powinieneś trzymać się ilorazów szans, a nawet efektów krańcowych. Efekt krańcowy zmiennej x jest pochodną prawdopodobieństwa, że twoje zmienne zależne są równe 1, w odniesieniu do x. Ten sposób prezentacji wyników jest bardzo popularny wśród ekonomistów. Osobiście uważam, że efekty marginalne są łatwiejsze do zrozumienia dla laików (ale nie tylko przez nich ...) niż iloraz szans.
Inną interesującą możliwością jest użycie wyświetlaczy graficznych. Miejscem, w którym znajdziesz kilka przykładów tego podejścia, jest książka Gelmana i Hilla . Uważam, że jest to nawet lepsze niż zgłaszanie efektów marginalnych.
Jeśli chodzi o pytanie, jak uzyskać iloraz szans, oto jak możesz to zrobić w R:
źródło
Tylko w szczególnych przypadkach współczynniki i ich logi (ilorazy szans) są dobrym podsumowaniem. Dzieje się tak, gdy relacje są liniowe i istnieje jeden współczynnik powiązany z predyktorem, a zmiana o jedną jednostkę stanowi dobrą podstawę do obliczenia ilorazu szans (bardziej OK dla wieku, nie tyle dla liczby krwinek białych o zakresie 500–100 000). Ogólnie rzecz biorąc, przydatne są rzeczy takie jak iloraz szans między kwartylami. Mam więcej szczegółów na ten temat na stronie http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf, a
rms
pakiet R robi to wszystko automatycznie (obsługuje nieliniowe warunki i interakcje, oblicza kwartyle X, itp.).źródło
Prawdopodobnie zależy to od odbiorców i dyscypliny. Odpowiedź poniżej brzmi: co zwykle robi się w przypadku czasopism epidemiologicznych i, w mniejszym stopniu, czasopism medycznych.
Mówiąc wprost, nie dbamy o wartości p. Poważnie, my nie. Epidemiologia nie pozwala nawet na ich zgłaszanie, chyba że masz naprawdę pilną potrzebę, a dziedzina zasadniczo podąża za nimi.
W zależności od pytania możemy nawet nie przejmować się szacunkami wersji beta. Jeśli twój raport dotyczy czegoś bardziej metodologicznego lub symulacyjnego, prawdopodobnie zgłosiłbym oszacowanie beta i błąd standardowy. Jeśli próbujesz zgłosić efekt oszacowany w populacji, trzymałbym się współczynnika szans i 95% przedziału ufności. To podstawa twoich szacunków i tego, czego będą szukać czytelnicy w tej dziedzinie.
Odpowiedzi zostały opublikowane powyżej, jak uzyskać iloraz szans, ale dla OR i 95% CI:
źródło