Właśnie przeprowadziłem analizę moich danych przy użyciu regresji logistycznej, ale w raporcie muszę też mieć opisową część dotyczącą statystyki. Naprawdę nie rozumiem w tym sensu i miałem nadzieję, że ktoś może wyjaśnić, dlaczego jest to konieczne.
Na przykład, jeśli wykreślę histogram jednej z moich niezależnych zmiennych ciągłych, która pokazuje normalność lub skośność, w jaki sposób doda to jakąkolwiek wartość do raportu?
Moje dane obejmują zmienną zależną prawda lub fałsz w znalezieniu pracy, a zmienną niezależną są oceny w połowie semestru, oceny z egzaminów końcowych oraz mężczyźni lub kobiety.
descriptive-statistics
reporting
użytkownik3223190
źródło
źródło
Odpowiedzi:
W mojej dziedzinie opisowa część raportu jest niezwykle ważna, ponieważ określa kontekst dla uogólnienia wyników. Na przykład badacz chce zidentyfikować predyktory urazowego uszkodzenia mózgu po wypadkach motocyklowych w próbce ze szpitala. Jej zmienna zależna jest binarna i miała szereg zmiennych niezależnych. Wielowymiarowa regresja logistyczna pozwoliła jej na następujące ustalenia:
Żeby było jasne, nie było problemów z modelowaniem. Koncentrujemy się na wartości, którą statystyki opisowe mogą dodać.
Bez statystyki opisowej czytelnik nie może spojrzeć na te ustalenia z perspektywy. Czemu? Pokażę ci statystyki opisowe:
Z powyższego widać, że jej próbka składała się ze starszych, odurzonych mężczyzn. Dzięki tym informacjom czytelnik może powiedzieć, co, jeśli w ogóle, te wyniki mogą powiedzieć o urazach u młodych mężczyzn lub urazach u nietrzeźwych jeźdźców lub kobiet.
Proszę nie ignorować statystyk opisowych.
źródło
Celem dostarczenia statystyk opisowych jest scharakteryzowanie próby, aby osoby w innych ośrodkach lub krajach mogły ocenić, czy wyniki uogólniają się w zależności od ich sytuacji. W twoim przypadku zestawienie płci, ocen itd. Byłoby korzystnym dodatkiem do regresji logistycznej. Nie ma to na celu umożliwienia sprawdzania twoich założeń, chociaż oni też mogą próbować to zrobić.
============== Edytuj, aby podać linki do niektórych wskazówek dotyczących zdrowia
W dziedzinie, którą znam, zdrowie, istnieją szczegółowe wytyczne dotyczące raportowania. Zostały one zebrane razem w sieci EQUATOR, z którą należy się zapoznać w celu uzyskania aktualnych szczegółów.
Jako przykład możemy wziąć próby kliniczne, w których odpowiednią wytyczną jest CONSORT. W dokumencie przedstawiającym wytyczne dostępne tutaj i gdzie indziej czytamy w Tabeli 1 zalecenie 15 „Tabela pokazująca podstawowe cechy demograficzne i kliniczne dla każdej grupy”.
Istnieją podobne zalecenia dla innych rodzajów badań.
źródło
Inną rzeczą jest pokazanie, jak dobrze zachowujesz się w zmiennych. Jeśli, na przykład, jedną z twoich zmiennych jest wynagrodzenie i przeprowadziłeś wywiad dokładnie z jednym miliarderem, to kiedy wprowadzisz jego wynagrodzenie do regresji logistycznej, dominuje nad wszystkim innym, więc prawdopodobnie nauczysz się ignorować wynagrodzenie, niezależnie od ile może zawierać rzeczywistych informacji.
Niektóre metody są bardziej wrażliwe niż inne na skośność i ekstremalne wartości, a regresja logistyczna jest raczej po stronie wrażliwej. Oczywiście ostateczny dowód znajduje się w puddingu i można porównać wyniki uzyskane z surowymi danymi lub z każdą cechą przekształconą w kierunku normalności.
źródło
Część opisowa pomaga zrozumieć czytelnikowi twój zestaw danych. W zastosowanym ekonie jest to zwykle wysoce zalecane, ponieważ może wykazać pierwsze potencjalne wady analizy.
Możesz użyć danych z różnych źródeł, aby wysunąć swoje opisy.
1 stół powinien wystarczyć. Ten, który załączyłeś, nie jest bardzo intuicyjny.
źródło