Statystyki i duże zbiory danych

13
Jak powinienem sprawdzić założenie liniowości logitu dla ciągłych zmiennych niezależnych w analizie regresji logistycznej?

Jestem mylony z założeniem liniowości logitu dla ciągłych zmiennych predykcyjnych w analizie regresji logistycznej. Czy musimy sprawdzać zależność liniową podczas przeszukiwania potencjalnych predyktorów przy użyciu analizy regresji logistycznej z jedną zmienną? W moim przypadku używam analizy...

13
Co to za wykres?

Przepraszamy za niejasne pytanie, ale ta tabela pojawia się w Biddle i in. 2009 i wcześniej nie spotkałem czegoś takiego. To wykres słupkowy ze ściętymi krawędziami, czasem „rogami”. Co to znaczy? Czy ten typ wykresu ma nazwę? Według /meta/244083/site-for-asking-about-charts pomyślałem, że...

13
Średnia wartość wybranej matrycy z nieskończonej serii rolek

Jeśli rzuciłem parę kostek nieskończoną liczbę razy i zawsze wybieram wyższą z nich, czy oczekiwana średnia z najwyższych wartości przekroczy 3,5? Wydaje się, że musi tak być, ponieważ gdybym rzucił milion kości i wybrał najwyższą wartość za każdym razem, szanse są ogromne, że szóstki byłyby...

13
Co to jest próg optymalny F1? Jak to obliczyć?

Użyłem funkcji h2o.glm () w R, która daje tabelę zdarzeń w wyniku wraz z innymi statystykami. Tabela awaryjna nosi tytuł „ Tabulator krzyżowy oparty na optymalnym progu F1 ” Wikipedia definiuje Wynik F1 lub Wynik F jako średnią harmoniczną precyzji i przywołania. Ale nie można znaleźć Precyzji i...

13
Kursy są proste

Mam problem ze zrozumieniem szans i chciałbym tylko podstawowe wyjaśnienie, jak je interpretować. Znalazłem różne posty związane z kursami, ale większość z nich jest bardziej złożona niż to, co próbuję zrozumieć. Oto przykład, w jaki sposób interpretuję szanse: jeśli szanse na wydarzenie wynoszą...