Statystyki i duże zbiory danych

20
Sparowany a niesparowany test t

Załóżmy, że mam 20 myszy. W jakiś sposób łączę myszy w pary, aby uzyskać 10 par. Na potrzeby tego pytania może to być przypadkowa para LUB może to być rozsądna para, na przykład próba sparowania myszy z tego samego miotu, tej samej płci, o podobnej wadze, LUB może to być celowo głupia para, taka...

20
Zagrożenie podstawowe Coxa

Powiedzmy, że mam zestaw danych „cewnika nerkowego”. Próbuję modelować krzywą przeżycia za pomocą modelu Coxa. Jeśli wezmę pod uwagę model Coxa: potrzebuję oszacowania podstawowego zagrożenia. Korzystając z wbudowanej funkcji pakietu R , mogę łatwo to zrobić w następujący sposób:h ( t , Z) =...

20
Test liniowej separowalności

Czy istnieje sposób przetestowania liniowej separowalności zestawu danych dwóch klas w dużych wymiarach? Moje wektory cech mają 40 długości. Wiem, że zawsze mogę przeprowadzać eksperymenty z regresją logistyczną i określać szybkość hitrate vs. fałszywego alarmu, aby stwierdzić, czy dwie klasy...

20
Jak interpretować termin przechwytywania w GLM?

Używam R i analizowałem moje dane za pomocą GLM z łączem dwumianowym. Chcę wiedzieć, jakie jest znaczenie przecięcia w tabeli wyjściowej. Punkt przecięcia dla jednego z moich modeli jest znacząco inny, jednak zmienna tak nie jest. Co to znaczy? Co to jest przechwycenie. Nie wiem, czy po prostu...