Statystyki i duże zbiory danych

12
RMSProp i Adam vs SGD

Przeprowadzam eksperymenty na zestawie walidacyjnym EMNIST przy użyciu sieci z RMSProp, Adamem i SGD. Osiągam 87% dokładności dzięki SGD (współczynnik uczenia się 0,1) i porzucaniu (0,1 porzuceniu prob), a także regularyzacji L2 (kara 1e-05). Podczas testowania tej samej dokładnej konfiguracji z...

12
Jaki jest związek między ANOVA w celu porównania średnich z kilku grup a ANOVA w celu porównania modeli zagnieżdżonych?

Do tej pory widziałem ANOVA używaną na dwa sposoby: Po pierwsze , w moim tekście statystyki wprowadzającej ANOVA została wprowadzona jako sposób porównania średnich z trzech lub więcej grup, jako ulepszenie w porównaniu z parami, w celu ustalenia, czy jeden ze średnich ma statystycznie istotną...

12
Badacz 1 przeprowadza 1000 regresji, badacz 2 prowadzi tylko 1, oba osiągają takie same wyniki - czy powinny dokonywać różnych wniosków?

Wyobraź sobie, że badacz bada zbiór danych i przeprowadza 1000 różnych regresji i znajduje między nimi jedną interesującą relację. Teraz wyobraź sobie, że inny badacz z tymi samymi danymi wykonuje tylko 1 regresję i okazuje się, że jest to ta sama, którą drugi badacz wziął 1000 regresji, aby ją...

12
Czy to możliwe, że dwie Zmienne Losowe z tej samej rodziny dystrybucji mają takie same oczekiwania i wariancje, ale różne wyższe momenty?

Myślałem o znaczeniu rodziny o skali lokalizacji. Mi się, że dla każdego XXX członek lokalizacji skalę rodziny z parametrami położenie i b skalę, to dystrybucja Z = ( X - ) / b nie zależy od jakichkolwiek parametrów i jest taka sama dla każdego X należącego do rodzina.aaabbbZ=(X−a)/bZ=(X−a)/bZ...

12
Jak rygorystycznie uzasadnić wybrane fałszywie dodatnie / fałszywie ujemne poziomy błędu i leżący u ich podstaw stosunek kosztów?

Kontekst Grupa naukowców i statystów ( Benjamin i in., 2017 ) niedawno zasugerowała, że ​​typowy współczynnik fałszywie dodatnich ( = 0,05) stosowany jako próg dla określenia „istotności statystycznej” musi zostać dostosowany do bardziej konserwatywnego progu ( = .005). Konkurencyjna grupa...

12
Zrozumienie negatywnej regresji kalenicy

Szukam literatury na temat negatywnej regresji kalenicy . W skrócie, jest to uogólnienie regresji liniowej grzbiet wykluczających λλ\lambda we wzorze β^=(X⊤X+λI)−1X⊤y.β^=(X⊤X+λI)−1X⊤y.\hat\beta = ( X^\top X + \lambda I)^{-1} X^\top y.Przypadek pozytywny ma ładną teorię: jako funkcję straty, jako...