Statystyki i duże zbiory danych

16
tanh vs. sigmoid w sieci neuronowej

Z góry przepraszam za to, że wciąż przyspieszam. Próbuję zrozumieć zalety i wady używania tanh (mapa -1 do 1) vs. sigmoid (mapa 0 do 1) dla mojej funkcji aktywacji neuronu. Z mojego czytania zabrzmiało to jak drobna rzecz z marginalnymi różnicami. W praktyce dla moich problemów uważam, że sigmoid...

16
Czym dokładnie jest dystrybucja?

Bardzo mało wiem na temat prawdopodobieństwa i statystyki i chcę się uczyć. Widzę słowo „dystrybucja” używane wszędzie w różnych kontekstach. Na przykład dyskretna zmienna losowa ma „rozkład prawdopodobieństwa”. Wiem co to jest. Ciągła zmienna losowa ma funkcję gęstości prawdopodobieństwa, a zatem...

16
Pakiet R dla Weighted Random Forest? opcja classwt?

Próbuję użyć Losowego Lasu, aby przewidzieć wynik bardzo niezrównoważonego zestawu danych (wskaźnik klasy mniejszości wynosi około 1% lub nawet mniej). Ponieważ tradycyjny algorytm losowego lasu minimalizuje ogólny poziom błędu, zamiast zwracać szczególną uwagę na klasy mniejszości, nie ma...

16
Interpretacja przedziału ufności

Uwaga: z góry przepraszam, jeśli jest to duplikat, nie znalazłem podobnego q w moim wyszukiwaniu Powiedzmy, że mamy prawdziwy parametr p. Przedział ufności C (X) to RV, który zawiera p, powiedzmy 95% czasu. Załóżmy teraz, że obserwujemy X i obliczamy C (X). Częstą odpowiedzią wydaje się być to, że...