Statystyki i duże zbiory danych

43
Kompendium technik walidacji krzyżowej

Zastanawiam się, czy ktoś wie o kompendium technik walidacji krzyżowej z dyskusją na temat różnic między nimi i wskazówką, kiedy stosować każdą z nich. Wikipedia ma listę najpopularniejszych technik, ale jestem ciekawy, czy istnieją inne techniki i czy istnieją dla nich taksonomie. Na przykład po...

43
Jak porównać statystycznie dwie serie czasowe?

Mam dwie serie czasowe pokazane na poniższym wykresie: Fabuła pokazuje pełny szczegół obu serii czasowych, ale w razie potrzeby mogę łatwo sprowadzić je do obserwacji zbieżnych. Moje pytanie brzmi: jakich metod statystycznych mogę użyć do oceny różnic między szeregami czasowymi? Wiem, że jest...

43
Losowe założenia lasu

Jestem trochę nowym przypadkowym lasem, więc wciąż mam problemy z podstawowymi pojęciami. W regresji liniowej zakładamy niezależne obserwacje, stałą wariancję… Jakie są podstawowe założenia / hipotezy, kiedy korzystamy z losowego lasu? Jakie są kluczowe różnice między losowymi lasami a...

43
Czy można interpretować bootstrap z perspektywy Bayesa?

Ok, to pytanie podtrzymuje mnie w nocy. Czy procedurę ładowania początkowego można interpretować jako przybliżenie niektórych procedur bayesowskich (z wyjątkiem ładowania początkowego bayesowskiego)? Bardzo podoba mi się „interpretacja” statystyki bayesowskiej, którą uważam za całkiem spójną i...

43
Warstwa Softmax w sieci neuronowej

Próbuję dodać warstwę softmax do sieci neuronowej wyuczonej z propagacji wstecznej, więc próbuję obliczyć jej gradient. Wyjście softmax to gdzie jest wyjściowym numerem neuronu.hj=ezj∑ezihj=ezj∑ezih_j = \frac{e^{z_j}}{\sum{e^{z_i}}}jjj Jeśli to uzyskam, to

43
Czy CDF są bardziej fundamentalne niż pliki PDF?

Moja stat prof w zasadzie powiedziała, że ​​jeśli otrzyma się jedną z następujących trzech, można znaleźć dwie pozostałe: Funkcja rozkładu skumulowanego Funkcja generowania momentu Funkcja gęstości prawdopodobieństwa Ale mój profesor ekonometrii powiedział, że CDF są bardziej fundamentalne...

43
Czy uczenie maszynowe może dekodować skróty SHA256?

Mam 64-znakowy skrót SHA256. Mam nadzieję wytrenować model, który może przewidzieć, czy tekst jawny użyty do wygenerowania skrótu zaczyna się od 1, czy nie. Niezależnie od tego, czy jest to „możliwe”, jaki algorytm byłby najlepszy? Moje początkowe przemyślenia: Wygeneruj dużą próbkę skrótów...