Statystyki i duże zbiory danych

9
1D Konwolucja w sieciach neuronowych

Rozumiem, jak działa splot, ale nie rozumiem, w jaki sposób splot 1D jest stosowany do danych 2D. W tym przykładzie widać splot 2D w danych 2D. Ale jak by to było, gdyby był splot 1D? Tylko jądro 1D przesuwa się w ten sam sposób? A jeśli krok miał 2? Dziękuję

9
Przewidywanie zaufania do sieci neuronowej

Przypuśćmy, że chcę wytrenować głęboką sieć neuronową do przeprowadzania klasyfikacji lub regresji, ale chcę wiedzieć, jak pewne będą prognozy. Jak mogłem to osiągnąć? Moim pomysłem jest obliczenie entropii krzyżowej dla każdego układu odniesienia na podstawie wyników jego prognozowania w...

9
Co wskazuje na kształt klina wykresu PCA?

W swojej pracy w autoencoders do klasyfikacji tekst Hinton i Salakhutdinov wykazały wykres wytwarzanego przez 2 wymiarowe LSA (co jest ściśle związane z PCA) . Stosując PCA do absolutnie różnych nieco nieco wymiarowych danych, otrzymałem podobnie wyglądający wykres: (z wyjątkiem tego przypadku...

9
Czy estymatory drzew ZAWSZE są stronnicze?

Odrabiam pracę domową na drzewach decyzyjnych, a jedno z pytań, na które muszę odpowiedzieć, brzmi: „Dlaczego estymatory zbudowane są z drzew tendencyjnych i jak workowanie pomaga zmniejszyć ich wariancję?”. Wiem teraz, że przeregulowane modele mają tendencję do bardzo niskiego odchylenia,...

9
Moc eksperymentu z herbatą

W słynnym eksperymencie Fishera obserwowalna jest liczba poprawionych zgadywanych filiżanekkkk mając dwa rodzaje filiżanek ZAZAA i bbB. Zwykle interesujące jest obliczenie obszaru krytycznego, aby odrzucić hipotezę zerową (dama losowo zgaduje), biorąc pod uwagę wielkość testu . Można to łatwo...

9
Jak poprawić czas działania imputacji danych R MICE

Moje pytanie w skrócie: czy istnieją metody poprawy czasu działania R MICE (imputacja danych)? Pracuję z zestawem danych (30 zmiennych, 1,3 miliona wierszy), który zawiera (dość losowo) brakujące dane. Około 8% obserwacji w około 15 z 30 zmiennych zawiera NA. Aby przypisać brakujące dane,...

9
Dlaczego stopnie swobody dla dopasowanych par

Jestem przyzwyczajony do znajomości „stopni swobody” jako n−rn−rn - r, gdzie masz model liniowy z \ mathbf {y} \ in \ mathbb {R} ^ n , \ mathbf { X} \ in M_ {n \ times p} (\ mathbb {R}) macierz projektowa z rangą r , \ boldsymbol {\ beta} \ in \ mathbb {R} ^ p , \ boldsymbol {\ epsilon} \ in \...