Statystyki i duże zbiory danych

21
Wydajne obliczanie macierzy odwrotnej w R

Muszę obliczyć macierz odwrotnie i używam solvefunkcji. Chociaż działa dobrze na małych matrycach, solvezwykle działa bardzo wolno na dużych matrycach. Zastanawiałem się, czy jest jakaś inna funkcja lub kombinacja funkcji (poprzez SVD, QR, LU lub inne funkcje dekompozycji), które mogą dać mi...

21
Jaka jest klątwa wymiarowości?

W szczególności szukam odniesień (artykułów, książek), które rygorystycznie pokażą i wyjaśnią przekleństwo wymiarowości. Pytanie to pojawiło się po tym, jak zacząłem czytać białą księgę autorstwa Lafferty i Wassermana. W akapicie trzecim wspominają o „dobrze znanym” równaniu, które implikuje, że...

21
Co oznacza „bezstronność”?

Co to znaczy powiedzieć, że „wariancja jest tendencyjnym estymatorem”. Co to znaczy przekonwertować tendencyjne oszacowanie na obiektywne oszacowanie za pomocą prostej formuły. Co dokładnie robi ta konwersja? Jakie jest praktyczne zastosowanie tej konwersji? Czy przeliczasz te wyniki, używając...

21
Regresja vs. rozbieżność ANOVA (aov vs lm w R)

Zawsze miałem wrażenie, że regresja jest po prostu bardziej ogólną formą ANOVA i że wyniki będą identyczne. Ostatnio jednak uruchomiłem zarówno regresję, jak i ANOVA dla tych samych danych, a wyniki różnią się znacznie. Oznacza to, że w modelu regresji zarówno główne efekty, jak i interakcja są...

21
Przykłady problemów z ukrytymi modelami Markowa?

Przeczytałem sporo ukrytych modeli Markowa i sam byłem w stanie napisać całkiem podstawową wersję. Są jednak dwa główne sposoby, których się uczę. Jednym z nich jest przeczytanie i zaimplementowanie go w kodzie (co jest zrobione), a drugim zrozumienie, w jaki sposób ma zastosowanie w różnych...

21
Nowoczesne sieci neuronowe, które budują własną topologię

Ograniczenia standardowych algorytmów sieci neuronowej (takich jak backprop) są takie, że musisz podjąć decyzję projektową, ile ukrytych warstw i neuronów na warstwę chcesz. Zwykle szybkość uczenia się i uogólnienie są bardzo wrażliwe na te wybory. Z tego powodu algorytmy sieci neuronowej, takie...

21
„Intencja badacza” i progi / wartości p

Czytam slajdy „Doing Bayesian Data Analysis” Johna Kruschkego , ale tak naprawdę mam pytanie o jego interpretację testów t i / lub całą strukturę testowania znaczenia hipotezy zerowej. Twierdzi, że wartości p są źle zdefiniowane, ponieważ zależą od intencji badacza. W szczególności podaje przykład...

21
Kiedy Markowa pól losowych

W swoim podręczniku, graficznych modelach rodziny wykładniczej i wariacyjne Inference , M. Jordana i M. Wainwright omówić związek między rodzinami wykładnicze i Markowa pól losowych (nieukierunkowane modeli graficznych). Staram się lepiej zrozumieć związek między nimi za pomocą następujących...