Statystyki i duże zbiory danych

25
Lektura wprowadzająca na temat Copulas

Od pewnego czasu szukam dobrej lektury wprowadzającej na temat Copulas na moje seminarium. Znajduję wiele materiałów, które mówią o aspektach teoretycznych, co jest dobre, ale zanim przejdę do nich, staram się zbudować dobre intuicyjne zrozumienie tego tematu. Czy ktoś mógłby zasugerować jakieś...

25
Czy kod R jest produkcyjny (wdrożony)?

Przeczytałem wiele artykułów, które mówią o firmach takich jak Google, Facebook i wielu innych używających R. do badań. Innym scenariuszem, o którym czytałem, są firmy używające R do prototypowania rozwiązania analitycznego, a następnie ponownego wdrożenia go w innym języku. Próbuję znaleźć...

25
Wprowadzenie do analizy przyczynowej

Jakie są dobre książki, które wprowadzają analizę przyczynową? Mam na myśli wprowadzenie, które objaśnia zasady analizy przyczynowej i pokazuje, w jaki sposób można zastosować różne metody statystyczne do zastosowania tych

25
Jak Bayesianie porównują rozkłady?

Myślę więc, że dobrze rozumiem podstawy prawdopodobieństwa częstokroć i analizy statystycznej (i tego, jak bardzo można je wykorzystać). W świecie częstokroć sensowne jest zadawanie takiego pytania, jak: „czy ten rozkład różni się od tego rozkładu”, ponieważ zakłada się, że rozkłady są rzeczywiste,...

25
LSA vs. PCA (klastrowanie dokumentów)

Badam różne techniki stosowane w grupowaniu dokumentów i chciałbym wyjaśnić pewne wątpliwości dotyczące PCA (analiza głównego składnika) i LSA (utajona analiza semantyczna). Po pierwsze - jakie są między nimi różnice? Wiem, że w PCA rozkład SVD jest stosowany do macierzy kowariancji terminów,...

25
Rysunek z rozkładu Dirichleta

Załóżmy, że mamy rozkład Dirichleta z parametrem wektora wymiarowego . Jak narysować próbkę ( wektor wymiarowy) z tego rozkładu? Potrzebuję (możliwie) prostego wyjaśnienia.KKKα⃗ =[α1,α2,...,αK]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1,