Statystyki i duże zbiory danych

22
Surowa czy ortogonalna regresja wielomianowa?

Chcę regresować zmienną na . Czy powinienem to zrobić przy użyciu surowych czy ortogonalnych wielomianów? Spojrzałem na pytanie na stronie, które się nimi zajmują, ale tak naprawdę nie rozumiem, jaka jest różnica między ich używaniem. yyyx , x2), … , X5x,x2),…,x5x,x^2,\ldots,x^5 Dlaczego nie mogę...

22
Jaki jest cel autokorelacji?

Dlaczego autokorelacja jest tak ważna? Zrozumiałem zasadę tego (tak sądzę ..), ale ponieważ istnieją też przykłady, w których nie dochodzi do autokorelacji, zastanawiam się: czy wszystko w naturze nie jest w jakiś sposób autokorelowane? Ostatni aspekt dotyczy bardziej ogólnego zrozumienia samej...

21
Pomiar podobieństwa dokumentu

Do grupowania dokumentów (tekstowych) potrzebny jest sposób pomiaru podobieństwa między parami dokumentów. Dwie alternatywy to: Porównaj dokumenty jako wektory terminów za pomocą podobieństwa Cosinus - i TF / IDF jako ważenia terminów. Porównaj rozkład prawdopodobieństwa każdego dokumentu za...

21
Jak rzutować nowy wektor na przestrzeń PCA?

Po przeprowadzeniu analizy głównego składnika (PCA) chcę rzutować nowy wektor na przestrzeń PCA (tzn. Znaleźć jego współrzędne w układzie współrzędnych PCA). Mam obliczony PCA w języku R użyciu prcomp. Teraz powinienem być w stanie pomnożyć mój wektor przez macierz obrotu PCA. Czy główne elementy...

21
Jak łatwo określić rozkład wyników dla wielu kości?

Chcę obliczyć rozkład prawdopodobieństwa dla sumy kombinacji kości. Pamiętam, że prawdopodobieństwo jest liczbą kombinacji, które sumują tę liczbę w stosunku do całkowitej liczby kombinacji (zakładając, że kości mają równomierny rozkład). Jakie są formuły Łączna liczba kombinacji Liczba...