Statystyki i duże zbiory danych

29
Rozróżnienie między dwiema grupami w statystyce i uczeniu maszynowym: test hipotez a klasyfikacja vs. grupowanie

Załóżmy, że mam dwie grupy danych, oznaczone A i B (każda zawiera np. 200 próbek i 1 cechę), i chcę wiedzieć, czy są one różne. Mógłbym: a) wykonać test statystyczny (np. test t), aby sprawdzić, czy są statystycznie różne. b) korzystać z nadzorowanego uczenia maszynowego (np. klasyfikatora...

29
Jaki jest sens analizy szeregów czasowych?

Jaki jest sens analizy szeregów czasowych? Istnieje wiele innych metod statystycznych, takich jak regresja i uczenie maszynowe, które mają oczywiste przypadki użycia: regresja może dostarczyć informacji na temat relacji między dwiema zmiennymi, podczas gdy uczenie maszynowe doskonale nadaje się do...

28
Jakie pakiety R są najbardziej przydatne w codziennej pracy?

Duplikat wątku: Właśnie zainstalowałem najnowszą wersję R. Jakie pakiety powinienem uzyskać? Jakie są pakiety R , których nie wyobrażasz sobie w codziennej pracy z danymi? Proszę wymienić zarówno ogólne, jak i szczegółowe narzędzia. AKTUALIZACJA: Jak na 24.10.10 ggplot2wydaje się być zwycięzcą z...

28
Jak reprezentować niezwiązaną zmienną jako liczbę między 0 a 1

Chcę reprezentować zmienną jako liczbę z przedziału od 0 do 1. Zmienna jest nieujemną liczbą całkowitą bez nieodłącznego wiązania. Odwzorowuję 0 na 0, ale co mogę odwzorować na 1 lub liczby od 0 do 1? Mógłbym użyć historii tej zmiennej, aby podać limity. Oznaczałoby to, że muszę powtórzyć stare...

28
Statystyki / Filmy prawdopodobieństwa dla początkujących

Pojawiła się już prośba o filmy ze statystykami matematycznymi , ale ludzie wyraźnie o to poprosili filmy, które zapewniają ścisłą matematyczną prezentację statystyk. tzn. filmy wideo, które mogą towarzyszyć kursowi z wykorzystaniem podręcznika wspomnianego w tej dyskusji na temat...

28
Jakie są alternatywy dla złamanych osi?

Użytkownicy często mają pokusę, aby przełamać wartości osi w celu prezentacji danych o różnych rzędach wielkości na tym samym wykresie (patrz tutaj ). Chociaż może to być wygodne, nie zawsze jest to preferowany sposób wyświetlania danych (w najlepszym przypadku może być mylący). Jakie są...

28
Jak zrobić zmniejszenie wymiarów w R.

Mam macierz, w której (i, j) mówi mi, ile razy przeglądałem stronę j. Istnieje 27 000 osób i 95 000 stron. Chciałbym mieć garść „wymiarów” lub „aspektów” w przestrzeni stron, które odpowiadałyby zestawom stron często oglądanych razem. Moim ostatecznym celem jest wtedy, aby móc obliczyć, jak często...

28
Ostrożnie o szeregach czasowych z R.

Jeśli cofniesz się wstecz, do momentu, kiedy zacząłeś od analizy szeregów czasowych. O jakich narzędziach, pakietach R i zasobach internetowych chciałbyś wiedzieć? Chciałem zapytać, od czego zacząć? W szczególności, czy istnieją jakieś zasoby dla R, które naprawdę sprowadzają go do tego, kto jest...