Statystyki i duże zbiory danych

14
Darmowy hosting danych w interesie publicznym? [Zamknięte]

Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 4 lata temu . Mam raporty godzinowe i dzienne temperatury dla wielu...

14
Obliczanie AUPR w R [zamknięte]

Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 8 miesięcy temu . Łatwo jest znaleźć obszar obliczania pakietu pod...

14
lub

Czy ktoś używa metryk L1L1L_1 lub L.5L.5L_.5 do grupowania, a nie L2L2L_2 ? Aggarwal i wsp., O zaskakującym zachowaniu wskaźników odległości w przestrzeni wielowymiarowej powiedział (w 2001) jest konsekwentnie bardziej preferowany niż metryczny euklidesowy wskaźnik odległości L 2 dla...

14
Jak dostroić wygładzanie w modelu GAM mgcv

Próbuję dowiedzieć się, jak kontrolować parametry wygładzania w modelu mgcv: gam. Mam zmienną dwumianową, którą próbuję zamodelować jako przede wszystkim funkcję współrzędnych xiy na ustalonej siatce plus kilka innych zmiennych o mniejszych wpływach. W przeszłości zbudowałem dość dobry model...

14
Przykłady eksploracji tekstu za pomocą R (pakiet tm)

Spędziłem trzy dni, bawiąc się tmpo przeczytaniu dokumentu roboczego przez znajomego, w którym zbadał korpus tekstowy za pomocą UCINET, pokazując chmury tekstowe, dwumodowe wykresy sieciowe i rozkład pojedynczej wartości (z grafiką, przy użyciu Staty). Wystąpiło wiele problemów: w systemie Mac OS X...

14
Jak zacząć czytać o eksploracji danych?

Jestem nowicjuszem, który zacznie czytać o eksploracji danych. Mam podstawową wiedzę na temat sztucznej inteligencji i statystyki. Ponieważ wielu twierdzi, że uczenie maszynowe odgrywa również ważną rolę w eksploracji danych, czy konieczne jest przeczytanie o uczeniu maszynowym, zanim będę mógł...

14
Jak korzystać z funkcji testu Levene'a w R?

Jestem nowicjuszem w statystyce i R i mam problem z używaniem funkcji Levene'a (chciałbym sprawdzić równość wariancji dwóch próbek). Dokumentacja mówi, że powinienem uruchomić: levene.test (y, grupa) Ale nie mam pojęcia, co powinienem umieścić jako y i grupę? Mam dwie różne próbki, z których...