Statystyki i duże zbiory danych

13
Analizuj proporcje

Mam zestaw danych zawierający wiele proporcji, które sumują się do 1. Jestem zainteresowany zmianą tych proporcji wzdłuż gradientu (patrz na przykład dane poniżej). gradient <- 1:99 A1 <- gradient * 0.005 A2 <- gradient * 0.004 A3 <- 1 - (A1 + A2) df <- data.frame(gradient =...

13
Sekwencja Haltona vs sekwencja Sobola?

Z odpowiedzi z poprzedniego pytania skierowano mnie w stronę sekwencji Haltona, aby stworzyć zestaw wektorów, które pokrywają równomiernie jednolitą przestrzeń próbki. Ale strona wikipedia wspomina, że ​​przede wszystkim wyższe liczby pierwsze są często silnie skorelowane na początku serii. Wydaje...

13
Problem z e1071 libsvm?

Mam zestaw danych z dwiema nakładającymi się klasami, po siedem punktów w każdej klasie, punkty są w przestrzeni dwuwymiarowej. W R i biegnę svmz e1071pakietu, aby zbudować oddzielną hiperpłaszczyznę dla tych klas. Używam następującego polecenia: svm(x, y, scale = FALSE, type = 'C-classification',...

13
Ruby jako stół roboczy statystyk

To pytanie dotyczy również Pythona jako stołu roboczego statystyk i przoduje jako stół roboczy statystyk . Wiem, że istnieje ogromna dyskusja na temat Ruby kontra Python, ale nie o to chodzi w tym pytaniu. Pomyślałem, że Ruby jest szybszy od Pythona i ma bardzo naturalną składnię, co może pomóc mi...

13
Dwuwymiarowy Kołmogorow-Smirnov

Chciałbym przeprowadzić kilka dwuwymiarowych testów Kołmogorowa-Smironowa, aby ustalić, czy rozkład dwuwymiarowy pasuje do odniesienia. Czy jest jakiś pakiet lub aplikacja, z której mógłbym korzystać w stosunkowo prosty sposób? Czy istnieje inny preferowany algorytm? Mam tylko podstawową wiedzę...

13
Co to są testy porcji?

W odpowiedzi na pytanie o wybór modelu w obecności Współliniowość , Frank Harrell zaproponował : Umieść wszystkie zmienne w modelu, ale nie testuj wpływu jednej zmiennej skorygowanej o skutki zmiennych konkurujących ... Testy fragmentów zmiennych konkurencyjnych są potężne, ponieważ zmienne...

13
Dlaczego podniesienie kwadratu

To może być podstawowe pytanie, ale zastanawiałem się, dlaczego wartość w modelu regresji może być po prostu podniesiona do kwadratu, aby uzyskać wartość wyjaśnionej wariancji?RRR Rozumiem, że współczynnik może dać siłę związku, ale nie rozumiem, jak proste podniesienie tej wartości do kwadratu...