Statystyki i duże zbiory danych

10
Problemy z pułapką zmiennej manekina

Korzystam z dużej regresji OLS, w której wszystkie zmienne niezależne (około 400) są zmiennymi obojętnymi. Jeśli wszystkie są uwzględnione, istnieje doskonała wielokoliniowość (pułapka zmiennej manekina), więc muszę pominąć jedną ze zmiennych przed uruchomieniem regresji. Moje pierwsze pytanie...

10
Jak rozpoznać, czy dobre wyniki występują w seriach?

Rozwiązuję kostki Rubika jako hobby. Rejestruję czas, jaki zajęło mi rozwiązanie kostki za pomocą jakiegoś oprogramowania, więc teraz mam dane z tysięcy rozwiązań. Dane są w zasadzie długą listą liczb reprezentujących czas potrzebny na każde kolejne rozwiązanie (np. 22.11, 20.66, 21.00, 18.74,...

10
Generowanie losowych wektorów z ograniczeniami

Muszę utworzyć losowe wektory liczb rzeczywistych, spełniające następujące ograniczenia: abs(a_i) < c_i; sum(a_i)< A; # sum of elements smaller than A sum(b_i * a_i) < B; # weighted sum is smaller than B aT*A*a < D # quadratic multiplication with A smaller than D where c_i, b_i, A,...

10
Wykryj wzory kołowe w danych chmury punktów

W przypadku niektórych algorytmów rekonstrukcji objętości, nad którymi pracuję, muszę wykryć dowolną liczbę wzorów kołowych w danych punktów 3d (pochodzących z urządzenia LIDAR). Wzory mogą być dowolnie zorientowane w przestrzeni i można założyć, że leżą (choć nie idealnie) w cienkich płaszczyznach...

10
Wybierz poziom czynnika jako podstawa manekina w lm () w R

Powiedzmy, że regresuję Y na X1 i X2, gdzie X1 jest zmienną numeryczną, a X2 jest czynnikiem o czterech poziomach (A: D). Czy jest jakiś sposób na zapisanie funkcji regresji liniowej lm(Y ~ X1 + as.factor(X2)), abym mógł wybrać konkretny poziom X2 - powiedzmy B - jako linię...

10
Łączenie prawdopodobieństw awarii jądrowych

Ostatnie wydarzenia w Japonii skłoniły mnie do przemyślenia następujących kwestii. Instalacje nuklearne są zwykle zaprojektowane tak, aby ograniczyć ryzyko poważnych wypadków do „prawdopodobieństwa podstawy projektu”, na przykład 10E-6 / rok. To są kryteria dla jednego zakładu. Jednakże, gdy jest...

10
Równoważenie pakietu karetki za pomocą doSMP

AKTUALIZACJA: daszek używa teraz foreachwewnętrznie, więc to pytanie nie jest już tak naprawdę istotne. Jeśli możesz zarejestrować działający backend równoległy foreach, Caret go użyje. Mam pakiet karetki dla R i jestem ciekawy w użyciu trainfunkcji do krzyżowej weryfikacji moich modeli. Chcę...

10
Testowanie hipotez na ciągłych danych o zerowym napompowaniu

Byłbym bardzo wdzięczny za twoje porady dotyczące następującego problemu: Mam duży ciągły zestaw danych z dużą ilością zer (~ 95%) i muszę znaleźć najlepszy sposób, aby sprawdzić, czy niektóre jego podzbiory są „interesujące”, tj. Nie wydają się pochodzić z tego samego rozkładu co reszta. Zero...

10
Encyklopedia graficzna

Muszę zbudować aplikację internetową dla wielu użytkowników, która dotyczy pomiarów ruchu, prognoz itp. W tym momencie wiem, że będę korzystać z wykresów słupkowych i kołowych. Niestety te typy wykresów nie są bogate w wyrażanie wszystkich danych, które zbieram i obliczam. Szukam kolekcji...