Statystyki i duże zbiory danych

12
Techniki postępowania z niekompletnymi / brakującymi danymi

Moje pytanie dotyczy technik radzenia sobie z niekompletnymi danymi podczas szkolenia / dopasowania / klasyfikacji klasyfikatora / modelu. Na przykład w zestawie danych zawierającym kilkaset wierszy, z których każdy ma powiedzmy pięć wymiarów i etykietę klasy jako ostatni element, większość...

12
Statystyki oparte na matematyce fraktalnej

Szukam książek / podręczników dotyczących statystyki opartej na matematyce fraktalnej. Wiem, że nie jest to zbyt dobrze znany obszar i raczej trudno jest znaleźć dobrą literaturę. Wszelkie sugestie są mile widziane (książki, podręczniki, materiały

12
Adaptacyjne estymatory gęstości jądra?

Czy ktoś może poinformować o swoich doświadczeniach z adaptacyjnym estymatorem gęstości jądra? (Istnieje wiele synonimów: adaptacyjny | zmienny | zmienna szerokość, KDE | histogram | interpolator ...) Zmienne oszacowanie gęstości jądra mówi: „zmieniamy szerokość jądra w różnych regionach...

12
Analiza przedmiotu dla początkującego R.

Próbuję ocenić 20-elementowy test wielokrotnego wyboru. Chcę przeprowadzić analizę przedmiotu, taką jak w tym przykładzie . Tak więc dla każdego pytania chcę wartość P i korelację z sumą oraz rozkład wybranych opcji. Nie wiem nic o różnych pakietach oprogramowania statystycznego, ale chciałbym...

12
Jak pobrać wiele próbek 10 z dużej listy, bez ogólnej wymiany

Mam duży zestaw danych (20 000 punktów danych), z których chcę pobrać powtarzane próbki 10 punktów danych. Jednak po wybraniu tych 10 punktów danych chcę, aby nie były ponownie wybierane. Próbowałem użyć tej samplefunkcji, ale wydaje się, że nie ma opcji próbkowania bez zamiany przez wiele wywołań...

12
Aktualizacja dopasowania lasso o nowe obserwacje

Dopasowuję regresję liniową regulowaną przez L1 do bardzo dużego zestawu danych (z n >> p.) Zmienne są znane z góry, ale obserwacje pojawiają się w małych porcjach. Chciałbym utrzymać dopasowanie lasso po każdym kawałku. Mogę oczywiście dopasować cały model po obejrzeniu każdego nowego...

12
Jak korzystać ze statystyk CDF i PDF do analizy

To może być zbyt ogólne pytanie, ale mam nadzieję, że znajdę tutaj pomoc. Zaczynam pracę RA na mojej uczelni, a mój temat będzie związany z analizą ruchu w Internecie. Jestem całkiem nowy w świecie analiz, ale sądzę, że w świecie badań to właśnie muszę robić dużo. Przejrzałem kilka artykułów i w...

12
Lepsza klasyfikacja domyślna w regresji logistycznej

Pełne ujawnienie: To zadanie domowe. Zamieściłem link do zestawu danych ( http://www.bertelsen.ca/R/logistic-regression.sav ) Moim celem jest zmaksymalizowanie prognozy osób spłacających zaległości kredytowe w tym zbiorze danych. Każdy model, który do tej pory wymyśliłem, przewiduje> 90%...

12
Jak obliczyć oczekiwanie na ?

Jeśli jest wykładniczo rozłożone z parametrem i są wzajemnie niezależne, to czego oczekujemyXiXiX_iλ X i(i=1,...,n)(i=1,...,n)(i=1,...,n)λλ\lambdaXiXiX_i (∑i=1nXi)2(∑i=1nXi)2 \left(\sum_{i=1}^n {X_i} \right)^2 pod względem i i ewentualnie innych stałych?λnnnλλ\lambda Uwaga: to pytanie ma...