Jaka jest różnica między wariancją próbki a wariancją pobierania próbek? Wydają się takie same.
Jaka jest różnica między wariancją próbki a wariancją pobierania próbek? Wydają się takie same.
Powiedzmy, że mam duży zestaw wartości , które czasem się powtarzają. Chciałbym oszacować całkowitą liczbę unikalnych wartości w dużym zestawie.S.S.S Jeśli wezmę losową próbkę wartości, a także określić, że zawiera T Ü unikalne wartości, mogę to wykorzystać, aby oszacować liczbę unikatowych...
Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny,...
„Walidacja bootstrap” / „ponowna próbkowanie cross-validation” jest dla mnie nowa, ale została omówiona w odpowiedzi na to pytanie . Rozumiem, że dotyczy to 2 rodzajów danych: danych rzeczywistych i danych symulowanych, w których dany zestaw danych symulowanych jest generowany z danych...
Chciałem tylko zapytać, które według ciebie są najlepsze dostępne książki na temat bootstrapu. Rozumiem przez to niekoniecznie tylko ten napisany przez jego twórców. Czy możesz wskazać, który podręcznik jest dla Ciebie najlepszy dla bootstrapu, który spełnia następujące kryteria? Podstawa...
Szukam prostego sposobu na pobranie próbki z wielowymiarowej dystrybucji von Misesa-Fishera w Pythonie. Mam spojrzał w statystyki modułu w scipy i modułem numpy ale tylko znaleźć jednoczynnikowej dystrybucję von Misesa. Czy jest dostępny kod? Jeszcze nie znalazłem Najwyraźniej Wood (1994)...
Mam próbkę 100 punktów, które są ciągłe i jednowymiarowe. Oszacowałem jego nieparametryczną gęstość za pomocą metod jądra. Jak narysować losowe próbki z tego szacunkowego
Ostatnio szukałem sposobów na ponowne próbkowanie szeregów czasowych Zachowaj w przybliżeniu autokorelację długich procesów pamięci. Zachowaj domenę obserwacji (na przykład seria liczb całkowitych po ponownym próbkowaniu jest nadal serią liczb całkowitych). W razie potrzeby może wpływać tylko na...
Zauważam, że w metodach statystycznych / uczenia maszynowego rozkład jest często aproksymowany przez Gaussa, a następnie Gaussian jest wykorzystywany do próbkowania. Zaczynają od obliczenia pierwszych dwóch momentów rozkładu i wykorzystują je do oszacowania i . Następnie mogą pobrać próbki z tego...
Uderza mnie pozornie łatwy problem, ale od kilku tygodni nie znalazłem odpowiedniego rozwiązania. Mam całkiem sporo danych ankietowych / ankietowych (dziesiątki tysięcy respondentów, powiedzmy 50 tys. Na zbiór danych), pochodzących z czegoś, co, mam nadzieję, nazywa się kompleksowo zaprojektowaną...
Wydaje się, że istnieje wiele zamieszania w porównaniu używania glmnetwewnątrz w caretcelu znalezienia optymalnej lambdy i korzystania cv.glmnetz tego samego zadania. Zadano wiele pytań, np .: Model klasyfikacji train.glmnet vs. cv.glmnet? Jaki jest właściwy sposób używania glmnet z...
Ankiety tam (powiedzmy, Gallup) próbują absurdalnie małej liczby osób w porównaniu do wielkości populacji (np. Może tysiąc osób na setki milionów). Teraz, dla mnie, próbkowanie populacji jako sposób oszacowania statystyk populacji ma sens, gdy masz silny powód, by sądzić, że próbki są...
Szukam odpowiedniej struktury teoretycznej lub specjalizacji, która pomogłaby mi zrozumieć, jak radzić sobie z błędami, które ma system GPS - szczególnie podczas obchodzenia się z trasami. Zasadniczo szukam wymagań dotyczących danych i wszelkich algorytmów, które pozwolą ustalić długość śladu....
Czytając o przybliżeniu rozkładu próbki, natknąłem się na nieparametryczną metodę ładowania początkowego. Najwyraźniej można zbliżyć się do rozkładu przez podział ˉ X * n - ˉ X n , gdzie ˉ X * n oznacza średnią próbkę z próbki uruchamiającego.X¯n- μX¯n−μ\bar{X}_n-\muX¯∗n-...
Jeśli wszystko, co robisz, to ponowne próbkowanie z rozkładu empirycznego, dlaczego nie po prostu przestudiować rozkład empiryczny? Na przykład zamiast badać zmienność poprzez powtarzanie prób, dlaczego nie po prostu skwantyfikować zmienność z rozkładu
Mój pracodawca prowadzi obecnie ankietę dla całej firmy na temat stosunku do biura, tj. Sentymentu. W przeszłości otworzyli ankietę dla wszystkich obszarów działalności (Załóżmy 10 bardzo różnych działów) i wszystkich pracowników w nich zatrudnionych (Załóżmy łącznie 1000 pracowników w całej...
Próbkowanie z wymianą ma dwie zalety w porównaniu z próbkowaniem bez wymiany, tak jak to widzę: 1) Nie musisz się martwić o skończoną korektę populacji. 2) Istnieje szansa, że elementy z populacji zostaną narysowane wiele razy - wtedy możesz przetworzyć pomiary i zaoszczędzić czas. Oczywiście...
Powiedzmy, że mam populację 50 milionów unikalnych rzeczy i pobieram 10 milionów próbek (z wymianą) ... Pierwszy wykres, do którego załączyłem pokazuje, ile razy próbkuję tę samą „rzecz”, co jest stosunkowo rzadkie populacja jest większa niż moja próba. Jeśli jednak moja populacja liczy tylko 10...
Przez ostatni rok pracowałem nad dość istotnym pobieraniem próbek i mam kilka otwartych pytań, z którymi miałem nadzieję uzyskać pomoc. Moje praktyczne doświadczenie z ważnymi schematami pobierania próbek było takie, że czasami mogą one generować fantastyczne oszacowania niskiej wariancji i...
Z odpowiedzi z poprzedniego pytania skierowano mnie w stronę sekwencji Haltona, aby stworzyć zestaw wektorów, które pokrywają równomiernie jednolitą przestrzeń próbki. Ale strona wikipedia wspomina, że przede wszystkim wyższe liczby pierwsze są często silnie skorelowane na początku serii. Wydaje...