Czy istnieje sposób na określenie, które cechy / zmienne zestawu danych są najważniejsze / dominujące w ramach rozwiązania k-średnich
Czy istnieje sposób na określenie, które cechy / zmienne zestawu danych są najważniejsze / dominujące w ramach rozwiązania k-średnich
W moim rozumieniu „kontrola” może mieć dwa znaczenia w statystyce. Grupa kontrolna: W eksperymencie członek grupy kontrolnej nie jest leczony. Np .: Placebo vs. Lek: Dajesz leki jednej grupie, a nie drugiej (kontrola), co jest również określane jako „kontrolowany eksperyment”. Kontrola zmiennej:...
Pamiętam, że gdzieś w Internecie przeczytałem związek między regresją kalenicy (z regulacją ℓ2ℓ2\ell_2 ) a regresją PCA: podczas korzystania z regresji regulowanej z hiperparametrem , jeśli , to regresja jest równoważna usunięciu Zmienna PC o najmniejszej wartości...
Jestem epidemiologiem, który próbuje zrozumieć GEE w celu prawidłowej analizy badania kohortowego (używając regresji Poissona z łączem logarytmicznym, aby oszacować ryzyko względne). Mam kilka pytań dotyczących „korelacji roboczej”, które chciałbym wyjaśnić komuś bardziej kompetentnemu: (1) Jeśli...
Oszacowałem solidny model liniowy Rz wagami MM, korzystając z rlm()pakietu MASS. „R” nie podaje wartości dla modelu, ale chciałbym ją mieć, jeśli jest to znacząca ilość. Interesuje mnie również to, czy jest jakieś znaczenie posiadanie wartości która waży całkowitą i resztkową wariancję w taki sam...
Robię mistrza statystyki i radzę się uczyć geometrii różnicowej. Z przyjemnością dowiedziałbym się o zastosowaniach statystycznych w geometrii różnicowej, ponieważ to mnie zmotywowało. Czy ktoś zna aplikacje do geometrii różnicowej w
Wiem, że opadanie gradientu stochastycznego ma losowe zachowanie, ale nie wiem dlaczego. Czy jest na to jakieś
Próbuję zrozumieć, w jaki sposób regresja logistyczna wykorzystuje rozkład dwumianowy. Powiedzmy, że badam sukces gniazda u ptaków. Prawdopodobieństwo sukcesu gniazda wynosi 0,6. Korzystając z rozkładu dwumianowego, mogę obliczyć prawdopodobieństwo sukcesów na podstawie n prób (liczby badanych...
Widziałem wykres LDA (liniowa analiza dyskryminacyjna) z granicami decyzyjnymi z elementów uczenia statystycznego : Rozumiem, że dane są rzutowane na podprzestrzeń o niższych wymiarach. Chciałbym jednak wiedzieć, w jaki sposób uzyskujemy granice decyzji w oryginalnym wymiarze, tak że mogę rzutować...
Często słyszę ludzi rozmawiających o sieciach neuronowych jako czegoś w rodzaju czarnej skrzynki, której nie rozumiesz, co to znaczy lub co one oznaczają. Właściwie nie rozumiem, co przez to rozumieją! Jeśli rozumiesz, jak działa propagacja wsteczna, jak to jest czarna skrzynka? Czy oznaczają, że...
Chciałbym wiedzieć, czy logiczne jest przeprowadzanie analizy głównych składników (PCA) i eksploracyjnej analizy czynnikowej (EFA) na tym samym zbiorze danych. Słyszałem, że specjaliści wyraźnie zalecają: Zrozum, jaki jest cel analizy i wybierz PCA lub EFA do analizy danych; Po przeprowadzeniu...
Mam zmienną zależną od liczby porządkowej, łatwość, która waha się od 1 (niełatwo) do 5 (bardzo łatwo). Wzrost wartości niezależnych czynników jest związany ze zwiększoną oceną łatwości. Dwie moje niezależne zmienne ( condAi condB) są kategoryczne, każda z 2 poziomami, a 2 ( abilityA, abilityB) są...
Jak decydować o skośności, patrząc na wykres pudełkowy zbudowany z tych danych: 340, 300, 520, 340, 320, 290, 260, 330 Jedna z książek mówi: „Jeśli dolny kwartyl znajduje się dalej od mediany niż górny kwartyl, wówczas rozkład jest ujemnie wypaczony”. Kilka innych źródeł powiedziało mniej więcej...
To nie jest pytanie ściśle statystyczne - mogę przeczytać wszystkie podręczniki dotyczące założeń ANOVA - Staram się dowiedzieć, jak prawdziwi pracujący analitycy radzą sobie z danymi, które nie do końca spełniają założenia. Przeszedłem wiele pytań na tej stronie w poszukiwaniu odpowiedzi i ciągle...
Czytam artykuł, w którym autorzy prowadzą dyskusję o oszacowaniu maksymalnego prawdopodobieństwa do twierdzenia Bayesa, rzekomo jako wstęp dla początkujących. Jako przykład prawdopodobieństwa zaczynają się od rozkładu dwumianowego: p(x|n,θ)=(nx)θx(1−θ)n−xp(x|n,θ)=(nx)θx(1−θ)n−xp(x|n,\theta) =...
Terminologia tutaj to bałagan. „Równanie strukturalne” jest tak samo niejasne jak „most architektoniczny”, a „sieć bayesowska” nie jest z natury bayesowska . Co więcej, Judea Pearl , bóg przyczynowości, mówi, że obie szkoły modeli są prawie identyczne. Jakie są ważne różnice? (Zdumiewające dla...
Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Używam ggplot2 w R do tworzenia wykresów takich jak te: Paski błędów nakładają się na...
To jest konstruktywistyczna kontynuacja tego pytania . Jeśli nie możemy mieć dyskretnej jednorodnej zmiennej losowej mającej wszystkie racjonalności w przedziale [0,1][0,1][0,1] , to następną najlepszą rzeczą jest: Skonstruuj losową zmienną QQQ która ma to wsparcie, Q∈Q∩[0,1]Q∈Q∩[0,1]Q\in...
Jest to bardziej ogólne podejście do problemu postawionego przez to pytanie . Po uzyskaniu asymptotycznego rozkładu wariancji próbki, możemy zastosować metodę Delta, aby uzyskać odpowiedni rozkład dla odchylenia standardowego. Niech próbka wielkości nnn iid nietypowych zmiennych losowych...
Znormalizowałem mój zestaw danych, a następnie uruchomiłem 3-składnikowy PCA, aby uzyskać małe wyjaśnione współczynniki wariancji ([0,50, 0,1, 0,05]). Kiedy nie znormalizowałem, ale wybieliłem mój zestaw danych, a następnie uruchomiłem 3-składnikowy PCA, otrzymałem wysokie wyjaśnione współczynniki...