Analizuję zestaw danych przy użyciu modelu efektów mieszanych z jednym ustalonym efektem (warunkiem) i dwoma efektami losowymi (uczestnik ze względu na projekt i parę wewnątrz przedmiotu). Model ten został wygenerowany z lme4pakietu:
Analizuję zestaw danych przy użyciu modelu efektów mieszanych z jednym ustalonym efektem (warunkiem) i dwoma efektami losowymi (uczestnik ze względu na projekt i parę wewnątrz przedmiotu). Model ten został wygenerowany z lme4pakietu:
Czy regresja zredukowana rangi i regresja głównych składników to tylko szczególne przypadki częściowych najmniejszych kwadratów? Ten samouczek (strona 6, „Porównanie celów”) stwierdza, że kiedy wykonujemy częściowe najmniejsze kwadraty bez rzutowania X lub Y (tj. „Nie częściowy”), staje się...
Potrzebuję trochę pomocy w odzyskaniu danych z kwestionariusza. Jeden z moich kolegów zastosował kwestionariusz, ale nieumyślnie, zamiast skorzystać z oryginalnej 5-punktowej skali Likerta (zdecydowanie nie zgadzam się zdecydowanie), wstawił szóstą odpowiedź do skali. I, co gorsza, szósta opcja...
Czy istnieje jakieś intuicyjne wyjaśnienie tej terminologii? Dlaczego tak jest, a nie predyktor (y) są regresowane w wyniku? Mam nadzieję, że właściwe wyjaśnienie, dlaczego taka terminologia istnieje, pomoże uczniom zapamiętać ją i powstrzymać przed powiedzeniem jej w niewłaściwy...
(Pierwotnie opublikowane na MSE.) Widziałem wiele heurystycznych dyskusji na temat klasycznego centralnego twierdzenia granicznego mówiących o rozkładzie normalnym (lub dowolnym rozkładzie stabilnym) jako „atraktorze” w przestrzeni gęstości prawdopodobieństwa. Weźmy na przykład następujące zdania...
Dlaczego test F dla różnicy wariancji jest tak wrażliwy na założenie rozkładu normalnego, nawet dla dużego ?NNN Próbowałem przeszukać sieć i odwiedziłem bibliotekę, ale żadna z nich nie dała dobrych odpowiedzi. Mówi, że test jest bardzo wrażliwy na naruszenie założenia normalnej dystrybucji, ale...
Jestem zdezorientowany co do równania, które służy jako definicja współczynnika ryzyka. Rozumiem, jaki jest współczynnik ryzyka, ale po prostu nie widzę, jak równanie wyraża tę intuicję. Jeśli jest zmienną losową, która reprezentuje moment śmierci kogoś w przedziale czasu . Zatem współczynnik...
Wiemy zatem, że suma nnn poissonów o parametrze λλ\lambda jest sama w sobie poissonem o nλnλn\lambda . Tak więc teoretycznie może przyjąć x∼poisson(λ=1)x∼poisson(λ=1)x \sim poisson(\lambda = 1) i powiedzieć, że jest w rzeczywistości ∑n1xi∼poisson(λ=1)∑1nxi∼poisson(λ=1)\sum_1^n x_i \sim...
Próbuję zrozumieć ogólne zastosowanie RNN do znakowania sekwencji za pomocą (między innymi) artykułu Gravesa z 2005 r. Na temat klasyfikacji fonemów. Podsumowując problem: Mamy duży zestaw szkoleniowy składający się z (wejściowych) plików audio z pojedynczych zdań i (wyjściowych) opatrzonych...
Staram się odtworzyć z optimwynikami prostej regresji liniowej zaopatrzonej glmlub nawet nlsfunkcje R. Oszacowania parametrów są takie same, ale oszacowanie wariancji rezydualnej i błędy standardowe innych parametrów nie są takie same, szczególnie gdy wielkość próby jest niska. Przypuszczam, że...
Skonstruowałem krzywą ROC dla systemu diagnostycznego. Pole pod krzywą zostało następnie oszacowane nieparametrycznie na AUC = 0,89. Kiedy próbowałem obliczyć dokładność przy optymalnym ustawieniu progu (punkt najbliższy punktowi (0, 1)), dostałem dokładność układu diagnostycznego na 0,8, czyli...
W jaki sposób randomForestpakiet szacuje prawdopodobieństwa klasowe, kiedy używam predict(model, data, type = "prob")? Użyłem rangerdo szkolenia losowych lasów, używając probability = Targumentu do przewidywania prawdopodobieństw. rangermówi w dokumentacji, że: Wyhoduj las prawdopodobieństwa,...
W regresji liniowej (strata kwadratowa) za pomocą macierzy mamy bardzo zwięzłą notację dla celu minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Gdzie AAA to macierz danych, xxx to współczynniki, a bbb to odpowiedź. Czy istnieje podobna notacja macierzowa dla celu regresji...
Tło: Wydaje się, że wiele współczesnych badań w ciągu ostatnich 4 lat (post Alexxnet ) zrezygnowało z generatywnego wstępnego szkolenia sieci neuronowych w celu osiągnięcia najnowszych wyników klasyfikacji. Na przykład, najlepsze wyniki dla mnistera tutaj obejmują tylko 2 artykuły z 50...
Standardowe zejście gradientu obliczałoby gradient dla całego zestawu danych treningowych. for i in range(nb_epochs): params_grad = evaluate_gradient(loss_function, data, params) params = params - learning_rate * params_grad Dla wstępnie zdefiniowanej liczby epok najpierw obliczamy wektor...
W literaturze dotyczącej sieci neuronowych często spotykamy słowo „tensor”. Czy różni się od wektora? A z matrycy? Czy masz jakiś konkretny przykład, który wyjaśnia jego definicję? Jestem trochę zdezorientowany co do jego definicji. Wikipedia nie pomaga i czasami mam wrażenie, że jej definicja...
Rozważ standardowy problem regresji OLS : Mam macierze i i chcę znaleźć aby zminimalizować L = \ | \ Y- \ X \ B \ | ^ 2. Rozwiązanie podano przez \ hat \ B = \ argmin_ \ B \ {L \} = (\ X ^ \ top \ X) ^ + \ X ^ \ top \ Y.\newcommand{\Y}{\mathbf Y}\newcommand{\X}{\mathbf
W rozpoznawaniu wzorów książek i uczeniu maszynowym (wzór 1.27) daje py(y)=px(x)∣∣∣dxdy∣∣∣=px(g(y))|g′(y)|py(y)=px(x)|dxdy|=px(g(y))|g′(y)|p_y(y)=p_x(x) \left | \frac{d x}{d y} \right |=p_x(g(y)) | g'(y) | gdziex=g(y)x=g(y)x=g(y),to pdf, który odpowiadaw odniesieniu do zmiany zmiennej.p y ( y...
Jaka jest różnica między łańcuchami Markowa a procesami Markowa? Czytam sprzeczne informacje: czasami definicja jest oparta na tym, czy przestrzeń stanu jest dyskretna, czy ciągła, a czasem na tym, czy czas jest dyskretny ciągłego. Slajd 20 tego dokumentu : Proces Markowa nazywany jest...
Mam duży zestaw danych o zanieczyszczeniach, które są rejestrowane co 10 minut w ciągu 2 lat, jednak istnieje wiele luk w danych (w tym niektóre, które pojawiają się przez kilka tygodni na raz). Dane wydają się dość sezonowe i istnieje duża zmienność w ciągu dnia w porównaniu do nocy, w której...