Mam nadzieję, że tytuł ma sens. Często hipoteza zerowa powstaje z zamiarem jej odrzucenia. Czy jest tego powód, czy to tylko
Mam nadzieję, że tytuł ma sens. Często hipoteza zerowa powstaje z zamiarem jej odrzucenia. Czy jest tego powód, czy to tylko
LSTM został opracowany specjalnie w celu uniknięcia problemu zanikania gradientu. Ma to zrobić za pomocą karuzeli Constant Error (CEC), która na poniższym schemacie ( Greff i in. ) Odpowiada pętli wokół komórki . (źródło: deeplearning4j.org ) Rozumiem, że ta część może być postrzegana jako...
Ucząc się o zwiększaniu gradientu, nie słyszałem o żadnych ograniczeniach dotyczących właściwości „słabego klasyfikatora”, którego ta metoda używa do budowania i składania modelu. Jednak nie wyobrażam sobie zastosowania GB, który wykorzystuje regresję liniową, a właściwie po przeprowadzeniu...
Ostatnio przyglądałem się symulacji Monte Carlo i używałem jej do przybliżania stałych, takich jak (okrąg wewnątrz prostokąta, obszar proporcjonalny).ππ\pi Nie jestem jednak w stanie wymyślić odpowiedniej metody aproksymacji wartości eee [liczby Eulera] przy użyciu integracji Monte Carlo. Czy...
Jednym z największych problemów związanych z analizą skupień jest to, że może się zdarzyć, że będziemy musieli wyciągnąć odmienne wnioski, gdy oprą się na różnych zastosowanych metodach klastrowania (w tym różnych metodach łączenia w hierarchicznym klastrze). Chciałbym poznać Twoją opinię na ten...
Patrzę na niektóre slajdy wykładowe na kursie danych, który można znaleźć tutaj: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf Niestety nie widzę wideo z tego wykładu iw pewnym momencie na slajdzie prezenter ma następujący tekst: Niektóre kluczowe zasady Myśl jak...
Generuję 8 losowych bitów (0 lub 1) i łączę je ze sobą, tworząc liczbę 8-bitową. Prosta symulacja Pythona daje równomierny rozkład w zestawie dyskretnym [0, 255]. Próbuję uzasadnić, dlaczego to ma sens w mojej głowie. Jeśli porównam to do rzucenia 8 monetami, czy oczekiwana wartość nie wyniesie...
PCA jest uważana za procedurę liniową, jednak: PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), gdzie . To znaczy, że wektory własne uzyskane przez PCA na macierzach danych nie sumują się do...
Ta wiadomość w artykule Reutera z 25.02.2019 jest obecnie w wiadomościach: Dowody na istnienie wywołanego przez człowieka globalnego ocieplenia uderzają w „złoty standard” [Naukowcy] stwierdzili, że pewność, że działalność człowieka podnosi ciepło na powierzchni Ziemi, osiągnęła poziom...
Drzewa decyzyjne wydają się być bardzo zrozumiałą metodą uczenia maszynowego. Raz utworzony może być łatwo sprawdzony przez człowieka, co jest wielką zaletą w niektórych aplikacjach. Jakie są praktyczne słabe strony drzew
Wszystkie wydają się reprezentować zmienne losowe przez węzły i (nie) zależność poprzez (ewentualnie skierowane) krawędzie. Szczególnie interesuje mnie punkt widzenia
Drodzy wszyscy - zauważyłem coś dziwnego, czego nie potrafię wyjaśnić, prawda? Podsumowując: ręczne podejście do obliczania przedziału ufności w modelu regresji logistycznej oraz funkcja R confint()dają różne wyniki. Przechodziłem przez regresję logistyczną stosowaną przez Hosmer & Lemeshow...
Dlaczego procedura walidacji krzyżowej rozwiązuje problem nadmiernego dopasowania
Zacznę od stwierdzenia, że jest to zadanie domowe od samego początku. Spędziłem kilka godzin, szukając sposobu na znalezienie oczekiwanych wartości i zdecydowałem, że nic nie rozumiem. Niech XXX ma CDF F(x)=1−x−α,x≥1F(x)=1−x−α,x≥1F(x) = 1 - x^{-\alpha}, x\ge1 . Znajdź E(X)E(X)E(X) dla tych...
Jestem ciekaw powtarzalnych procedur, które mogą być wykorzystane do odkrywania postaci funkcyjnej funkcji y = f(A, B, C) + error_term, gdzie jest mój tylko wejście jest zbiorem obserwacji ( y, A, Bi C). Należy pamiętać, że funkcjonalna forma fjest nieznana. Rozważ następujący zestaw danych: AA...
Próbuję użyć wykresu sylwetki, aby określić liczbę klastrów w moim zestawie danych. Biorąc pod uwagę zestaw danych Train , użyłem następującego kodu Matlab Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s =...
W moim zestawie danych mamy zarówno zmienne ciągłe, jak i naturalnie dyskretne. Chcę wiedzieć, czy możemy przeprowadzać hierarchiczne grupowanie przy użyciu obu typów zmiennych. A jeśli tak, jaki pomiar odległości jest
Czy ktoś może przedstawić mi zwięzłe wyjaśnienie, dlaczego nie warto uczyć studentów, że prob jest wartością p (ich odkrycia wynikają z [losowej] szansy). Rozumiem, że wartość p jest prob (uzyskanie bardziej ekstremalnych danych | hipoteza zerowa jest prawdziwa). Moim prawdziwym zainteresowaniem...
To pytanie może być zbyt otwarte, aby uzyskać ostateczną odpowiedź, ale mam nadzieję, że nie. Algorytmy uczenia maszynowego, takie jak SVM, GBM, Random Forest itp., Generalnie mają pewne wolne parametry, które poza pewną wskazówką praktyczną, muszą być dostosowane do każdego zestawu danych....
Zastanawiam się, jakie są różnice między mieszanymi i niezmieszanymi GLM. Na przykład w SPSS menu rozwijane umożliwia użytkownikom dopasowanie: analyze-> generalized linear models-> generalized linear models I analyze-> mixed models-> generalized linear Czy inaczej radzą sobie z...