Mam zestaw danych. Brakuje wielu wartości. W przypadku niektórych kolumn brakującą wartość zastąpiono wartością -999, ale w innych kolumnach brakującą wartość oznaczono jako „NA”. Dlaczego użyjemy -999, aby zastąpić brakującą wartość?
Mam zestaw danych. Brakuje wielu wartości. W przypadku niektórych kolumn brakującą wartość zastąpiono wartością -999, ale w innych kolumnach brakującą wartość oznaczono jako „NA”. Dlaczego użyjemy -999, aby zastąpić brakującą wartość?
Na przykład podczas regresji, dwoma hiperparametrami do wyboru są często pojemność funkcji (np. Największy wykładnik wielomianu) i ilość regularyzacji. Jestem zdezorientowany, dlaczego nie po prostu wybrać funkcję niskiej pojemności, a następnie zignorować jakąkolwiek regularyzację? W ten sposób...
Przez jakiś czas studiowałem LSTM. Rozumiem na wysokim poziomie, jak wszystko działa. Jednak zamierzając je zaimplementować za pomocą Tensorflow, zauważyłem, że BasicLSTMCell wymaga szeregunum_units parametrów (tj. ) Parametrów. Z tego bardzo dokładnego wyjaśnienia LSTM wynika, że jedna...
Pomagam moim chłopcom, obecnie w szkole średniej, w zrozumieniu statystyk i zastanawiam się nad kilkoma prostymi przykładami, nie zapominając o przebłyskach teorii. Moim celem byłoby zaproponowanie im najbardziej intuicyjnego, ale instrumentalnie konstruktywnego podejścia do nauki statystyk od...
Wprowadzenie do tła W splotowej sieci neuronowej zwykle mamy ogólną strukturę / przepływ, który wygląda następująco: obraz wejściowy (tj. wektor 2D x) (Pierwsza warstwa konwergencji (konw. 1) zaczyna się tutaj ...) zwinąć zestaw filtrów ( w1) wzdłuż obrazu 2D (tzn. wykonać iloczyny z1 =...
Na podstawowych kursach statystyki poniżej stopnia uczniowie (zwykle?) Uczą się testowania hipotez dla średniej populacji. Dlaczego skupia się na średniej, a nie na środkowej? Domyślam się, że łatwiej jest przetestować średnią ze względu na centralne twierdzenie graniczne, ale chciałbym przeczytać...
Komputery od dawna potrafią grać w szachy za pomocą techniki „brute-force”, szukając określonej głębokości, a następnie oceniając pozycję. Komputer AlphaGo używa jednak tylko ANN do oceny pozycji (o ile mi wiadomo, nie dokonuje głębokiego przeszukiwania). Czy można stworzyć silnik szachowy, który...
Mam dziwne pytanie, kiedy eksperymentowałem z wypukłymi optymalizacjami. Pytanie brzmi: Załóżmy, że losowo (powiedzmy standardowy rozkład normalny) generuję macierz symetryczną (na przykład generuję górną macierz trójkątną i wypełniam dolną połowę, aby upewnić się, że jest symetryczna), jaka jest...
Pracowałem nad problemem regresji, w którym dane wejściowe to obraz, a etykieta ma wartość ciągłą od 80 do 350. Obrazy mają związek chemiczny po zajściu reakcji. Kolor, który się okazuje, wskazuje stężenie innej chemikaliów, która pozostała, i to właśnie model ma wytworzyć - stężenie tej substancji...
Wikipedia mówi - W teorii prawdopodobieństwa centralne twierdzenie graniczne (CLT) ustala, że w większości sytuacji , gdy dodaje się niezależne zmienne losowe, ich odpowiednio znormalizowana suma zmierza w kierunku rozkładu normalnego (nieformalnie „krzywej dzwonowej”), nawet jeśli same zmienne...
Kilka prac metodologicznych (np. Egger i in. 1997a, 1997b) omawia stronniczość publikacji ujawnioną w metaanalizach, wykorzystując wykresy lejkowe, takie jak ta poniżej. Artykuł z 1997b mówi dalej, że „jeśli obecne jest stronniczość publikacji, oczekuje się, że spośród opublikowanych badań...
Co to jest odchylenie standardowe, jak jest obliczane i jakie jest jego zastosowanie w
Jakie narzędzia open source, oprócz gnuplot i ggobi , używają do wizualizacji danych wielowymiarowych? Gnuplot to mniej więcej podstawowy pakiet kreślarski. Ggobi może robić wiele fajnych rzeczy, takich jak: animować dane wzdłuż wymiaru lub między dyskretnymi kolekcjami animować kombinacje...
Weźmy i i załóżmy, że modelujemy zadanie przewidywania y dla x za pomocą regresji logistycznej. Kiedy współczynniki regresji logistycznej można zapisać w formie zamkniętej?x∈{0,1}dx∈{0,1}rex \in \{0,1\}^dy∈{0,1}y∈{0,1}y \in \{0,1\} Jednym z przykładów jest użycie modelu nasyconego. To znaczy...
Wyobrażać sobie Prowadzisz regresję liniową za pomocą czterech predyktorów numerycznych (IV1, ..., IV4) Gdy jako predyktor uwzględniono tylko IV1, standaryzowana jest beta +.20 Gdy uwzględnisz także IV2 do IV4, znak znormalizowanego współczynnika regresji IV1 zmienia się na -.25(tzn. Staje się...
Kontekst: W odpowiedzi na wcześniejsze pytanie dotyczące powtarzalnych badań Jake napisał Jednym z problemów, który odkryliśmy podczas tworzenia naszego archiwum JASA, była zmiana wersji i domyślnych pakietów CRAN. Tak więc w tym archiwum uwzględniamy również wersje używanych pakietów. System...
Próbuję analizować niektóre dane przy użyciu modelu efektu mieszanego. Zebrane przeze mnie dane przedstawiają masę niektórych młodych zwierząt o różnym genotypie w czasie. Korzystam z zaproponowanego tutaj podejścia: https://gribblelab.wordpress.com/2009/03/09/repeated-measures-anova-using-r/ W...
Znalazłem kilka rozkładów, dla których BŁĘDY i R mają różne parametryzacje: Normalny, log-Normalny i Weibull. Dla każdego z nich zbieram, że drugi parametr użyty przez R musi zostać odwrócony (1 / parametr) przed użyciem w BŁĘDACH (lub JAGS w moim przypadku). Czy ktoś wie o wyczerpującej liście...
Chociaż to pytanie jest nieco subiektywne, mam nadzieję, że kwalifikuje się jako dobre pytanie subiektywne zgodnie z wytycznymi faq . Opiera się na pytaniu, które zadał mi Olle Häggström rok temu i choć mam na ten temat pewne przemyślenia, nie mam jednoznacznej odpowiedzi i byłbym wdzięczny za...
Czasami w raportach zamieszczam oświadczenie o wartościach p i innych dostarczonych statystykach wnioskowania. Mówię, że ponieważ próbka nie była przypadkowa, takie statystyki nie miałyby ścisłego zastosowania. Moje konkretne sformułowanie jest zwykle podane w przypisie: „Podczas gdy, ściśle...