Statystyki i duże zbiory danych

32

Dlaczego niektóre osoby używają -999 lub -9999 do zastąpienia brakujących wartości?

Mam zestaw danych. Brakuje wielu wartości. W przypadku niektórych kolumn brakującą wartość zastąpiono wartością -999, ale w innych kolumnach brakującą wartość oznaczono jako „NA”. Dlaczego użyjemy -999, aby zastąpić brakującą wartość?

missing-data

32

Po co stosować regularyzację w regresji wielomianowej zamiast obniżać stopień?

Na przykład podczas regresji, dwoma hiperparametrami do wyboru są często pojemność funkcji (np. Największy wykładnik wielomianu) i ilość regularyzacji. Jestem zdezorientowany, dlaczego nie po prostu wybrać funkcję niskiej pojemności, a następnie zignorować jakąkolwiek regularyzację? W ten sposób...

regression machine-learning optimization regularization polynomial

32

Zrozumienie jednostek LSTM vs. komórek

Przez jakiś czas studiowałem LSTM. Rozumiem na wysokim poziomie, jak wszystko działa. Jednak zamierzając je zaimplementować za pomocą Tensorflow, zauważyłem, że BasicLSTMCell wymaga szeregunum_units parametrów (tj. ) Parametrów. Z tego bardzo dokładnego wyjaśnienia LSTM wynika, że jedna...

neural-networks terminology lstm rnn tensorflow

32

Czy powinienem najpierw uczyć statystyki bayesowskiej czy częstokrzyskiej?

Pomagam moim chłopcom, obecnie w szkole średniej, w zrozumieniu statystyk i zastanawiam się nad kilkoma prostymi przykładami, nie zapominając o przebłyskach teorii. Moim celem byłoby zaproponowanie im najbardziej intuicyjnego, ale instrumentalnie konstruktywnego podejścia do nauki statystyk od...

probability hypothesis-testing bayesian frequentist teaching

32

Jaka jest definicja „mapy obiektów” (inaczej „mapy aktywacji”) w splotowej sieci neuronowej?

Wprowadzenie do tła W splotowej sieci neuronowej zwykle mamy ogólną strukturę / przepływ, który wygląda następująco: obraz wejściowy (tj. wektor 2D x) (Pierwsza warstwa konwergencji (konw. 1) zaczyna się tutaj ...) zwinąć zestaw filtrów ( w1) wzdłuż obrazu 2D (tzn. wykonać iloczyny z1 =...

neural-networks deep-learning conv-neural-network

32

Dlaczego podstawowe testowanie hipotez koncentruje się na średniej, a nie na środkowej?

Na podstawowych kursach statystyki poniżej stopnia uczniowie (zwykle?) Uczą się testowania hipotez dla średniej populacji. Dlaczego skupia się na średniej, a nie na środkowej? Domyślam się, że łatwiej jest przetestować średnią ze względu na centralne twierdzenie graniczne, ale chciałbym przeczytać...

hypothesis-testing mean inference median

32

Dlaczego nie ma mechanizmów uczenia się głębokiego wzmocnienia dla szachów, podobnych do AlphaGo?

Komputery od dawna potrafią grać w szachy za pomocą techniki „brute-force”, szukając określonej głębokości, a następnie oceniając pozycję. Komputer AlphaGo używa jednak tylko ANN do oceny pozycji (o ile mi wiadomo, nie dokonuje głębokiego przeszukiwania). Czy można stworzyć silnik szachowy, który...

neural-networks deep-learning reinforcement-learning games

32

Jeśli wygeneruję losową macierz symetryczną, jaka jest szansa, że jest ona dodatnia?

Mam dziwne pytanie, kiedy eksperymentowałem z wypukłymi optymalizacjami. Pytanie brzmi: Załóżmy, że losowo (powiedzmy standardowy rozkład normalny) generuję macierz symetryczną (na przykład generuję górną macierz trójkątną i wypełniam dolną połowę, aby upewnić się, że jest symetryczna), jaka jest...

probability matrix random-generation eigenvalues random-matrix

32

Architektury CNN do regresji?

Pracowałem nad problemem regresji, w którym dane wejściowe to obraz, a etykieta ma wartość ciągłą od 80 do 350. Obrazy mają związek chemiczny po zajściu reakcji. Kolor, który się okazuje, wskazuje stężenie innej chemikaliów, która pozostała, i to właśnie model ma wytworzyć - stężenie tej substancji...

regression machine-learning neural-networks conv-neural-network tensorflow

32

Czy istnieją przykłady, w których nie obowiązuje twierdzenie o limicie centralnym?

Wikipedia mówi - W teorii prawdopodobieństwa centralne twierdzenie graniczne (CLT) ustala, że w większości sytuacji , gdy dodaje się niezależne zmienne losowe, ich odpowiednio znormalizowana suma zmierza w kierunku rozkładu normalnego (nieformalnie „krzywej dzwonowej”), nawet jeśli same zmienne...

probability mathematical-statistics normal-distribution central-limit-theorem

32

Dlaczego znajdowanie małych efektów w dużych badaniach wskazuje na stronniczość publikacji?

Kilka prac metodologicznych (np. Egger i in. 1997a, 1997b) omawia stronniczość publikacji ujawnioną w metaanalizach, wykorzystując wykresy lejkowe, takie jak ta poniżej. Artykuł z 1997b mówi dalej, że „jeśli obecne jest stronniczość publikacji, oczekuje się, że spośród opublikowanych badań...

meta-analysis publication-bias

31

Co to jest odchylenie standardowe?

Co to jest odchylenie standardowe, jak jest obliczane i jakie jest jego zastosowanie w

standard-deviation

31

Narzędzia Open Source do wizualizacji danych wielowymiarowych?

Jakie narzędzia open source, oprócz gnuplot i ggobi , używają do wizualizacji danych wielowymiarowych? Gnuplot to mniej więcej podstawowy pakiet kreślarski. Ggobi może robić wiele fajnych rzeczy, takich jak: animować dane wzdłuż wymiaru lub między dyskretnymi kolekcjami animować kombinacje...

data-visualization open-source

31

Kiedy regresję logistyczną rozwiązuje się w formie zamkniętej?

Weźmy i i załóżmy, że modelujemy zadanie przewidywania y dla x za pomocą regresji logistycznej. Kiedy współczynniki regresji logistycznej można zapisać w formie zamkniętej?x∈{0,1}dx∈{0,1}rex \in \{0,1\}^dy∈{0,1}y∈{0,1}y \in \{0,1\} Jednym z przykładów jest użycie modelu nasyconego. To znaczy...

logistic generalized-linear-model

31

Współczynniki regresji, które odwracają znak po uwzględnieniu innych predyktorów

Wyobrażać sobie Prowadzisz regresję liniową za pomocą czterech predyktorów numerycznych (IV1, ..., IV4) Gdy jako predyktor uwzględniono tylko IV1, standaryzowana jest beta +.20 Gdy uwzględnisz także IV2 do IV4, znak znormalizowanego współczynnika regresji IV1 zmienia się na -.25(tzn. Staje się...

regression predictor

31

Jak zwiększyć długoterminową odtwarzalność badań (szczególnie przy użyciu R i Sweave)

Kontekst: W odpowiedzi na wcześniejsze pytanie dotyczące powtarzalnych badań Jake napisał Jednym z problemów, który odkryliśmy podczas tworzenia naszego archiwum JASA, była zmiana wersji i domyślnych pakietów CRAN. Tak więc w tym archiwum uwzględniamy również wersje używanych pakietów. System...

r reproducible-research project-management

31

Wiele porównań w modelu efektów mieszanych

Próbuję analizować niektóre dane przy użyciu modelu efektu mieszanego. Zebrane przeze mnie dane przedstawiają masę niektórych młodych zwierząt o różnym genotypie w czasie. Korzystam z zaproponowanego tutaj podejścia: https://gribblelab.wordpress.com/2009/03/09/repeated-measures-anova-using-r/ W...

r anova mixed-model multiple-comparisons repeated-measures

31

Dla jakich rozkładów parametryzacje w BŁĘDACH i R są różne?

Znalazłem kilka rozkładów, dla których BŁĘDY i R mają różne parametryzacje: Normalny, log-Normalny i Weibull. Dla każdego z nich zbieram, że drugi parametr użyty przez R musi zostać odwrócony (1 / parametr) przed użyciem w BŁĘDACH (lub JAGS w moim przypadku). Czy ktoś wie o wyczerpującej liście...

r distributions bugs jags parameterization

31

Czy są lekcje statystyczne z odcinka „Kod biblijny”?

Chociaż to pytanie jest nieco subiektywne, mam nadzieję, że kwalifikuje się jako dobre pytanie subiektywne zgodnie z wytycznymi faq . Opiera się na pytaniu, które zadał mi Olle Häggström rok temu i choć mam na ten temat pewne przemyślenia, nie mam jednoznacznej odpowiedzi i byłbym wdzięczny za...

hypothesis-testing data-mining

31

Uwzględnianie utrwalonych widoków wartości p

Czasami w raportach zamieszczam oświadczenie o wartościach p i innych dostarczonych statystykach wnioskowania. Mówię, że ponieważ próbka nie była przypadkowa, takie statystyki nie miałyby ścisłego zastosowania. Moje konkretne sformułowanie jest zwykle podane w przypisie: „Podczas gdy, ściśle...

inference p-value