Statystyki i duże zbiory danych

12

Przykład ścisłej nierówności von Neumanna

Niech oznacza ryzyko Bayesa estymatora w odniesieniu do wcześniejszego , niech oznacza zbiór wszystkich priorów w przestrzeni parametrów , a niech oznacza zbiór wszystkie (ewentualnie losowe) reguły decyzyjne.δ π Π Θ Δr(π,δ)r(π,δ)r(\pi, \delta)δδ\deltaππ\piΠΠ\PiΘΘ\ThetaΔΔ\Delta Stwierdza to...

bayesian decision-theory risk

12

Co to jest klasyfikator?

Nie mogę znaleźć ogólnej definicji klasyfikatora? Rozumiem, jak to może działać, ale nie mogę dojść do

machine-learning classification

12

Prosty przykład pokazujący zalety Bayesian Model Averaging (BMA)

W swoich badaniach włączam podejście Bayesian Model Averaging (BMA) i wkrótce przedstawię kolegom moją prezentację na temat mojej pracy. Jednak BMA nie jest tak dobrze znany w mojej dziedzinie, więc po przedstawieniu im całej teorii i zanim faktycznie zastosuję ją do mojego problemu, chcę...

bayesian data-visualization

12

Dlaczego nie można stosować testów współczynnika wiarygodności dla modeli nie zagnieżdżonych?

Mówiąc dokładniej, dlaczego testy współczynnika prawdopodobieństwa mają asymptotycznie jeśli modele są zagnieżdżone, ale nie jest tak już w przypadku modeli nie zagnieżdżonych? Rozumiem, że wynika to z twierdzenia Wilksa, ale niestety nie rozumiem tego dowodu

likelihood-ratio nested-models

12

Oblicz niepewność nachylenia regresji liniowej na podstawie niepewności danych

Jak obliczyć niepewność nachylenia regresji liniowej na podstawie niepewności danych (być może w programie Excel / Mathematica)? Przykład: miejmy punkty danych (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16), ale każda wartość y ma niepewność wynosząca 4. Większość funkcji, które znalazłem,...

regression uncertainty

12

Wnioskowanie na temat efektów stałych w modelu efektów mieszanych

Skorelowałem dane i używam modelu mieszanych efektów regresji logistycznej do oszacowania indywidualnego (warunkowego) efektu dla predyktora zainteresowania. Wiem, że w przypadku standardowych modeli brzeżnych wnioskowanie na temat parametrów modelu za pomocą testu Walda jest spójne dla...

logistic mixed-model inference

12

Czy występuje problem z wielokoliniowością i regresją splajnów?

Podczas korzystania z naturalnych (tj. Ograniczonych) splajnów sześciennych, tworzone funkcje podstawowe są wysoce współliniowe, a po zastosowaniu w regresji wydają się generować bardzo wysokie statystyki VIF (współczynnik inflacji wariancji), sygnalizując wielokoliniowość. Czy rozważając przypadek...

multiple-regression generalized-linear-model predictive-models multicollinearity splines

12

Kiedy (jeśli w ogóle) warto przeprowadzić analizę mocy post hoc?

Rozumiem, że analiza mocy odbywa się post hoc tylko wtedy, gdy wykorzystuje wielkość obserwowanego efektu jako wielkość efektu populacji

power-analysis

12

Jakie statystyki są przechowywane w ramach agregacji?

Jeśli mamy długi szereg czasowy o wysokiej rozdzielczości, z dużym hałasem, często sensowne jest agregowanie danych do niższej rozdzielczości (np. Wartości dzienne do miesięcznych), aby lepiej zrozumieć, co się dzieje, skutecznie usuwając niektóre z hałas. Widziałem co najmniej jeden artykuł,...

time-series aggregation

12

Jak dopasować krzywą, jak obliczyć 95% przedział ufności dla moich dopasowanych parametrów?

Dopasowuję krzywe do moich danych, aby wyodrębnić jeden parametr. Nie jestem jednak pewien, jaka jest pewność tego parametru i jak obliczyć / wyrazić jego % przedział ufności.959595 Powiedzmy, że dla zestawu danych zawierającego dane, które wykładniczo zanika, dopasowuję krzywą do każdego zestawu...

confidence-interval nonlinear-regression fitting

12

Porównywanie oszacowania maksymalnego prawdopodobieństwa (MLE) i twierdzenia Bayesa

W twierdzeniu bayesowskim , a z książki, którą czytam, nazywa się prawdopodobieństwo , ale zakładam, że to tylko prawdopodobieństwo warunkowe od podane , prawda? p(x|y)xyp(y|x)=p(x|y)p(y)p(x)p(y|x)=p(x|y)p(y)p(x)p(y|x) = \frac{p(x|y)p(y)}{p(x)}p(x|y)p(x|y)p(x|y)xxxyyy Do największej wiarygodności...

bayesian maximum-likelihood

12

Wartość, która zwiększa odchylenie standardowe

Zastanawia mnie następujące zdanie: „Aby zwiększyć standardowe odchylenie zestawu liczb, należy dodać wartość, która jest więcej niż jedno odchylenie standardowe od średniej” Co jest tego dowodem ? Wiem oczywiście, jak definiujemy odchylenie standardowe, ale tę część wydaje mi się jakoś tęsknić....

standard-deviation

12

Czy istnieje lepsza nazwa niż „średnia całki”?

Testuję czujniki położenia przepustnicy (TPS), które sprzedaje moja firma i drukuję wykres odpowiedzi napięcia na obrót wału przepustnicy. TPS jest czujnikiem obrotowym o zakresie 90 °, a wyjście jest jak potencjometr z pełnym otwarciem wynoszącym 5 V (lub wartością wejściową czujnika) i...

terminology

12

Niezbędny i wystarczający warunek wspólnego MGF dla niezależności

Załóżmy, że mam funkcję generującą moment połączony dla wspólnego rozkładu z CDF . Czy jest koniecznym i wystarczającym warunkiem niezależności i ? Sprawdziłem kilka podręczników, w których wspomniałem tylko o

probability independence joint-distribution mgf

12

Dobroć dopasowania dla bardzo dużych próbek

Codziennie zbieram bardzo duże próbki (> 1 000 000) danych kategorycznych i chcę, aby dane wyglądały „znacząco” różnie między poszczególnymi dniami w celu wykrycia błędów w gromadzeniu danych. Myślałem, że użycie testu dobrego dopasowania (w szczególności testu G) byłoby dobrym dopasowaniem...

goodness-of-fit large-data

12

Różnica między prognozami „w próbie” i „pseudo poza próbą”

Czy istnieje wyraźna różnica między prognozami w próbie a pseudo prognozami poza próbą . Oba mają na celu ocenę i porównanie modeli

forecasting model-comparison out-of-sample in-sample

12

Dlaczego diagnostyka opiera się na pozostałościach?

W prostej regresji liniowej często chce się sprawdzić, czy spełnione są pewne założenia, aby móc wnioskować (np. Reszty są zwykle rozkładane). Czy uzasadnione jest sprawdzenie założeń poprzez sprawdzenie, czy dopasowane wartości są zwykle rozkładane?

regression residuals diagnostic

12

John Kerrich Coin-flip Data

Czy ktoś może zasugerować, gdzie uzyskać wyniki 10 000 rzutów monetą (tj. Wszystkich 10 000 głów i reszek) wykonanych przez Johna Kerricha podczas II wojny

probability

12

Intuicja stojąca za nazwami „częściowe” i „marginalne” korelacje

Czy ktoś ma pojęcie o tym, dlaczego korelacja warunkowa między 2 zmiennymi jest nazywana korelacją „częściową”, a prosta korelacja między nimi (a więc gdy nie jest uwarunkowana żadną inną zmienną) jest nazywana korelacją „marginalną”? Jaka jest intuicja za słowami „częściowy” i „marginalny”? Co...

correlation terminology marginal partial-correlation

12

Dlaczego niektórzy ludzie testują założenia modelu przypominającego regresję na swoich surowych danych, a inni testują je na poziomie resztkowym?

Jestem doktorantem z psychologii eksperymentalnej i staram się doskonalić swoje umiejętności i wiedzę na temat analizy moich danych. Do piątego roku studiów w psychologii myślałem, że modele podobne do regresji (np. ANOVA) zakładają następujące rzeczy: normalność danych jednorodność wariancji...

regression dataset residuals assumptions