Pytania oznaczone «hypothesis-testing»

12

Test vs -test do porównywania szans na przeziębienie w 2 grupach

Właśnie przeczytałem w dość szanowanym (popularnym) magazynie naukowym (niemiecki premier, 02/2013, s. 36) o ciekawym eksperymencie (niestety bez źródła). Przyciągnęło to moją uwagę, ponieważ intuicyjnie wątpiłem w znaczenie wyniku, ale dostarczone informacje były wystarczające do odtworzenia...

12

Dlaczego test F w Gaussowskich modelach liniowych jest najbardziej wydajny?

W przypadku Gaussowskiego modelu liniowego gdzie zakłada się, że leży w pewnej przestrzeni wektorowej a ma standardowy rozkład normalny na , statystyka testu dla , gdzie jest przestrzeń wektorową, to zwiększa się do jedną z funkcji odchyleń statystyki: Skąd możemy wiedzieć, że ta statystyka...

hypothesis-testing normal-distribution linear-model power likelihood-ratio

12

Dlaczego test niezależności wykorzystuje rozkład chi-kwadrat?

Test dobroci dopasowania wykorzystuje następującą statystykę : W teście warunki są spełnione, Można użyć - rozkład obliczyć p-wartość, biorąc pod uwagę prawda można by zaobserwować w takiej wartości reprezentatywnej próbki o tej samej wielkości.χ 2 0 = n ∑ i = 1 ( O i - E i ) 2χ2)χ2)\chi^2...

hypothesis-testing chi-squared

12

Dokładny test Fishera i rozkład hipergeometryczny

Chciałem lepiej zrozumieć dokładny test Fishera, więc wymyśliłem następujący przykład zabawki, w którym f i m odpowiada płci męskiej i żeńskiej, a n i y odpowiada takiemu „zużyciu sody”: > soda_gender f m n 0 5 y 5 0 Oczywiście jest to drastyczne uproszczenie, ale nie chciałem, aby...

fishers-exact hypergeometric clustering supervised-learning modeling econometrics r regression residuals heteroscedasticity independence distributions self-study matlab libsvm self-study conditional-probability conditional-expectation hypothesis-testing self-study multiple-comparisons mode statistical-significance chi-squared multiple-comparisons maximum-likelihood poisson-process optimization uncertainty genetic-algorithms bayesian model-selection overfitting maximum-likelihood optimization approximation r prediction model-evaluation r machine-learning survival neural-networks cox-model machine-learning bayesian bayesian-network hierarchical-bayesian pooling

12

Jeśli rozkład statystyki testowej jest bimodalny, to czy wartość p coś znaczy?

Wartość p określa się jako prawdopodobieństwo uzyskania statystyki testowej co najmniej tak ekstremalnej, jak to, co obserwuje się, przy założeniu, że hipoteza zerowa jest prawdziwa. Innymi słowy, P(X≥t|H0)P(X≥t|H0)P( X \ge t | H_0 ) Ale co, jeśli statystyka testowa ma rozkład bimodalny? czy...

hypothesis-testing statistical-significance p-value descriptive-statistics bimodal

12

Jak wykonać test ładowania początkowego, aby porównać średnie z dwóch próbek?

Mam dwie mocno wypaczone próbki i próbuję użyć ładowania początkowego w celu porównania ich średnich za pomocą statystyki t. Jaka jest poprawna procedura, aby to zrobić? Proces, którego używam Niepokoi mnie właściwość zastosowania standardowego błędu oryginalnych / zaobserwowanych danych w...

hypothesis-testing t-test bootstrap

12

Dlaczego ta dystrybucja jest jednolita?

Badamy bayesowskie testy statystyczne i natrafiliśmy na dziwne (przynajmniej dla mnie) zjawisko. Rozważ następujący przypadek: interesuje nas pomiar, która populacja, A lub B, ma wyższy współczynnik konwersji. Dla kontroli poczytalności ustawiamy , to znaczy prawdopodobieństwo konwersji jest...

hypothesis-testing bayesian binomial python beta-distribution

12

Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?

Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace =...

r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

12

Różnica między seriami z dryfem a seriami z trendem

Serię ze znoszeniem można modelować jako gdzie jest znoszeniem (stałym), a . yt= c + ϕ yt - 1+ εtyt=c+ϕyt−1+εty_t = c + \phi y_{t-1} + \varepsilon_tdoccϕ = 1ϕ=1\phi=1 Szereg z trendem można modelować jako gdzie jest dryftem (stałym), jest deterministycznym trendem czasowym, a .yt= c + δt + ϕ yt -...

time-series hypothesis-testing stationarity trend unit-root

12

Jaka jest różnica między „testowaniem hipotez” a „wyborem modelu”?

W literaturze oba terminy są często używane synonimicznie lub przeplatają się. Teraz próbuję znaleźć wyraźne rozróżnienie między tymi dwoma terminami. Z mojego punktu widzenia hipoteza jest zwykle wyrażana za pomocą modelu. Więc nawet jeśli przetestujemy hipotezę zerową vs. alternatywną, z mojej...

hypothesis-testing model-selection regression-strategies

12

Jaki jest związek między ANOVA w celu porównania średnich z kilku grup a ANOVA w celu porównania modeli zagnieżdżonych?

Do tej pory widziałem ANOVA używaną na dwa sposoby: Po pierwsze , w moim tekście statystyki wprowadzającej ANOVA została wprowadzona jako sposób porównania średnich z trzech lub więcej grup, jako ulepszenie w porównaniu z parami, w celu ustalenia, czy jeden ze średnich ma statystycznie istotną...

hypothesis-testing anova model-comparison f-test nested-models

11

Jak wykryć, które z nich jest lepsze, gdy dają sprzeczne wyniki?

Tak często natrafiasz w prasie na różne badania, które prowadzą do przeciwnych wyników. Mogą być one związane z testowaniem nowego leku na receptę lub zasługi konkretnego składnika odżywczego lub czegokolwiek innego w tym zakresie. Kiedy dwa takie badania prowadzą do sprzecznych wyników, jak...

hypothesis-testing clinical-trials

11

Jaka jest różnica między wynikami Z a wartościami p?

W algorytmach motywów sieciowych wydaje się dość powszechne zwracanie zarówno wartości p, jak i wyniku Z dla statystyki: „Sieć wejściowa zawiera X kopii podgrupy G”. Podgraf jest uważany za motyw, jeśli spełnia wartość p <A, Wynik Z> B i X> C, dla niektórych A, B i C. zdefiniowanych...

hypothesis-testing p-value z-statistic

11

Jaka jest moc testu F regresji?

Klasyczny test F dla podzbiorów zmiennych w regresji wieloliniowej ma postać gdzieSSE(R)to suma błędów kwadratu w modelu „zredukowanym”, który zagnieżdżony jest w „dużym” modeluB, adfto stopnie swobody obu modeli. Zgodnie z hipotezą zerową, że dodatkowe zmienne w „dużym” modelu nie mają liniowej...

regression hypothesis-testing power-analysis non-central f-distribution

11

Jakie są „pożądane” właściwości statystyczne testu współczynnika wiarygodności?

Czytam artykuł, którego metoda jest w pełni oparta na teście współczynnika wiarygodności. Autor mówi, że test LR na jednostronne alternatywy to UMP. Kontynuuje, twierdząc, że „... nawet jeśli nie można wykazać, że [test LR] jest jednorodnie najsilniejszy, test LR często ma pożądane właściwości...

hypothesis-testing power-analysis power likelihood-ratio neyman-pearson-lemma

11

Rodzinna granica błędów: czy ponowne wykorzystanie zestawów danych w różnych badaniach niezależnych pytań prowadzi do wielu problemów z testowaniem?

Jeśli zespół badaczy przeprowadzi wiele testów (hipotez) na danym zbiorze danych, istnieje obszerna literatura, w której stwierdza się, że powinni oni zastosować jakąś formę korekty do testów wielokrotnych (Bonferroni itp.), Nawet jeśli testy są niezależne. Moje pytanie brzmi: czy ta sama logika...

hypothesis-testing multiple-comparisons

11

Test Friedmana vs test Wilcoxona

Usiłuję ocenić wydajność nadzorowanego algorytmu klasyfikacji uczenia maszynowego. Obserwacje dzielą się na klasy nominalne (na razie 2, jednak chciałbym uogólnić to na problemy wielu klas), zaczerpnięte z populacji 99 osób. Jednym z pytań, na które chciałbym odpowiedzieć, jest to, czy algorytm...

r hypothesis-testing nonparametric

11

Sprawdź poprawność internetowych testów A / B, ponownie uruchamiając eksperyment - czy to jest prawidłowe?

Pewnego dnia podczas webinarium przeprowadzonego przez firmę testującą A / B ich rezydent „Data Scientist” wyjaśnił, że powinieneś zweryfikować swoje wyniki, ponownie uruchamiając eksperyment. Założeniem było, że jeśli wybierzesz 95% pewności, istnieje 5% (1/20) szansa na fałszywie pozytywny wynik....

probability hypothesis-testing statistical-significance ab-test

11

Testowanie, czy dwa współczynniki regresji są znacząco różne (idealnie w R)

Jeśli jest to duplikat pytania, proszę wskazać właściwą drogę, ale podobne pytania, które tu znalazłem, nie były wystarczająco podobne. Załóżmy, że oceniam model Y=α+βX+uY=α+βX+uY=\alpha + \beta X + u i znajdź . Okazuje się jednak, że X = X 1 + X 2 i podejrzewam ∂ Y / ∂ X 1 ≠ ∂ Y / ∂ X 2 , a w...

r regression hypothesis-testing econometrics

11

Statystyka testu Durbina Watsona

Zastosowałem test DW do mojego modelu regresji w R i otrzymałem statystykę testu DW wynoszącą 1,78 i wartość p 2,2e-16 = 0. Czy to oznacza, że nie ma autokorelacji między resztami, ponieważ stat jest bliski 2 z małą wartością p, czy to oznacza, że chociaż stat jest bliski 2, wartość p jest...

r regression hypothesis-testing autocorrelation residuals