Pytania oznaczone «chi-squared»

14

Rozkład splotu kwadratowych zmiennych normalnych i chi-kwadratowych?

następujący problem pojawił się ostatnio podczas analizy danych. Jeśli zmienna losowa X podąża za rozkładem normalnym, a Y za (z n dof), jak rozkłada się ? Do tej pory wymyśliłem pdf : χ2nχn2\chi^2_nZ=X2+Y2Z=X2+Y2Z = X^2 +

14

Możliwość zastosowania testu chi-kwadrat, jeżeli wiele komórek ma częstotliwości mniejsze niż 5

Aby znaleźć związek między wsparciem rówieśnika (zmienna niezależna) a satysfakcją z pracy (zmienna zależna), chcę zastosować test chi-kwadrat. Wsparcie rówieśników to kategorie w czterech grupach według stopnia wsparcia: 1 = bardzo mniej, 2 = do pewnego stopnia, 3 = w dużym stopniu i 4 = w bardzo...

chi-squared nonparametric contingency-tables association-measure

13

Zrozumienie testu chi-kwadrat i rozkładu chi-kwadrat

Próbuję zrozumieć logikę testu chi-kwadrat. Test chi-kwadrat to . jest następnie porównywany z rozkładem chi-kwadrat, aby znaleźć wartość p. w celu odrzucenia lub nie hipotezy zerowej. : obserwacje pochodzą z rozkładu, którego użyliśmy do stworzenia naszych oczekiwanych wartości. Na przykład...

probability distributions normal-distribution mathematical-statistics chi-squared

13

Czy można użyć chi kwadrat do porównania proporcji?

Czytałem, że test chi-kwadrat jest przydatny, aby sprawdzić, czy próbka znacznie różni się od zestawu wartości oczekiwanych. Na przykład, oto tabela wyników ankiety dotyczącej ulubionych kolorów ludzi (n = 15 + 13 + 10 + 17 = 55 wszystkich respondentów): red,blue,green,yellow 15,13,10,17 Test...

chi-squared hypothesis-testing proportion

13

LARS vs zejście współrzędnych dla lasso

Jakie są zalety i wady korzystania z LARS [1] w porównaniu ze stosowaniem opadania współrzędnych w celu dopasowania regresji liniowej regulowanej przez L1? Interesują mnie głównie aspekty wydajności (moje problemy występują zwykle Nw setkach tysięcy i p<20). Jednak wszelkie inne spostrzeżenia...

regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

13

Pakiet GBM vs. Caret korzystający z GBM

Stroiłem model przy użyciu caret, ale potem ponownie uruchomiłem model przy użyciu gbmpakietu. Rozumiem, że caretpakiet używa gbmi wynik powinien być taki sam. Jednak tylko szybki test przy użyciu data(iris)wykazuje rozbieżność w modelu około 5% przy użyciu RMSE i R ^ 2 jako metryki oceny. Chcę...

r caret gbm matrix linear-algebra logistic modeling logit ordered-logit r confidence-interval survival population weibull classification separation hypothesis-testing correlation statistical-significance p-value python r data-visualization r regression multiple-regression chi-squared multivariate-analysis distributions random-variable experiment-design distributions poisson-regression residuals excel time-series garch var survival modeling cox-model interaction r pca normality-assumption

12

Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?

Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace =...

r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

12

Dostosowanie wartości p dla adaptacyjnej analizy sekwencyjnej (dla testu chi kwadrat)?

Chciałbym wiedzieć, która literatura statystyczna jest istotna dla następującego problemu, a może nawet pomysł, jak go rozwiązać. Wyobraź sobie następujący problem: Mamy 4 możliwe sposoby leczenia niektórych chorób. Aby sprawdzić, które leczenie jest lepsze, przeprowadzamy specjalną próbę. W...

hypothesis-testing chi-squared p-value multiple-comparisons sequential-analysis

12

Test vs -test do porównywania szans na przeziębienie w 2 grupach

Właśnie przeczytałem w dość szanowanym (popularnym) magazynie naukowym (niemiecki premier, 02/2013, s. 36) o ciekawym eksperymencie (niestety bez źródła). Przyciągnęło to moją uwagę, ponieważ intuicyjnie wątpiłem w znaczenie wyniku, ale dostarczone informacje były wystarczające do odtworzenia...

hypothesis-testing chi-squared experiment-design proportion biostatistics

12

Dlaczego test niezależności wykorzystuje rozkład chi-kwadrat?

Test dobroci dopasowania wykorzystuje następującą statystykę : W teście warunki są spełnione, Można użyć - rozkład obliczyć p-wartość, biorąc pod uwagę prawda można by zaobserwować w takiej wartości reprezentatywnej próbki o tej samej wielkości.χ 2 0 = n ∑ i = 1 ( O i - E i ) 2χ2)χ2)\chi^2...

hypothesis-testing chi-squared

12

Dokładny test Fishera i rozkład hipergeometryczny

Chciałem lepiej zrozumieć dokładny test Fishera, więc wymyśliłem następujący przykład zabawki, w którym f i m odpowiada płci męskiej i żeńskiej, a n i y odpowiada takiemu „zużyciu sody”: > soda_gender f m n 0 5 y 5 0 Oczywiście jest to drastyczne uproszczenie, ale nie chciałem, aby...

fishers-exact hypergeometric clustering supervised-learning modeling econometrics r regression residuals heteroscedasticity independence distributions self-study matlab libsvm self-study conditional-probability conditional-expectation hypothesis-testing self-study multiple-comparisons mode statistical-significance chi-squared multiple-comparisons maximum-likelihood poisson-process optimization uncertainty genetic-algorithms bayesian model-selection overfitting maximum-likelihood optimization approximation r prediction model-evaluation r machine-learning survival neural-networks cox-model machine-learning bayesian bayesian-network hierarchical-bayesian pooling

11

R / mgcv: Dlaczego produkty tensorowe te () i ti () wytwarzają różne powierzchnie?

mgcvOpakowanie Rposiada dwie funkcje montowania interakcji produktów napinacz: te()i ti(). Rozumiem podstawowy podział pracy między nimi (dopasowanie interakcji nieliniowej vs. rozkładanie tej interakcji na główne efekty i interakcję). To, czego nie rozumiem, to dlaczego te(x1, x2)i ti(x1) + ti(x2)...

r gam mgcv conditional-probability mixed-model references bayesian estimation conditional-probability machine-learning optimization gradient-descent r hypothesis-testing wilcoxon-mann-whitney time-series bayesian inference change-point time-series anova repeated-measures statistical-significance bayesian contingency-tables regression prediction quantiles classification auc k-means scikit-learn regression spatial circular-statistics t-test effect-size cohens-d r cross-validation feature-selection caret machine-learning modeling python optimization frequentist correlation sample-size normalization group-differences heteroscedasticity independence generalized-least-squares lme4-nlme references mcmc metropolis-hastings optimization r logistic feature-selection separation clustering k-means normal-distribution gaussian-mixture kullback-leibler java spark-mllib data-visualization categorical-data barplot hypothesis-testing statistical-significance chi-squared type-i-and-ii-errors pca scikit-learn conditional-expectation statistical-significance meta-analysis intuition r time-series multivariate-analysis garch machine-learning classification data-mining missing-data cart regression cross-validation matrix-decomposition categorical-data repeated-measures chi-squared assumptions contingency-tables prediction binary-data trend test-for-trend matrix-inverse anova categorical-data regression-coefficients standard-error r distributions exponential interarrival-time copula log-likelihood time-series forecasting prediction-interval mean standard-error meta-analysis meta-regression network-meta-analysis systematic-review normal-distribution multiple-regression generalized-linear-model poisson-distribution poisson-regression r sas cohens-kappa

11

Jak dostosować ANOVA do danych binarnych?

Mam cztery konkurencyjne modele, których używam do przewidywania binarnej zmiennej wynikowej (powiedzmy, status zatrudnienia po ukończeniu studiów, 1 = zatrudniony, 0 = niezatrudniony) dla n badanych. Naturalną miarą wydajności modelu jest współczynnik trafień, który jest procentem poprawnych...

anova chi-squared generalized-linear-model

11

Subtelność wartości p: większa-równa vs. większa

Gdy czytam książkę Wassermanna Wszystkie statystyki, dostrzegam subtelną subtelność w definicji wartości p, której nie mogę zrozumieć. Nieformalnie Wassermann określa wartość p jako [..] prawdopodobieństwo (poniżej ) zaobserwowania wartości statystyki testowej takiej samej lub bardziej...

hypothesis-testing chi-squared p-value

11

Rozkład stosunku zależnych zmiennych losowych chi-kwadrat

Załóżmy, że gdzie są niezależne.X=X1+X2+⋯+XnX=X1+X2+⋯+Xn X = X_1 + X_2+\cdots+ X_n Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim N(0,\sigma^2) Moje pytanie brzmi: co robi dystrybucja Z=X2X21+X22+⋯+X2nZ=X2X12+X22+⋯+Xn2 Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2} podążać? Wiem stąd, że stosunek dwóch losowych...

normal-distribution chi-squared beta-distribution ratio

11

Do jakiego rodzaju wyboru funkcji można zastosować test Chi kwadrat?

Tutaj pytam o to, co inni często robią, aby użyć testu chi-kwadrat do wyboru funkcji w wyniku uczenia się nadzorowanego. Jeśli dobrze rozumiem, czy testują niezależność między każdą cechą a wynikiem i porównują wartości p między testami dla każdej cechy? W

hypothesis-testing chi-squared feature-selection independence scikit-learn

11

Kolejność statystyk (np. Minimum) nieskończonej kolekcji zmiennych chi-kwadrat?

To jest mój pierwszy raz tutaj, więc proszę dać mi znać, czy mogę wyjaśnić moje pytanie w jakikolwiek sposób (w tym formatowanie, tagi itp.). (Mam nadzieję, że mogę później edytować!) Próbowałem znaleźć referencje i próbowałem rozwiązać siebie za pomocą indukcji, ale nie udało mi się obu. Próbuję...

distributions chi-squared exponential order-statistics minimum

11

Jak interpretować kolory resztkowe na mozaice?

Jest to mozaika wykres tabeli awaryjnego zestawu danych HairEyeColoropisanego tutaj . Jak interpretować kolory reprezentujące reszty? Jaka jest różnica między wysoką a dodatnią resztą Pearsona (pokazaną na niebiesko) w porównaniu z niską i ujemną resztą na

data-visualization chi-squared residuals contingency-tables

11

Dlaczego test McNemara wykorzystuje chi-kwadrat, a nie rozkład normalny?

Właśnie zauważyłem, jak nieprecyzyjny test McNemara wykorzystuje asymptotyczny rozkład chi-kwadrat. Ale skoro dokładny test (dla tabeli dwóch przypadków) opiera się na rozkładzie dwumianowym, dlaczego nie jest tak często sugerować normalne przybliżenie do rozkładu

distributions binomial chi-squared normal-distribution

11

Który test do analizy krzyżowej: Boschloo czy Barnard?

Analizuję tabelę 2x2 z małego zestawu danych 30 pacjentów. Próbujemy retrospektywnie znaleźć pewne zmienne, które podpowiadają, jaki rodzaj leczenia wybrać. Zmienne (obs normalne / dziwne) i decyzja dotycząca leczenia (A / B) są szczególnie interesujące i dlatego dane wyglądają tak: Obs / Tr....

chi-squared power contingency-tables fishers-exact