Statystyki i duże zbiory danych

16
Analiza punktu zmiany za pomocą R's nls ()

Próbuję zaimplementować analizę „punktu zmiany” lub regresję wielofazową nls()w R. Oto kilka fałszywych danych, które stworzyłem . Formuła, której chcę użyć do dopasowania danych, to: y= β0+ β1x + β2)max ( 0 , x - δ)y=β0+β1x+β2)max(0,x-δ)y = \beta_0 + \beta_1x + \beta_2\max(0,x-\delta) Powinno...

16
Założenia analizy skupień

Przepraszam za podstawowe pytanie, jestem nowy w tej formie analizy i jak dotąd mam bardzo ograniczone rozumienie zasad. Zastanawiałem się tylko, czy wiele z parametrycznych założeń dla testów wielowymiarowych / jednowymiarowych ma zastosowanie do analizy skupień? Wiele źródeł informacji, które...

16
Jak obliczyć przedziały ufności dla d Cohena?

Obliczyłem współczynnik d Cohena dla współczynników regresji (na podstawie statystyki t), ilorazów szans i różnic średnich, mając nadzieję na połączenie wyników w metaanalizie i zobaczenie, jak to działa. Jednak w Stacie nie wydaje się, abyś mógł łączyć te wyniki bez przedziałów ufności dla d...

16
Ocena wiarygodności kwestionariusza: wymiarowość, problematyczne elementy i czy użyć alfa, lambda6 lub jakiegoś innego indeksu?

Analizuję wyniki podane przez uczestników biorących udział w eksperymencie. Chcę oszacować wiarygodność mojego kwestionariusza, który składa się z 6 pozycji, mających na celu oszacowanie stosunku uczestników do produktu. Obliczyłem alfa Cronbacha traktującego wszystkie elementy jako pojedynczą...

16
Co dokładnie oznacza „gromadzenie danych”?

Pomyślałem, że „łączenie danych” oznacza po prostu łączenie danych, które wcześniej były podzielone na kategorie ... zasadniczo, ignorując kategorie i czyniąc zestaw danych jedną gigantyczną „pulą” danych. Myślę, że to pytanie dotyczy bardziej terminologii niż stosowania statystyk. Na przykład:...

16
Generowanie losowych próbek z niestandardowej dystrybucji

Próbuję wygenerować losowe próbki z niestandardowego pliku PDF przy użyciu R. Mój pdf to: fX(x)=32(1−x2),0≤x≤1fX(x)=32(1−x2),0≤x≤1f_{X}(x) = \frac{3}{2} (1-x^2), 0 \le x \le 1 Wygenerowałem jednolite próbki, a następnie próbowałem przekształcić je w moją niestandardową dystrybucję. Zrobiłem to,...

16
Grupowanie danych 1D

Mam zestaw danych, chcę utworzyć klastry na tych danych na podstawie tylko jednej zmiennej (nie ma brakujących wartości). Chcę utworzyć 3 klastry na podstawie tej jednej zmiennej. Którego algorytmu grupowania użyć, k-średnich, EM, DBSCAN itp.? Moje główne pytanie brzmi: w jakich okolicznościach...