Pytania oznaczone «r»

71

Usuwanie zduplikowanej ramki danych wierszy w R [zamknięte]

Jak mogę usunąć zduplikowane wiersze z tej przykładowej ramki danych? A 1 A 1 A 2 B 4 B 1 B 1 C 2 C 2 Chciałbym usunąć duplikaty na podstawie obu kolumn: A 1 A 2 B 4 B 1 C 2 Porządek nie jest

r

70

Czy wymagany jest minimalny rozmiar próbki, aby test t był ważny?

Obecnie pracuję nad quasi-eksperymentalnym artykułem badawczym. Mam tylko 15-osobową próbkę ze względu na małą populację w wybranym obszarze i tylko 15 spełnia moje kryteria. Czy 15 to minimalny rozmiar próbki do obliczenia dla testu t i testu F. Jeśli tak, to gdzie mogę uzyskać artykuł lub książkę...

t-test sample-size assumptions power

69

Jaka jest różnica między funkcjami R prcomp i princomp?

Porównałem ?prcompi ?princompznalazłem coś na temat analizy głównego składnika w trybie Q i R (PCA). Ale szczerze mówiąc - nie rozumiem tego. Czy ktoś może wyjaśnić różnicę, a może nawet wyjaśnić, kiedy

r pca

69

Kształt przedziału ufności dla przewidywanych wartości w regresji liniowej

Zauważyłem, że przedział ufności dla przewidywanych wartości w regresji liniowej jest zwykle wąski wokół średniej predyktora, a tłuszcz wokół minimalnych i maksymalnych wartości predyktora. Można to zobaczyć na wykresach tych 4 regresji liniowych: Początkowo myślałem, że dzieje się tak, ponieważ...

regression confidence-interval linear-model standard-error prediction-interval

68

Wieloczynnikowa regresja wielokrotna w R.

Mam 2 zmienne zależne (DV), na które na każdy wynik może mieć wpływ zestaw 7 zmiennych niezależnych (IV). DV są ciągłe, podczas gdy zestaw IV składa się z kombinacji zmiennych ciągłych i binarnie kodowanych. (W kodzie poniżej zmienne ciągłe są pisane dużymi literami, a zmienne binarne małymi...

r multivariate-analysis manova multiple-regression multivariate-regression

67

Jak dokładnie statystycy zgodzili się używać (n-1) jako obiektywnego estymatora wariancji populacji bez symulacji?

Wzór na wariancję obliczeniową ma w mianowniku:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Zawsze zastanawiałem się dlaczego. Wydaje się jednak, że czytanie i oglądanie kilku dobrych filmów o tym „dlaczego” jest dobrym obiektywnym...

variance unbiased-estimator proof history

67

Jaka korelacja czyni macierz osobliwością i jakie są implikacje osobliwości lub bliskości osobliwości?

Robię obliczenia na różnych macierzach (głównie w regresji logistycznej) i często pojawia się błąd „Matryca jest pojedyncza”, gdzie muszę wrócić i usunąć skorelowane zmienne. Moje pytanie brzmi: co uważasz za „wysoce” skorelowaną macierz? Czy istnieje wartość progowa korelacji reprezentująca to...

regression correlation matrix multicollinearity singular

66

Obliczanie parametrów rozkładu Beta przy użyciu średniej i wariancji

Jak obliczyć parametry i dla rozkładu Beta, jeśli znam średnią i wariancję, którą chcę mieć dla tego rozkładu? Najbardziej pomocne byłyby przykłady polecenia R do wykonania tej

r distributions estimation beta-distribution

64

Czy język R jest wiarygodny w dziedzinie ekonomii?

Jestem absolwentem ekonomii, który niedawno przeszedł na R z innych bardzo znanych pakietów statystycznych (głównie używałem SPSS). Obecnie moim małym problemem jest to, że jestem jedynym użytkownikiem R. w mojej klasie. Moi koledzy z klasy używają Staty i Gaussa, a jeden z moich profesorów...

r software econometrics

64

Jak interpretować współczynniki w regresji Poissona?

Jak mogę zinterpretować główne efekty (współczynniki dla fikcyjnego czynnika) w regresji Poissona? Załóżmy następujący przykład: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7,...

r generalized-linear-model interpretation poisson-distribution regression-coefficients

64

W jaki sposób dodanie 2. IV może sprawić, że 1. IV będzie znaczący?

Mam pytanie, które jest prawdopodobnie proste, ale teraz mnie to zaskakuje, więc mam nadzieję, że możesz mi pomóc. Mam model regresji metodą najmniejszych kwadratów, z jedną zmienną niezależną i jedną zmienną zależną. Związek nie jest znaczący. Teraz dodaję drugą zmienną niezależną. Teraz związek...

regression multiple-regression power suppressor

63

Czy po PCA następuje obrót (np. Varimax) nadal PCA?

Próbowałem odtworzyć niektóre badania (używając PCA) z SPSS w R. Z mojego doświadczenia wynika, że principal() funkcja z pakietu psychbyła jedyną funkcją, która się zbliżyła (lub jeśli moja pamięć służy mi dobrze, martwa), aby dopasować wynik. Aby dopasować te same wyniki co w SPSS, musiałem użyć...

r spss pca factor-analysis factor-rotation

62

Jak wykreślić przykładowe drzewo z randomForest :: getTree ()? [Zamknięte]

Każdy otrzymał sugestie dotyczące biblioteki lub kodu dotyczące sposobu wykreślenia kilku przykładowych drzew z: getTree(rfobj, k, labelVar=TRUE) (Tak, wiem, że nie powinieneś tego robić operacyjnie, RF to czarna skrzynka itp. Itp. Chcę wizualnie sprawdzić poprawność drzewa, aby zobaczyć, czy...

r data-visualization random-forest cart

62

Co oznaczają reszty w regresji logistycznej?

Odpowiadając na to pytanie, John Christie zasugerował, że dopasowanie modeli regresji logistycznej należy oceniać poprzez ocenę reszt. Znam sposób interpretowania reszt w OLS, są one w tej samej skali co DV i bardzo wyraźnie różnica między y przewidywana przez model y. Jednak w przypadku regresji...

r logistic generalized-linear-model residuals aic

62

Jak zgłaszać małe wartości

W przypadku niektórych testów Ristnieje dolna granica obliczeń wartości p . Nie jestem pewien, dlaczego jest to ta liczba, jeśli istnieje ku temu dobry powód lub jest to po prostu arbitralne. Wiele innych pakietów statystyk po prostu trafia , więc jest to o wiele wyższy poziom precyzji. Ale nie...

r p-value reporting precision

61

Dlaczego wcześniejsze Jeffreys są przydatne?

Rozumiem, że przeor Jeffreys jest niezmienny podczas ponownej parametryzacji. Jednak nie rozumiem, dlaczego ta właściwość jest pożądana. Dlaczego nie miałbyś chcieć zmiany przed zmianą przy zmianie

bayesian prior

60

Standardowe błędy do przewidywania lasso za pomocą R.

Próbuję użyć modelu LASSO do prognozowania i muszę oszacować standardowe błędy. Z pewnością ktoś już napisał paczkę, aby to zrobić. Ale o ile widzę, żaden z pakietów w CRAN, który wykonuje prognozy za pomocą LASSO, nie zwróci standardowych błędów dla tych prognoz. Więc moje pytanie brzmi: czy jest...

r standard-error prediction lasso

60

Dlaczego uwzględnianie szerokości i długości geograficznej na koncie GAM w celu autokorelacji przestrzennej?

Stworzyłem uogólnione modele dodatków do wylesiania. Aby uwzględnić autokorelację przestrzenną, uwzględniłem szerokość i długość geograficzną jako wygładzony termin interakcji (tj. S (x, y)). Oparłem to na przeczytaniu wielu artykułów, w których autorzy mówią: „aby uwzględnić przestrzenną...

r modeling spatial autocorrelation gam

60

Dlaczego gromadzenie danych do momentu uzyskania znaczącego wyniku zwiększa poziom błędu Typu I?

Zastanawiałem się dokładnie, dlaczego gromadzenie danych, dopóki nie zostanie uzyskany znaczący wynik (np. ) (tj. Hakowanie p), zwiększy poziom błędu Typu I?p<.05p<.05p \lt .05 Byłbym również bardzo wdzięczny za Rpokazanie tego

r hypothesis-testing p-value simulation type-i-and-ii-errors

59

Wyjaśnij komiks xkcd jelly bean: Co sprawia, że jest zabawny?

Widzę, że jeden z dwudziestu wszystkich przeprowadzonych testów, , więc błędnie zakładają, że podczas jednego z dwudziestu testów wynik jest znaczący ( ).p<0.05p<0.05p < 0.050.05=1/200.05=1/200.05 = 1/20 xkcd żelkowy komiks - „Znaczący” Tytuł: znaczący Umieść kursor: „„ Więc, zrobiliśmy...

hypothesis-testing statistical-significance confidence-interval p-value humor