Statystyki i duże zbiory danych

11

Pracuję z procesem z w dla { 1 , - 1 } t = 1 , 2 , …xtxtx_t{1,−1}{1,−1}\{1, -1\}t=1,2,…t=1,2,…t = 1, 2, \ldots Funkcja autokorelacji wskazuje na proces z długą pamięcią, tzn. Wyświetla rozpad prawa mocy z wykładnikiem <1. Można symulować podobną serię w R za pomocą: > library(fArma) >...

time-series predictive-models autocorrelation

11

Prognozy o 1 krok do przodu dzięki pakietowi dynlm R.

Dopasowałem model z kilkoma zmiennymi niezależnymi, z których jedną jest opóźnienie zmiennej zależnej, używając pakietu dynlm. Zakładając, że mam prognozy o krok do przodu dla moich zmiennych niezależnych, w jaki sposób mogę uzyskać prognozy o krok do przodu dla moich zmiennych zależnych? Oto...

r dynamic-regression

11

Symulacja serii ARIMA (1,1,0)

Dopasowałem modele ARIMA do oryginalnej serii czasowej, a najlepszym modelem jest ARIMA (1,1,0). Teraz chcę zasymulować serię z tego modelu. Napisałem prosty model AR (1), ale nie mogłem zrozumieć, jak dostosować różnicę w modelu ARI (1,1,0). Następujący kod R dla serii AR (1) to: phi= -0.7048...

r time-series arima

11

Używasz regresji Poissona dla ciągłych danych?

Czy można zastosować rozkład Poissona do analizy danych ciągłych, a także danych dyskretnych? Mam kilka zestawów danych, w których zmienne odpowiedzi są ciągłe, ale bardziej przypominają rozkład Poissona niż rozkład normalny. Jednak rozkład Poissona jest rozkładem dyskretnym i zwykle dotyczy liczb...

distributions regression poisson-distribution continuous-data

11

Średnia kwadratowa względem średniej bezwzględnej odchylenia?

Zarówno średni kwadrat główny, jak i średnie bezwzględne odchylenie wydają się być miarą wielkości zmienności (szczególnie, gdy zmienne mają zarówno + ve, jak i -ve). Jakie są podstawowe zasady wyboru jednego z

regression standard-deviation

11

Jak zatrzymać program Excel zmieniający zakres podczas przeciągania formuły w dół? [Zamknięte]

Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 7 lat temu . Próbuję znormalizować zestaw kolumn danych w arkuszu...

excel

11

Analiza mocy do analizy przeżycia

Jeśli postawię hipotezę, że sygnatura genu pozwoli zidentyfikować osoby o niższym ryzyku nawrotu, to znaczy obniży się o 0,5 (współczynnik ryzyka 0,5), wskaźnik zdarzeń u 20% populacji i zamierzam użyć próbek z retrospektywnego badania kohortowego wielkość próby musi być dostosowana do nierównych...

survival power-analysis genetics

11

Jak wybrać dobry punkt pracy z dokładnych krzywych przywołania?

Czy istnieje jakaś standardowa metoda określania „optymalnego” punktu pracy na krzywej dokładnego przywołania ? (tj. określenie punktu na krzywej, który zapewnia dobry kompromis między precyzją a

machine-learning precision-recall

11

Jak obsługiwać nieistniejące (nie brakujące) dane?

Nigdy tak naprawdę nie znalazłem żadnego dobrego tekstu ani przykładów na temat obsługi „nieistniejących” danych dla danych wejściowych do dowolnego rodzaju klasyfikatora. Dużo czytałem o brakujących danych, ale co można zrobić z danymi, które nie mogą istnieć lub nie istnieją w odniesieniu do...

missing-data

11

Co zrobić z objaśnieniami w szeregach czasowych?

Pracując głównie z danymi przekrojowymi do tej pory i bardzo niedawno przeglądając, skanując potykając się o kilka wstępnych literatur szeregów czasowych, zastanawiam się, jaką rolę odgrywają zmienne objaśniające w analizie szeregów czasowych. Chciałbym wyjaśnić trend zamiast usuwania trendów....

r time-series multivariate-analysis

11

Jak generować równomiernie rozmieszczone punkty w trójwymiarowej kulce?

Wysłałem poprzednie pytanie , jest to powiązane, ale myślę, że lepiej jest rozpocząć inny wątek. Tym razem zastanawiam się, jak wygenerować równomiernie rozmieszczone punkty w sferze jednostki 3-d oraz jak sprawdzić rozkład wizualnie i statystycznie? Nie widzę strategii tam zamieszczonych, które...

random-generation

11

Wielkość próbki wymagana do ustalenia, który zestaw reklam ma najwyższy współczynnik klikalności

Z zawodu jestem projektantem oprogramowania i pracuję nad projektem dla klienta i chciałbym upewnić się, że moja analiza jest statystycznie wiarygodna. Zastanów się, co następuje: Mamy n reklam (n <10) i chcemy po prostu wiedzieć, która reklama jest najskuteczniejsza. Nasz serwer reklam losowo...

anova sample-size t-test rule-of-thumb

11

Oznaczanie wykresów pudełkowych w R.

Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Muszę zbudować wykres pudełkowy bez żadnych osi i dodać go do bieżącego wykresu (krzywa ROC),...

r boxplot

11

Jak obliczyć parametr regularyzacji w regresji grzbietu przy danych stopniach swobody i macierzy wejściowej?

Niech A będzie macierzą n × pn×pn \times p zmiennych niezależnych, a B będzie odpowiadającą macierzą wartości zależnych. Regresję kalenicy, że określenie parametrów tak, że: . Teraz pozwól [usv] = svd (A) i ukośny wpis „s”. definiujemy stopnie swobody (df) = . Regresja grzbietu zmniejsza...

ridge-regression

11

Jaka jest różnica między wynikami Z a wartościami p?

W algorytmach motywów sieciowych wydaje się dość powszechne zwracanie zarówno wartości p, jak i wyniku Z dla statystyki: „Sieć wejściowa zawiera X kopii podgrupy G”. Podgraf jest uważany za motyw, jeśli spełnia wartość p <A, Wynik Z> B i X> C, dla niektórych A, B i C. zdefiniowanych...

hypothesis-testing p-value z-statistic

11

Jakie metody graficzne są przydatne do wizualizacji agregacji niepewności?

Mam zestaw systemów, w których gromadzą się w nim niepewności. Nie zawsze są one czysto addytywne - czasem są, a czasem nie. Odniosłem pewne sukcesy w stosowaniu wykresów wachlarzowych, słupkowych z przedziałami ufności i wykresów pudełkowych do komunikowania pojedynczych elementów. Ale w jaki...

data-visualization confidence-interval uncertainty

11

Przykłady badań z wykorzystaniem p <0,001, p <0,0001 lub nawet niższych wartości p?

Pochodzę z nauk społecznych, gdzie p <0,05 jest prawie normą, przy czym p <0,1 ip <0,01 również się pojawiają, ale zastanawiałem się: jakie kierunki studiów, jeśli w ogóle, używają niższych wartości p jako wspólnej

statistical-significance p-value

11

Co oznacza liniowa regresja liniowa?

W R, jeśli napiszę lm(a ~ b + c + b*c) czy nadal byłaby to regresja liniowa? Jak zrobić inne rodzaje regresji w R? Byłbym wdzięczny za jakieś zalecenia dotyczące podręczników lub

r regression

11

Porównywanie współczynników regresji logistycznej między modelami?

Opracowałem model logit do zastosowania w sześciu różnych zestawach danych przekrojowych. Próbuję odkryć, czy nastąpiły zmiany w merytorycznym wpływie danej zmiennej niezależnej (IV) na zmienną zależną (DV) sterującą innymi wytłumaczeniami w różnych momentach i czasie. Moje pytania to: Jak...

logistic spss

11

Jak wybrać liczbę komponentów do analizy niezależnych komponentów?

Wobec braku dobrych wstępnych domysłów na temat liczby komponentów, które należy zamówić w niezależnej analizie komponentów, chcę zautomatyzować proces selekcji. Myślę, że rozsądnym kryterium może być liczba, która minimalizuje globalne dowody korelacji między obliczonymi składnikami. Oto pseudokod...

ica