Statystyki i duże zbiory danych

15
Czy eksperci są szkodliwi?

Czytam „Rola szachów w badaniach nad sztuczną inteligencją” ( pdf ) i co ciekawe: Doświadczenie [...] sugeruje, że wkładom ekspertów szachowych, choć ogólnie przydatnymi, nie można całkowicie ufać. Dobrym przykładem tego jest funkcja oceny Głębokiej Myśli. Kilka zmian dokonanych przez...

15
Jakiego języka używać do programowania genetycznego

W ramach zadania będę musiał napisać algorytm programowania genetycznego , który prognozuje poziomy zanieczyszczeń atmosferycznych. Ponieważ nie mam doświadczenia, czy ktoś może mi wskazać propozycje języków programowania, w których pisane będą programy ewoluujące . Wyjaśnienie: Nie pytam, w jakim...

15
Jak ocenić odchylenie standardowe?

Zebrałem odpowiedzi od 85 osób na temat ich zdolności do podejmowania określonych zadań. Odpowiedzi są w pięciostopniowej skali Likerta: 5 = bardzo dobrze, 4 = dobrze, 3 = średnio, 2 = źle, 1 = bardzo źle, Średnia ocena wynosi 2,8, a odchylenie standardowe wynosi 0,54. Rozumiem, co oznaczają...

15
Tor zderzeniowy w solidnym szacowaniu średniej

Mam kilka (około 1000) oszacowań i wszystkie one mają być oszacowaniami długoterminowej elastyczności. Nieco ponad połowa z nich jest szacowana za pomocą metody A, a reszta za pomocą metody B. Gdzieś czytam coś w stylu „Myślę, że metoda B ocenia coś zupełnie innego niż metoda A, ponieważ szacunki...

15
Jak dokładnie działa wybór funkcji Chi-kwadrat?

Wiem, że dla każdej pary klas obiektów wartość statystyki chi-kwadrat jest obliczana i porównywana z wartością progową. Jestem trochę zmieszany. Jeśli istnieje cech i klas , jak buduje się tabelę awaryjną? Jak decydować, które funkcje zachować, a które usunąć?mmmkkk Wszelkie wyjaśnienia będą mile...

15
Czy mogę zignorować współczynniki dla nieistotnych poziomów czynników w modelu liniowym?

Po szukaniu wyjaśnienia na temat współczynników modeli liniowych tutaj mam pytanie uzupełniające dotyczące braku oznakowania (wysoka wartość p) dla współczynników poziomów czynników. Przykład: jeśli mój model liniowy zawiera współczynnik z 10 poziomami, a tylko 3 z tych poziomów mają powiązane z...

15
Notacja estymatorów (tylda vs. kapelusz)

1. Czy istnieje jakaś konwencja nazewnictwa dotycząca czapki i symbolu tyldy w statystykach? Znalazłem β jest opisujący prognozy dla p ( Wikipedia ), ale również ~ β jest opisujący prognozy dla P ( Wolfram ). Czy jest jakaś różnica w znaczeniu? W Internecie znalazłem pewną różnicę, ale nie jestem...

15
Jak uzyskać R-kwadrat dla lepszego dopasowania?

Jak obliczyć statystyki R-kwadrat ( ) w R dla i / lub wyniku funkcji? Na przykład dla tych danych:r2r2r^2loesspredict cars.lo <- loess(dist ~ speed, cars) cars.lp <- predict(cars.lo, data.frame(speed = seq(5, 30, 1)), se = TRUE) cars.lpma dwie tablice fitdla modelu i se.fitstandardowego...

15
Jak rozwinąć ramkę danych w R.

Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Mam problem z analizą R. Mam ramkę danych taką jak ta: Name | Group | Count Person 1 | A |...

15
Jak wybrać pomiędzy różnymi Skorygowane

Mam na myśli skorygowane wzory R-kwadrat zaproponowane przez: Ezekiel (1930), który moim zdaniem jest obecnie używany w SPSS. R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Olkin and Pratt (1958)...

15
Odwołanie do rozkładów o różnych właściwościach

Często zadaję sobie takie pytania, jak: „Wiem, że ta zmienna leży w a większość masy leży w a następnie stale spada w kierunku 1. Jakiego rozkładu mogę użyć do jej modelowania? „( 0 , 1 ) ( 0 , .20 )xxx( 0 , 1 )(0,1)(0,1)( 0 , .20 )(0,.20)(0,.20) W praktyce często używam tych samych kilku...

15
Wykrywanie szeregów czasowych i anomalii

Chciałbym skonfigurować algorytm do wykrywania anomalii w szeregach czasowych i planuję użyć do tego klastrowania. Dlaczego powinienem używać macierzy odległości do grupowania, a nie surowych danych szeregów czasowych ?, Do wykrycia anomalii użyję klastrowania opartego na gęstości, algorytmu...

15
Kiedy należy rozważyć użycie GMM?

Jedną z rzeczy, która sprawia, że ​​ekonometria jest wyjątkowa, jest zastosowanie techniki ogólnej metody momentów. Jakie rodzaje problemów sprawiają, że GMM jest bardziej odpowiedni niż inne techniki szacowania? Co kupuje GMM pod względem wydajności, mniejszej stronniczości lub bardziej...