Statystyki i duże zbiory danych

13
Twierdzenie Bayesa z wieloma warunkami

Nie rozumiem, jak wyprowadzono to równanie. P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M1∩M2)≤P(I)P(I′)⋅P(M1|I)P(M2|I)P(M1|I′)P(M2|I′)P(I|M_{1}\cap M_{2}) \leq \frac{P(I)}{P(I')}\cdot \frac{P(M_{1}|I)P(M_{2}|I)}{P(M_{1}|I')P(M_{2}|I')} To równanie pochodzi z pracy „Trial by...

13
Rozkład wariancji odchylenia

W sekcji 3.2 Rozpoznawania wzorców i uczenia maszynowego Bishopa omawia dekompozycję wariancji odchylenia, stwierdzając, że dla funkcji straty kwadratowej oczekiwana strata może zostać rozłożona na wartość kwadratową błędu (która opisuje, jak daleko średnie prognozy są od prawdziwej model), termin...

13
Wykresy małych próbek

Mam mały zestaw danych 14 osobnych razy, aby wykonać zadanie. Mam jednak trudności ze znalezieniem odpowiedniego wykresu, którego można by użyć do wykreślenia danych. Gdyby próbka była większa, użyłbym wykresu pudełkowego lub histogramu, ale nie jestem pewien, czy stosowne byłoby użycie w tym...

13
Oceń Random Forest: OOB vs CV

Kiedy oceniamy jakość Losowego Lasu, na przykład za pomocą AUC, czy bardziej odpowiednie jest obliczenie tych ilości na podstawie próbek po wyjęciu z torby lub na podstawie zestawu krzyżowego sprawdzania poprawności? Słyszałem, że obliczenie go na próbkach OOB daje bardziej pesymistyczną ocenę,...

13
Jakie były główne dane statystyczne Ronalda Fishera?

Richard Dawkins opisał Ronalda Fishera jako „ojca nowoczesnej statystyki i eksperymentalnego projektu”, linii cytowanej w biografii Fishera w Wikipedii . A także Anders Hald nazwał go „geniuszem, który prawie samodzielnie stworzył podstawy współczesnej nauki statystycznej” w swojej książce A...