Statystyki i duże zbiory danych

14
Diagnostyka MCMC Geweke

Korzystam z próbnika Metropolis (C ++) i chcę użyć poprzednich próbek do oszacowania współczynnika konwergencji. Jedną z łatwych do wdrożenia diagnostyki, którą znalazłem, jest diagnostyka Geweke , która oblicza różnicę między dwoma średnimi próbkami podzielonymi przez szacowany błąd standardowy....

14
Różnica między danymi panelu a modelem mieszanym

Chciałbym poznać różnicę między analizą danych panelowych a analizą modelu mieszanego. Według mojej wiedzy, zarówno dane panelowe, jak i modele mieszane wykorzystują efekty stałe i losowe. Jeśli tak, to dlaczego mają różne nazwy? A może są synonimami? Przeczytałem następujący post, który opisuje...

14
Usuwanie obcych punktów w pobliżu środka wykresu QQ

Próbuję wykreślić wykres QQ z dwoma zestawami danych około 1,2 miliona punktów, w R (używając qqplot i wprowadzając dane do ggplot2). Obliczenia są dość łatwe, ale wynikowy wykres jest boleśnie powolny do ładowania, ponieważ jest tak wiele punktów. Próbowałem aproksymacji liniowej, aby zmniejszyć...

14
Jak w wyborach możemy stwierdzić, że kandydat zostanie zwycięzcą?

Wczoraj mieszkam w wyborach powszechnych, a sieć telewizyjna zaczęła wzywać zwycięzców na długo przed otwarciem wszystkich kart do głosowania. Okazały się słuszne na wszystkich kontach i nie jestem zaskoczony, że tak zrobili. Wiem, że statystyki są absolutnie wykonalne. Mimo to jestem ciekawa....

14
Czy istnieje prosty sposób wykrywania wartości odstających?

Zastanawiam się, czy istnieje prosty sposób wykrywania wartości odstających. W przypadku jednego z moich projektów, który był w zasadzie korelacją między liczbą osób biorących udział w aktywności fizycznej w ciągu tygodnia a liczbą posiłków poza domem (fast food) w ciągu tygodnia, narysowałem...