Statystyki i duże zbiory danych

11
Co to jest kontrola spójności?

Zadano mi takie pytanie, jak „Czy sprawdzałeś spójność w swojej codziennej pracy?” podczas rozmowy telefonicznej na stanowisko biostatystyczne. Nie wiem co odpowiedzieć. Wszelkie informacje są mile

11
Dobry tekst na temat badań klinicznych?

Jestem studentem statystyki licencjackiej szukającym dobrego leczenia analizy badań klinicznych. Tekst powinien obejmować między innymi podstawy projektowania eksperymentalnego, blokowania, analizy mocy, projektowania kwadratów łacińskich i projektów randomizacji klastrów. Mam licencjacką wiedzę...

11
Czy te formuły do ​​przekształcania P, LSD, MSD, HSD, CI do SE jako dokładne lub zawyżone / zachowawcze oszacowanie prawidłowe?

tło Przeprowadzam metaanalizę, która obejmuje wcześniej opublikowane dane. Często różnice między terapiami są zgłaszane z wartościami P, różnicami najmniej znaczącymi (LSD) i innymi statystykami, ale nie zapewniają bezpośredniego oszacowania wariancji. W kontekście modelu, którego używam,...

11
Jaki jest twój ulubiony problem z wprowadzeniem prawdopodobieństwa?

Lubię wprowadzać prawdopodobieństwo, dyskutując o paradoksie Chłopca, Dziewczyny czy Bertranda . Jaki inny (krótki) problem / gra stanowi motywujące wprowadzenie do prawdopodobieństwa? ( Poproszę jedną odpowiedź na odpowiedź ) PS Chodzi o delikatne wprowadzenie do prawdopodobieństwa, ale moim...

11
Jak zamówić lub uszeregować zestaw ekspertów?

Mam bazę danych zawierającą dużą liczbę ekspertów w danej dziedzinie. Dla każdego z tych ekspertów mam różne atrybuty / punkty danych, takie jak: liczba lat doświadczenia. licencje liczba recenzji treść tekstowa tych recenzji 5 gwiazdek w każdej z tych recenzji z powodu wielu czynników, takich...

11
Biblioteka statystyk z ograniczeniem plecakowym

Załóżmy, że masz 200 USD na budowę (bardzo) małej biblioteki książek statystycznych. Jakie byłyby twoje wybory? Możesz założyć bezpłatną wysyłkę z Amazon, a wszelkie swobodnie dostępne teksty z Internetu są uczciwą grą, ale zakładając, że wydrukujesz, pobierzesz 5 centów za stronę. (Zainspirowało...

11
Znajdowanie średniego punktu GPS

Muszę napisać program, aby znaleźć średni punkt GPS z populacji punktów. W praktyce dzieje się tak: Każdego miesiąca osoba rejestruje punkt GPS tego samego zasobu statycznego. Ze względu na charakter GPS punkty te różnią się nieznacznie każdego miesiąca. Czasami osoba popełnia błąd i zapisuje...

11
Prawdopodobieństwo, że ktoś polubi obraz

Mam następujący problem: - Mamy zestaw N osób - Mamy zestaw zdjęć K - Każda osoba ocenia pewną liczbę zdjęć. Osoba może polubić lub nie obraz (są to jedyne dwie możliwości). - Problem polega na tym, jak obliczyć prawdopodobieństwo, że dana osoba lubi określony obraz. Podam przykład...

11
Jak wykonać test T z dużymi próbkami?

Mam dwie populacje, jedną z N = 38 704 (liczba obserwacji), a drugą z N = 1 313 662. Te zestawy danych mają ~ 25 zmiennych, wszystkie ciągłe. Wziąłem średnią z każdego z każdego zestawu danych i obliczyłem statystyki testowe przy użyciu wzoru t = średnia różnica / błąd standardowy Problemem jest...