Stworzyłem stronę internetową, która wyświetla wyniki medali olimpijskich na żywo od Thompson Reuters i ogólnoświatowej populacji CIA.
Wyniki są dla mnie interesujące - Węgry mają dwucyfrową liczbę złotych medali na całym świecie. Ponadto USA i Chiny znajdują się na dole w niemal każdej kategorii.
Moje pytanie brzmi - czy przedstawiam dane w uczciwy sposób? Po prostu wziąłem największą populację, a następnie na tej podstawie stworzyłem czynnik dla każdego kraju. Względne kolumny liczbowe oparte są na tym współczynniku.
Jakie kolumny mogę dodać? Jakie inne czynniki mogę dodać, aby przedstawić najbardziej uczciwy obraz? Widok absolutny jest łatwy - robi to Reuters. Jak stworzyć uczciwy widok?
statistical-significance
Ronnie Royston
źródło
źródło
Odpowiedzi:
Próbujesz oszacować szansę wygrania medalu przez jakąkolwiek osobę, wiedząc, że „dane”, które mamy, to tylko liczba według kraju. To świetne pytanie, uczciwe rozwiązanie bliżej ducha Olimpiady.
Zasadniczo jest to problem statystyczny, który jest dobrze aproksymowany przez twoją metodę jako średnia liczba (częstotliwość) medali (dla każdego koloru) w stosunku do populacji. Ale jak niezawodna jest ta metoda? Jest to dość bliskie problemowi oszacowania wiarygodności rzutu dwumianowego z różnej liczby rzutów, który ma aplikacje na przykład do porównywania jakości sprzedawców w Amazon na podstawie różnych liczb zwrotnych (zobacz to dokładne wyjaśnienie ).
W tym konkretnym przypadku liczba ludności jest zawsze wystarczająca do przybliżenia rozkładu beta z wartością normalną - tak, że z pewnością możliwe jest porównanie istotności każdego oszacowania dla każdego kraju.
źródło