Oto proste pytanie statystyczne, które otrzymałem. Nie jestem pewien, czy to rozumiem.
X = liczba zdobytych punktów na egzaminie (wielokrotny wybór i prawidłowa odpowiedź to jeden punkt). Czy X jest dwumianowy?
Odpowiedź profesora brzmiała:
Tak, ponieważ są tylko dobre lub złe odpowiedzi.
Moja odpowiedź:
Nie, ponieważ każde pytanie ma inne „prawdopodobieństwo sukcesu” s. Jak zrozumiałem, rozkład dwumianowy jest tylko serią eksperymentów Bernoulliego, z których każdy ma prosty wynik (sukces lub porażka) z danym prawdopodobieństwem sukcesu p (i wszystkie są „identyczne” w odniesieniu do p). Np. Przerzucenie (uczciwej) monety 100 razy, to 100 eksperymentów Bernoulliego i wszystkie mają p = 0,5. Ale tutaj pytania mają różne rodzaje p, prawda?
self-study
binomial
Paweł
źródło
źródło
Odpowiedzi:
Zgodziłbym się z twoją odpowiedzią. Zazwyczaj tego rodzaju dane są obecnie modelowane za pomocą pewnego rodzaju modelu teorii odpowiedzi na przedmiot . Na przykład, jeśli używałeś modelu Rasch , to odpowiedź binarna byłaby modelowana jakoXni
gdzie można uznać za zdolność tej osoby, a za trudność pytania. Model pozwala więc uchwycić fakt, że różne osoby różnią się umiejętnościami, a pytania różnią się trudnością, a to jest najprostszy z modeli IRT.βn n δi i
Profesorów odpowiedź zakłada, że wszystkie pytania mają takie samo prawdopodobieństwo „sukcesu” i są niezależne, ponieważ dwumianowy jest dystrybucja suma IID prób Bernoulliego. Ignoruje dwa rodzaje zależności opisanych powyżej.n
Jak zauważono w komentarzach, jeśli spojrzałeś na rozkład odpowiedzi konkretnej osoby (więc nie musisz się przejmować zmiennością międzyosobową) lub odpowiedzi różnych osób na ten sam element (więc nie ma między- zmienność pozycji), wówczas rozkład byłby dwumianowy Poissona, tj. rozkład sumy nie-iidowych prób Bernoulliego. Rozkład można aproksymować za pomocą dwumianu lub Poissona, ale to wszystko. W przeciwnym razie przyjmujesz założenie iid.n
Nawet przy założeniu „zerowego” zgadywania, zakłada to, że nie ma żadnych wzorców zgadywania, więc ludzie nie różnią się sposobem zgadywania, a przedmioty nie różnią się sposobem zgadywania - więc zgadywanie jest całkowicie losowe.
źródło
Odpowiedź na ten problem zależy od sformułowania pytania i od momentu uzyskania informacji. Ogólnie rzecz biorąc, zazwyczaj zgadzam się z profesorem, ale uważam, że wyjaśnienie jego / jej odpowiedzi jest słabe, a pytanie profesora powinno zawierać więcej informacji z góry.
Jeśli weźmiesz pod uwagę nieskończoną liczbę potencjalnych pytań egzaminacyjnych i losujesz jedno losowo dla pytania 1, losuj jedno losowo dla pytania 2 itd. Następnie przechodząc do egzaminu:
W tych ramach spełnione są założenia eksperymentu dwumianowego.
Niestety źle zaproponowane problemy statystyczne są bardzo powszechne w praktyce, nie tylko na egzaminach. Nie zawahałbym się bronić twojego uzasadnienia przed profesorem.
źródło
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.
- Myślę, że powinieneś wyraźnie założyć, że pytania egzaminacyjne są rysowane niezależnie od puli potencjalnych pytań. Bardziej realistyczna byłaby ich korelacja: jeśli pytanie 1 jest łatwe, prawdopodobne jest, że zostaniesz poddany łatwemu egzaminowi, a pytanie 2 będzie łatwe.Jeśli nie ma n pytań i mogę poprawnie odpowiedzieć na jedno pytanie z prawdopodobieństwem p, a jest wystarczająco dużo czasu, aby spróbować odpowiedzieć na wszystkie pytania, i zrobiłem 100 z tych testów, wtedy moje wyniki byłyby normalnie rozłożone ze średnią np.
Ale to nie ja powtarzam test 100 razy, to 100 różnych kandydatów robi jeden test, każdy z własnym prawdopodobieństwem p. Rozkład tych wartości p będzie czynnikiem nadrzędnym. Możesz mieć test, w którym p = 0,9, jeśli dobrze przestudiowałeś temat, p = 0,1, jeśli nie, z bardzo małą liczbą osób między 0,1 a 0,9. Rozkład punktów będzie miał bardzo silne maksima przy 0,1 n i 0,9 n i nie będzie zbliżony do rozkładu normalnego.
Z drugiej strony istnieją testy, w których każdy może odpowiedzieć na dowolne pytanie, ale zajmuje to różną ilość czasu, więc niektórzy odpowiedzą na wszystkie n pytań, a inni odpowiedzą mniej, ponieważ zabraknie czasu. Jeśli możemy założyć, że prędkość kandydatów jest rozkładem normalnym, wówczas punkty będą zbliżone do rozkładu normalnego.
Jednak wiele testów będzie zawierać bardzo trudne i bardzo łatwe pytania, celowo, abyśmy mogli rozróżnić najlepszych kandydatów (którzy odpowiedzą na wszystkie pytania do pewnego stopnia trudności) i najgorszych kandydatów (którzy będą w stanie odpowiedzieć tylko bardzo proste pytania). To dość mocno zmieniłoby rozkład punktów.
źródło
Z definicji rozkład dwumianowy jest zbiorem niezależnych i identycznie rozmieszczonych prób Bernoulliego. W przypadku egzaminu wielokrotnego wyboru każde z pytań byłoby jedną z prób Bernoulliego.n n
Problem pojawia się tutaj, ponieważ nie możemy racjonalnie założyć, że pytań:n
Widziałem pytania na lekcjach statystyki, które modelują pytania egzaminacyjne jako dwumianowe, ale są one sformułowane w następujący sposób:
W tym scenariuszu byłby oczywiście reprezentowany jako rozkład dwumianowy z .p=14
źródło