Czy wynik egzaminu jest dwumianowy?

31

Oto proste pytanie statystyczne, które otrzymałem. Nie jestem pewien, czy to rozumiem.

X = liczba zdobytych punktów na egzaminie (wielokrotny wybór i prawidłowa odpowiedź to jeden punkt). Czy X jest dwumianowy?

Odpowiedź profesora brzmiała:

Tak, ponieważ są tylko dobre lub złe odpowiedzi.

Moja odpowiedź:

Nie, ponieważ każde pytanie ma inne „prawdopodobieństwo sukcesu” s. Jak zrozumiałem, rozkład dwumianowy jest tylko serią eksperymentów Bernoulliego, z których każdy ma prosty wynik (sukces lub porażka) z danym prawdopodobieństwem sukcesu p (i wszystkie są „identyczne” w odniesieniu do p). Np. Przerzucenie (uczciwej) monety 100 razy, to 100 eksperymentów Bernoulliego i wszystkie mają p = 0,5. Ale tutaj pytania mają różne rodzaje p, prawda?

Paweł
źródło
14
+1 Jeszcze bardziej do rzeczy: chyba że to dziwny egzamin, odpowiedzi na pytania będą silnie skorelowane. Jeśli jest całkowitym wynikiem dla danej osoby, wyklucza to rozkład dwumianowy. Czy to możliwe, że pytanie działa przy założeniu „hipotezy zerowej”, w której wszyscy badani niezależnie i losowo odgadują wszystkie odpowiedzi? X
whuber
2
Jak paradoksalnie, przynajmniej lobbowałem za częściowym uznaniem tego, ale „odpowiedź” wydaje się odzwierciedlać niechęć do przyznania go :) (myślę, że tu jesteś).
AdamO,
1
Tak, dziękuję: D, myślę, że to bardziej rozkład dwumianowy Poissona (jeśli w ogóle)
Paul
2
Zgadzam się ze wszystkimi, że pytanie było słabe, ale tutaj pojawia się problem z kadrowaniem. Jeśli jest to kurs podstawowy i ma krótką odpowiedź (abyś miał szansę wyjaśnić swoje rozumowanie), powiedziałbym, że najlepszą odpowiedzią jest prawdopodobnie „tak (zakładając niezależność i jednakową trudność dla każdego pytania)”; to zasygnalizuje profesorowi, że (1) rozumiesz ograniczenia pytania i (2) nie próbujesz być mądrym dupkiem.
Ben Bolker,

Odpowiedzi:

25

Zgodziłbym się z twoją odpowiedzią. Zazwyczaj tego rodzaju dane są obecnie modelowane za pomocą pewnego rodzaju modelu teorii odpowiedzi na przedmiot . Na przykład, jeśli używałeś modelu Rasch , to odpowiedź binarna byłaby modelowana jakoXni

Pr{Xni=1}=eβnδi1+eβnδi

gdzie można uznać za zdolność tej osoby, a za trudność pytania. Model pozwala więc uchwycić fakt, że różne osoby różnią się umiejętnościami, a pytania różnią się trudnością, a to jest najprostszy z modeli IRT.βnnδii

Profesorów odpowiedź zakłada, że wszystkie pytania mają takie samo prawdopodobieństwo „sukcesu” i są niezależne, ponieważ dwumianowy jest dystrybucja suma IID prób Bernoulliego. Ignoruje dwa rodzaje zależności opisanych powyżej.n

Jak zauważono w komentarzach, jeśli spojrzałeś na rozkład odpowiedzi konkretnej osoby (więc nie musisz się przejmować zmiennością międzyosobową) lub odpowiedzi różnych osób na ten sam element (więc nie ma między- zmienność pozycji), wówczas rozkład byłby dwumianowy Poissona, tj. rozkład sumy nie-iidowych prób Bernoulliego. Rozkład można aproksymować za pomocą dwumianu lub Poissona, ale to wszystko. W przeciwnym razie przyjmujesz założenie iid.n

Nawet przy założeniu „zerowego” zgadywania, zakłada to, że nie ma żadnych wzorców zgadywania, więc ludzie nie różnią się sposobem zgadywania, a przedmioty nie różnią się sposobem zgadywania - więc zgadywanie jest całkowicie losowe.

Tim
źródło
To ma sens! Chociaż wydaje mi się, że można obliczyć prawdopodobieństwo sukcesu pytania, ale „umiejętność osób” wydaje się trudna :) Innym pomysłem, jaki miałem, było modelowanie tego jako sumy rozkładów bernulli? Np. Powiedzmy, że są 2 pytania, a zatem 2 prawdopodobieństwa sukcesu p1 i p2. Analogicznie dwie zmienne zliczające X1 i X2 (czyli 2 eksperymenty bernulli). Zatem na przykład prawdopodobieństwo uzyskania jednego wyniku 1 wynosi P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1 -1) p2. Czy to brzmi rozsądnie?
Paul
2
@Paul suma dwóch Bernoulliego o różnych wartościach p to Poisson-binomial
Tim
4
Założenie „zerowe” jest w zasadzie kwestią krowy sferycznej, zawsze można spierać się o to, jak krowa jest sferyczna.
Hong Ooi,
5

Odpowiedź na ten problem zależy od sformułowania pytania i od momentu uzyskania informacji. Ogólnie rzecz biorąc, zazwyczaj zgadzam się z profesorem, ale uważam, że wyjaśnienie jego / jej odpowiedzi jest słabe, a pytanie profesora powinno zawierać więcej informacji z góry.

Jeśli weźmiesz pod uwagę nieskończoną liczbę potencjalnych pytań egzaminacyjnych i losujesz jedno losowo dla pytania 1, losuj jedno losowo dla pytania 2 itd. Następnie przechodząc do egzaminu:

  1. Każde pytanie ma dwa wyniki (dobre lub złe)
  2. Istnieje stała liczba prób (pytań)
  3. Każdą próbę można uznać za niezależną (jeśli chodzi o pytanie drugie, prawdopodobieństwo poprawnego wykonania jest takie samo jak w przypadku pytania pierwszego)p

W tych ramach spełnione są założenia eksperymentu dwumianowego.

Niestety źle zaproponowane problemy statystyczne są bardzo powszechne w praktyce, nie tylko na egzaminach. Nie zawahałbym się bronić twojego uzasadnienia przed profesorem.

Underminer
źródło
Jea, chyba też tak jest. Pytanie jest po prostu „złe”, ponieważ można argumentować na dwa sposoby, ponieważ podaje się tak mało informacji. Ale byłem bardzo niezadowolony z odpowiedzi udzielonej przez mojego profesora.
Paul
4
@Paul, naprawdę trudno jest pisać dobre pytania statystyczne. Wiem, że wielokrotnie to robiłem.
Gung - Przywróć Monikę
1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Myślę, że powinieneś wyraźnie założyć, że pytania egzaminacyjne są rysowane niezależnie od puli potencjalnych pytań. Bardziej realistyczna byłaby ich korelacja: jeśli pytanie 1 jest łatwe, prawdopodobne jest, że zostaniesz poddany łatwemu egzaminowi, a pytanie 2 będzie łatwe.
Adrian
0

Jeśli nie ma n pytań i mogę poprawnie odpowiedzieć na jedno pytanie z prawdopodobieństwem p, a jest wystarczająco dużo czasu, aby spróbować odpowiedzieć na wszystkie pytania, i zrobiłem 100 z tych testów, wtedy moje wyniki byłyby normalnie rozłożone ze średnią np.

Ale to nie ja powtarzam test 100 razy, to 100 różnych kandydatów robi jeden test, każdy z własnym prawdopodobieństwem p. Rozkład tych wartości p będzie czynnikiem nadrzędnym. Możesz mieć test, w którym p = 0,9, jeśli dobrze przestudiowałeś temat, p = 0,1, jeśli nie, z bardzo małą liczbą osób między 0,1 a 0,9. Rozkład punktów będzie miał bardzo silne maksima przy 0,1 n i 0,9 n i nie będzie zbliżony do rozkładu normalnego.

Z drugiej strony istnieją testy, w których każdy może odpowiedzieć na dowolne pytanie, ale zajmuje to różną ilość czasu, więc niektórzy odpowiedzą na wszystkie n pytań, a inni odpowiedzą mniej, ponieważ zabraknie czasu. Jeśli możemy założyć, że prędkość kandydatów jest rozkładem normalnym, wówczas punkty będą zbliżone do rozkładu normalnego.

Jednak wiele testów będzie zawierać bardzo trudne i bardzo łatwe pytania, celowo, abyśmy mogli rozróżnić najlepszych kandydatów (którzy odpowiedzą na wszystkie pytania do pewnego stopnia trudności) i najgorszych kandydatów (którzy będą w stanie odpowiedzieć tylko bardzo proste pytania). To dość mocno zmieniłoby rozkład punktów.

gnasher729
źródło
2
Rozkład normalny, który tu opisujesz, jest normalnym przybliżeniem dwumianu. Oczywiście suma zer i jedynek nie byłaby ciągła i mieściłaby się w przedziale od do
Tim
2
@Tim Pomimo niepotrzebnego polegania na normalnych rozkładach i tajemnicy wykonania 100 testów, ta odpowiedź ma wartość, próbując wykazać, w jaki sposób konkretny przypadek może prowadzić do oczywiście dwumianowego rozkładu. Jako taki może stanowić cenny wkład w odpowiedzi, jeśli te problemy techniczne zostaną rozwiązane.
whuber
0

Z definicji rozkład dwumianowy jest zbiorem niezależnych i identycznie rozmieszczonych prób Bernoulliego. W przypadku egzaminu wielokrotnego wyboru każde z pytań byłoby jedną z prób Bernoulliego.n n

Problem pojawia się tutaj, ponieważ nie możemy racjonalnie założyć, że pytań:n

  • identycznie dystrybuowane . Jak powiedziałeś, prawdopodobieństwo, że uczeń zna odpowiedź na pytanie prawie na pewno nie będzie takie samo, jak prawdopodobieństwo, że znają odpowiedź na pytanie i tak dalej.12
  • niezależne . Wiele egzaminów zadaje pytania oparte na odpowiedziach na poprzednie pytania. Kto na pewno powie, że to nie zdarzy się na egzaminie w tym pytaniu? Istnieją inne czynniki, które mogą sprawić, że odpowiedzi na pytania egzaminacyjne nie będą od siebie niezależne, ale myślę, że jest to najbardziej intuicyjnie oczywiste.

Widziałem pytania na lekcjach statystyki, które modelują pytania egzaminacyjne jako dwumianowe, ale są one sformułowane w następujący sposób:

Jaki rozkład prawdopodobieństwa modelowałby liczbę pytań, na które poprawnie udzielono odpowiedzi na egzaminie wielokrotnego wyboru, w którym każde pytanie ma cztery możliwości, a uczeń przystępujący do egzaminu zgaduje każdą odpowiedź losowo?

W tym scenariuszu byłby oczywiście reprezentowany jako rozkład dwumianowy z .p=14

jjw
źródło
Twoje fakty nie mają znaczenia, ale logika jest niepoprawna: nie wystarczy wykazać, że niektóre założenia mogą się nie utrzymywać, ponieważ (logicznie) rozkład może być w każdym razie dwumianowy. Musisz także wykazać, że te założenia mogą zawieść w sposób, który powoduje, że rozkład wyników zdecydowanie nie jest dwumianowy.
whuber