Z góry dziękuję za kontakt ze mną, nie jestem żadnym statystykiem i nie wiem, jak opisać to, co sobie wyobrażam, więc Google mi tu nie pomaga ...
Dołączam system oceniania do aplikacji internetowej, nad którą pracuję. Każdy użytkownik może ocenić każdy element dokładnie raz.
Wyobraziłem sobie skalę z 4 wartościami: „zdecydowanie nie lubię”, „nie lubię”, „lubię” i „mocno lubię”, i planowałem przypisać te wartości odpowiednio -5, -2, +2 i +5 .
Teraz, jeśli każdy przedmiot miałby mieć taką samą liczbę ocen, to czułbym się dobrze z tym systemem punktacji, ponieważ wyraźnie odróżnia przedmioty najbardziej lubiane i najmniej lubiane. Jednak elementy nie będą miały takiej samej liczby ocen, a rozbieżność między liczbą głosów na różnych zdjęciach może być dość dramatyczna.
W takim przypadku porównanie skumulowanych wyników dla dwóch elementów oznacza, że stary element z wieloma miernymi ocenami będzie miał znacznie wyższy wynik niż nowy wyjątkowy element z większą liczbą głosów.
Tak więc pierwszą oczywistą rzeczą, o której pomyślałem, byśmy wzięli średnią ... ale teraz, jeśli przedmiot ma tylko jedną ocenę „+5”, ma lepszą średnią niż pozycja, która ma ocenę 99 „+5” ocen oraz ocena 1 „+2”. Intuicyjnie nie jest to dokładne odzwierciedlenie popularności przedmiotu.
Wyobrażam sobie, że ten problem jest powszechny, a wy nie musicie przedstawiać go więcej przykładów, więc zatrzymam się w tym miejscu i w razie potrzeby rozwinę komentarz.
Moje pytania to:
- Jak nazywa się ten rodzaj problemu i czy istnieje termin na techniki stosowane do jego rozwiązania? Chciałbym to wiedzieć, aby móc o tym poczytać.
- Jeśli zdarzy ci się znać jakieś przyjazne dla świeckich zasoby na ten temat, bardzo doceniam link.
- Na koniec docenię wszelkie inne sugestie dotyczące skutecznego gromadzenia i analizowania tego rodzaju danych.
Przyjąłbym podejście graficzne. Oś X może być średnią oceną, a y może być liczbą ocen. Robiłem to ze statystykami sportowymi, aby porównać udział młodych zjawisk z udziałem weteranów. Im bliżej jest punktu w prawym górnym rogu, tym bliżej ideału. Oczywiście decyzja o „najlepszym” elemencie nadal byłaby decyzją subiektywną, ale dałoby to pewną strukturę.
Jeśli chcesz wykreślić średnią ocenę z inną zmienną, możesz ustawić liczbę ocen jako trzecią zmienną, używając rozmiaru bąbelka, na wykresie bąbelkowym - np. W XL lub SAS.
źródło