Stack Exchange, jak wszyscy wiemy, to zbiór stron z pytaniami i odpowiedziami na różne tematy. Zakładając, że każda strona jest od siebie niezależna, biorąc pod uwagę statystyki użytkownika, jak obliczyć jego „zaokrąglenie” w porównaniu do następnego faceta? Jakie narzędzie statystyczne powinienem zastosować?
Szczerze mówiąc, nie do końca wiem, jak matematycznie zdefiniować „okrągłość”, ale musi mieć następujące cechy:
- Wszystkie rzeczy są równe, im więcej powtórzeń ma użytkownik, tym bardziej jest zaokrąglony
- Wszystkie rzeczy są równe, im więcej stron użytkownik bierze udział, tym bardziej jest zaokrąglony.
- Czy odpowiedź lub pytanie nie wpływa na okrągłość
Odpowiedzi:
Musisz również uwzględnić podobieństwo między stronami. Ktoś, kto uczestniczy w StackOverflow i Seasoned Advice, jest bardziej zaokrąglony niż ktoś, kto uczestniczy w SO i CrossValidated, który z kolei (argumentowałbym) bardziej zaokrąglony niż ktoś, kto uczestniczy w SO i Programistach . Istnieje niewątpliwie wiele sposobów, aby to zrobić, ale możesz sprawdzić nakładającą się rejestrację, aby po prostu to sprawdzić.
źródło
PRZYKŁAD: powiedzmy, że istnieją trzy witryny i chcemy porównać dobrze zaokrąglone użytkowników A, B, C. Piszemy reputację użytkowników na tych trzech stronach w formie wektorowej:
Uważamy, że A jest bardziej zaokrąglony niż B (obie ich reputacje są równomiernie rozmieszczone w dwóch witrynach, ale A ma lepszą reputację). Ponadto uważalibyśmy, że C jest bardziej zaokrąglony niż B (mają taką samą całkowitą reputację, ale C ma nawet większy zasięg w większej liczbie witryn). Nie jest zdecydowane, czy A należy uznać za bardziej zaokrąglone niż C, czy odwrotnie .
Dwa popularne przykłady funkcji wypukłych to „norma ułamkowa”
Mierząc według skalowanej entropii Shannona, powiedzielibyśmy, że C jest najbardziej zaokrąglonym z trzech, a A drugim najbardziej zaokrąglonym.
EDYCJA 2: Dodano przykład w świetle komentarza Whubera.
źródło
To naprawdę interesujące pytanie (w rzeczy samej, jestem trochę zakochany w pomyśle modelowania stron wymiany stosów w ogóle).
Jeśli chodzi o kwestię wszechstronności, jednym ze sposobów oceny tego byłoby użycie tagów, na które poszczególni użytkownicy zwykle odpowiadają, i ich dystrybucja w różnych witrynach. Przykłady mogą to wyjaśnić.
Jestem członkiem TeX, StackOverflow, CrossValidated i AskUbuntu. Teraz naprawdę wnoszę tylko wkład tutaj i StackOverflow, i tylko o R w Stackoverflow. Aby więc zdefiniować dobrze zaokrąglenie, przyjrzałbym się: a) ilości znaczników, które mają dwie strony wspólne (w celu zdefiniowania podobieństwa między witrynami) oraz zakresu, w jakim użytkownik odpowiada na pytania w witrynach, które mają niewiele znaczników lub nie mają ich wcale.
Jeśli na przykład ktoś przyczynia się do tagów Python w StackOverflow i gotowaniu, ta osoba jest bardziej dopracowana niż ktoś, kto odpowiada na pytania dotyczące oprogramowania statystycznego (na przykład) na pytania dotyczące przepełnienia i statystyk.
Mam nadzieję, że jest to nieco pomocne.
źródło
Jeśli zdefiniujesz „dobrze zaokrąglony” jako „przyczyniający się do wielu różnych witryn stosu wymiany”, obliczę pewną miarę wkładu dla każdej witryny. Możesz użyć łącznej liczby postów, średniej liczby postów dziennie lub reputacji. Następnie spójrz na rozkład tej metryki we wszystkich witrynach i oblicz jej skośność w sposób, który ma sens.
Innymi słowy, „dobrze zaokrąglona” osoba to osoba, która przyczynia się do wielu różnych witryn, podczas gdy „nie zaokrąglona” osoba to osoba, która przede wszystkim przyczynia się do jednej witryny. Możesz to jeszcze poprawić, skalując metrykę z sumą użytkownika we wszystkich witrynach. tzn. ktoś, kto dużo wniósł do wielu różnych witryn, powinien być uważany za bardziej wszechstronnego niż ktoś, kto nie wniósł nic do żadnej z tych stron. Osoba, która nigdy nie używała SE, nie jest zbyt dobrze zaokrąglona!
źródło
Już wiele dobrych odpowiedzi, więc dlaczego jeszcze jedna? Ma to przede wszystkim zwrócić uwagę na ciekawe pomysły omówione tutaj w kawiarni The n-Category Café . Podczas gdy różnorodność w ekologii (i gdzie indziej) przeważnie skupia się tylko na obfitości, należy również przyjrzeć się, jak podobne / odmienne są różne gatunki.
Reprezentując gatunek (lub cokolwiek, jak miejsca SE ...) jako punkty w przestrzeni metrycznej, prowadzi to do uogólnienia entropii do przestrzeni metrycznych, patrz na przykład Maksymalna entropia przestrzeni metrycznej autorstwa Toma Leinstera, Emily Roff . Te same pomysły można zastosować w witrynach SE, patrząc na znaczniki jako punkty w przestrzeni metrycznej.
źródło