Dlaczego demografowie podają stawki za 100 000 osób?

10

Wydaje się uniwersalne, że statystyki demograficzne są podawane w przeliczeniu na 100 000 ludności rocznie. Na przykład wskaźnik samobójstw, wskaźnik zabójstw, rok życia skorygowany o niepełnosprawność, lista jest długa. Dlaczego?

Gdybyśmy mówili o chemii, części na milion (ppm) są powszechne. Dlaczego liczenie ludzi jest postrzegane zasadniczo inaczej. Liczba 100 000 nie ma podstaw w systemie SI i, o ile mogę stwierdzić, nie ma ona żadnych podstaw empirycznych, z wyjątkiem słabej relacji do wartości procentowej. Liczbę na 100 000 można interpretować jako miliard procent, m%. Myślałem, że to może wydać jęki.

Czy to artefakt historyczny? Czy jest jakiś argument za obroną jednostki?

AlanSE
źródło
4
W przypadku wskaźników zabójstw 100 000 jest zasadniczo najmniejszą liczbą potrzebną, aby nie zgłaszać tej liczby w liczbach dziesiętnych.
Andy W
@ Andy Cóż, zgadzam się z tym i sam miałem taką samą myśl. Ale to pozostawia wiele innych z szybkością 1000, ponieważ bez względu na to, jak je pokroisz, zakres informacji demograficznych prezentowanych w formacie ma pewne rzędy różnic wielkości. Drugi argument, że 100 000 to miasto średniej wielkości, wydaje się być bardzo wyraźnym powodem.
AlanSE
2
Nigdy nie słyszałem scenariusza miasta średniej wielkości jako uzasadnienia wskaźników przestępczości. Tutaj, w USA, UCR zgłasza wskaźniki przestępczości dla jurysdykcji policji, powiatów, stanów, większych regionów, obszarów wiejskich / miejskich oraz różnych podziałów według wielkości miast lub metropolitalnych obszarów statystycznych. W mieście, w którym dorastałem, mieszkało około 2000 osób. Czy mam interpretować wskaźnik przestępczości na 100 000 w moim rodzinnym mieście, tak jakby to było miasto o wielkości 100 000?
Andy W

Odpowiedzi:

11

Trochę badań pokazuje, po pierwsze, że demografowie (i inni, tacy jak epidemiologowie, którzy zgłaszają częstości zdarzeń w populacjach ludzkich), nie „uniwersalnie” używają 100 000 jako mianownika. Rzeczywiście, „demografia 100000” Googlinga lub podobne wyszukiwania wydają się wyświetlać tyle dokumentów przy użyciu 1000 dla mianownika, co 100 000. Przykładem jest Słownik terminów demograficznych Biura Populacji , który konsekwentnie używa 1000.

Rozejrzenie się w pismach wczesnych epidemiologów i demografów pokazuje, że ci pierwsi (tacy jak John Graunt i William Petty, współtworzyli wczesne londyńskie rachunki śmierci , 1662) nawet nie znormalizowali swoich statystyk: zgłaszali surowe liczby w poszczególnych jednostkach administracyjnych (np. miasto Londyn) w danych przedziałach czasowych (np. jeden rok lub siedem lat).

Przełomowy epidemiolog John Snow (1853) opracował tabele znormalizowane do 100 000, ale omawiał stawki na 10 000. Sugeruje to, że mianownik w tabelach został wybrany zgodnie z liczbą dostępnych znaczących cyfr i dostosowany, aby wszystkie wpisy były integralne.

[0,1]

Współczesny przykład konsekwentnego stosowania przeskalowania o potęgę dziesięciu w celu osiągnięcia możliwych do zintegrowania wartości całkowitych w zestawach danych podano w klasycznym tekście Johna Tukeya , EDA (1977). Podkreśla, że ​​analitycy danych powinni swobodnie przeskalowywać (i, bardziej ogólnie, nieliniową ponowną ekspresję) danych, aby były bardziej odpowiednie do analizy i łatwiejsze w zarządzaniu.

Dlatego wątpię w spekulacje, jakkolwiek naturalne i pociągające, że mianownik 100 000 historycznie wywodzi się z jakiejkolwiek szczególnej ludzkiej skali, takiej jak „małe do średniego miasta” (które do XX wieku i tak miałoby mniej niż 10 000 ludzi i tak daleko mniej niż 100 000).

Whuber
źródło
5

Wydaje mi się, że kilkadziesiąt lat temu przypominam sobie na kursie geografii populacyjnej nasz instruktor (profesor Brigette Waldorf, obecnie z Purdue University) powiedział [coś do skutku], że wyrażamy liczbę zdarzeń (np. Zgony, porody) na 100 000, ponieważ nawet jeśli wystąpi tylko 30 lub 50 zdarzeń, nie musimy uciekać się do nieznośnych wartości procentowych. Intuicyjnie sensowniejsze jest dla większości ludzi (choć prawdopodobnie nie czytelników tego cenionego forum) stwierdzenie, dobrze w dolnej części Wydry Górnej, śmiertelność z powodu ukąszenia węża u mężczyzn w wieku od 35 do 39 lat w 2010 r. Wynosiła 13 na 100 000 mieszkańców. Ułatwia to porównywanie stawek w różnych lokalizacjach i kohortach (choć również procentowe).

Chociaż nie jestem demografem, nigdy nie słyszałem, aby ktokolwiek odwoływał się do średniej wielkości sporu o miasto, choć brzmi to rozsądnie. Po prostu przez około 20 lat pracy z geografami i pokrewnymi naukowcami społecznymi jako studentem, doktorantem, a obecnie członkiem wydziału, nigdy nie słyszałem takiego konkretnego wyjaśnienia na temat wielkości miasta. Do teraz.

rabidotter
źródło
3

Zasadniczo staramy się przekazywać informacje rzeczywistym ludziom, więc przydatne jest użycie liczby, która jest znacząca dla ludzi. 100 000 ludzi to małe i średnie miasto, o którym łatwo pomyśleć.

Greg Snow
źródło
2
Ma to sens, ale czy masz na to referencje?
whuber
-1

Nie ma inteligentnego ani racjonalnego powodu do konwersji na 100 000.

Po prostu zmienia jednostki stosunku.

Większy problem polega na tym, że większość ludzi używa niewłaściwej domeny, gdy zmienia się w 100 000

Po prostu nie ma dobrego powodu, aby to zrobić.

Dr Lee
źródło
Witamy w Stats.SE. Czy możesz edytować swój post i uzasadnić swoje oświadczenia? Będzie to interesujące, jeśli możesz podać odniesienia, w szczególności do trzeciego zdania. W tym momencie możesz poprawić literówki w swoim poście. Nawiasem mówiąc, skorzystać z okazji, aby zrobić turystycznej ( stats.stackexchange.com/tour ), jeśli nie zostało to już zrobione. Zobacz także kilka porad dotyczących formatowania pomocy i zapisywania równań za pomocą LaTeX / MathJax .
Ertxiem