Chciałbym dowiedzieć się, jak opracować przybliżenie geograficzne pewnego rodzaju epicentrum na podstawie danych z epidemii choroby John Snow Cholera. Jakie modelowanie statystyczne można zastosować do rozwiązania takiego problemu bez uprzedniej wiedzy o tym, gdzie znajdują się studnie.
Jako ogólny problem miałbyś do dyspozycji czas, lokalizację znanych punktów i ścieżkę spacerową obserwatora. Metoda, której szukam, wykorzystałaby te trzy rzeczy do oszacowania epicentrum „wybuchu”.
bayesian
spatial
epidemiology
gis
cylondude
źródło
źródło
Odpowiedzi:
Nie po to, aby udzielić pełnej lub wiarygodnej odpowiedzi, ale tylko w celu pobudzenia pomysłów, przedstawię szybką analizę, którą przeprowadziłem dla ćwiczenia laboratoryjnego na kursie statystyki przestrzennej, którego uczyłem dziesięć lat temu. Celem było sprawdzenie, jaki wpływ miałaby dokładna ewidencja prawdopodobnych ścieżek podróży (pieszo) w porównaniu z wykorzystaniem odległości euklidesowych na stosunkowo prostej metodzie badawczej: oszacowaniu gęstości jądra. Gdzie byłby szczyt (lub szczyty) gęstości w stosunku do pompy, której uchwyt usunął śnieg?
Używając dość wysokiej rozdzielczości reprezentacji rastrowej (2946 wierszy na 3160 kolumn) mapy Snow'a (odpowiednio georeferencyjnie), digitalizowałem każdą z setek małych czarnych trumien pokazanych na mapie (znajdując 558 z nich pod 309 adresami), przypisując każdą do krawędź ulicy odpowiadająca jej adresowi i podsumowująca według adresu w liczbie w każdej lokalizacji.
Po pewnym przetworzeniu obrazu w celu zidentyfikowania ulic i ulic, przeprowadziłem prostą dyfuzję Gaussa ograniczoną do tych obszarów (używając powtarzalnych środków ogniskowych w GIS). To jest KDE.
Wynik mówi sam za siebie - prawie wcale nie potrzebuje legendy, żeby to wyjaśnić. (Mapa pokazuje wiele innych pomp, ale wszystkie leżą poza tym widokiem, który koncentruje się na obszarach o największej gęstości).
źródło
W [1, §3.2] David Freedman sugeruje zasadniczo negatywną odpowiedź na twoje pytanie. Oznacza to, że żaden (zwykły) model statystyczny lub algorytm nie mógłby rozwiązać problemu Johna Snowa. Problemem Snowa było wypracowanie krytycznego argumentu na poparcie jego teorii, że cholera jest chorobą zakaźną przenoszoną przez wodę, w przeciwieństwie do panującej obecnie teorii miazmy . (Rozdział 3 w [1], zatytułowany „Modele statystyczne i skóra obuwnicza”, jest również dostępny w uprzednio opublikowanej formie [2] tutaj .)
Na tych kilku krótkich stronach [1, s. 47–53], z których większość jest rozszerzonym cytatem samego Johna Snowa, Freedman twierdzi, że „to, co Snow rzeczywiście zrobił w latach 1853–54, jest nawet bardziej interesujące niż bajka [Broad Street Pump]. ” Jeśli chodzi o zestawienie dowodów statystycznych (oprócz innych omówień, takich jak identyfikacja przypadków indeksowych itp.), Snow wykorzystał naturalną zmienność, aby uzyskać naprawdę niezwykły quasi-eksperyment.
Okazuje się, że wcześniej istniała silna konkurencja między firmami wodociągowymi w Londynie, co spowodowało przestrzenne mieszanie wody, która była (słowami Snow) „najbardziej intymna”.
Kolejną niezwykle ważną częścią „naturalnej zmienności”, którą John Snow wykorzystał w tym quasi-eksperymencie, było to, że jedno przedsiębiorstwo wodne miało pobór wody na Tamizie poniżej zrzutów ścieków , podczas gdy drugie kilka lat wcześniej przeniosło swoje ujęcie w górę rzeki . Pozwól, że zgadniesz, która była tabela danych Johna Snowa!
Jak Freedman zauważa miażdżąco:
Kolejny punkt naturalnej zmienności eksploatowanej przez Snow wystąpił w wymiarze czasowym : wspomniana relokacja ujęcia wody wystąpiła między dwiema epidemiami, umożliwiając Snowowi porównanie wody tej samej firmy z dodatkowymi ściekami i bez nich. (Podziękowania dla Philipa B. Starka, jednego z autorów [1], za te informacje za pośrednictwem Twittera . Zobacz jego wykład online ).
Ta kwestia stanowi także pouczające studium w przeciwieństwie do deduktywizmu i induktywizmu , jak omówiono w tej odpowiedzi .
Freedman D, Collier D, Sekhon JS, Stark PB. Modele statystyczne i wnioskowanie przyczynowe: dialog z naukami społecznymi. Cambridge; Nowy Jork: Cambridge University Press; 2010 r.
Freedman DA. Modele statystyczne i skóra obuwnicza. Metodologia socjologiczna . 1991; 21: 291-313. doi: 10.2307 / 270939. Pełny tekst
źródło