GIS Powiązane informacje Zarządzanie [zamknięte]

22

Często pracuję nad mapowaniem wrażliwych danych na poziomie pacjenta. Chociaż wydaje mi się, że dobrze rozumiem wiele kwestii związanych z zarządzaniem w tym zakresie (tj. Kiedy stosować techniki binowania i anonimowości k ), ale chciałbym poprawić swoją wiedzę na ten temat.

Oto dobry przykład tego, dlaczego ma to znaczenie: Poufność przestrzenna i GIS: przeprojektowywanie miejsc śmiertelności z opublikowanych map o huraganie Katrina

Czy ktoś ma jakieś dobre ogólne zasady, które stosuje przy mapowaniu wrażliwych danych?

Czy istnieją jakieś dobre zasoby, które obejmują różne metody ochrony poufności lub dostarczają wskazówek w tej sprawie?

Tumbledown
źródło
2
+1 (Nawiasem mówiąc, jedna metoda anonimizacji danych sugerowana w poprzednim wątku pojawia się na gis.stackexchange.com/questions/31236/... ) Czy możesz wyjaśnić, co rozumiesz przez „reguły praktyczne ”? Czy szukasz technicznych rozwiązań ukrywania szczegółów danych, czy szukasz wskazówek dotyczących tego, kiedy i na ile dane powinny być chronione?
whuber
1
Przydałyby się przede wszystkim rozwiązania techniczne, chociaż przydatne byłyby również wytyczne dotyczące poziomu ochrony. Widzę, że idą w parze. Na przykład bardzo wrażliwe dane składające się z wielu małych liczb powinny być wyświetlane przy użyciu techniki X lub techniki Y, jeśli uwzględniono informacje demograficzne. Zastanawiałem się nad użyciem binowania heksów do zadania, ale nagle nagle nie miałem pojęcia o populacji w każdym sześciokącie. Co jeśli pokażę wartość 20, a następnie stwierdzę, że w obrębie tego sześciokąta było tylko 20 mieszkańców? Niedawno słyszałem również o problemie z modyfikowalnym zespołem antenowym.
Tumbledown
Głosowałem za zamknięciem tego tekstu jako zbyt szerokiego, ponieważ szuka on zarówno „praktycznych zasad”, jak i listy zasobów.
PolyGeo

Odpowiedzi:

8

Ta dyskusja jest bardzo potrzebna w zawodzie GIS i winię szkolnictwo wyższe za zaniedbanie tego tematu.

To powiedziawszy, oto kilka interesujących, jeśli nie nieaktualnych, literatury na ten temat. Jedyny prawdziwy konsensus między tymi zasobami polega na tym, że w zawodzie GIS nie ma konsensusu w sprawie prywatności osobistej, ale powinno to stanowić poważny problem.

Etyka GIS | Jeremy Crampton

Ochrona prywatności osób korzystających z systemów informacji geograficznej | Harlan J. Onsrud, Jeff P. Johnson i Xavier Lopez | LINK AKTUALIZOWANY 1/11/17

Prywatność i poufność w służbie zdrowia GIS LINK AKTUALIZOWANY 1/11/17

Sean Adkins
źródło
1
Zagłosowałam to, ponieważ naprawdę podkreśla trudność (wciąż) w tym obszarze. Ogórki naprawdę (i celowo) otworzyły tak ogromną puszkę robaków swoimi obserwacjami, że prawie niemożliwe jest zajęcie się każdym możliwym aktem nieujawnienia. Zawsze pojawia się drażliwy problem wiedzy kontekstowej wpływającej na roszczenie o ujawnienie, a także wiedzy stosowanej spoza pierwotnego zasobu, którą można wykorzystać do identyfikacji osoby. Mieszanie danych lub punkty kompensujące przestrzennie nigdy nie mogą negować takich potencjalnych problemów. Więc właściwie pozostało ci z własną etyczną postawą!
Andrew Tice
Standardowe procedury anonimowości zwykle przyjmują założenia dotyczące normalnie rozmieszczonych populacji, podczas gdy większość analiz przestrzennych bywa daleka od normalnie rozmieszczonych populacji. Tworzenie rastrów w pewien sposób zamazuje postrzeganą dokładność wydruków, dlatego można je rozważyć w przypadku ogólnej prezentacji. Pierwotne pytanie wspominało o MAUP, a na pewno użycie jakiejś formy Oszustwa na różnych poziomach przestrzennych mogłoby pomóc, chociaż może warto w końcu odkurzyć coś takiego jak GAM Openshawa?
Andrew Tice
1
@AndrewTice Czy mogę zapytać, co to jest oszustwo? Moje umiejętności deakronimizacji dziś mnie porzuciły!
Tumbledown,
1
@Tumbledown - Przepraszamy! To oznacza metodę dostosowania małych komórek. Jeśli to zrobisz, znajdziesz literaturę z ONS w Wielkiej Brytanii. Jest to jedna ze sprawdzonych metod raportowania spisu powszechnego na niskim poziomie, więc jest stosowana do zliczania jednostek powierzchni. Jest to nieco brutalna siła, ale odkąd ONS szeroko go używał, jest trochę uzasadnienia dla zastosowania tej metody.
Andrew Tice,
1
Yikes! Zawsze nieprzyjemny w odniesieniu do starszych materiałów. Spróbuję znaleźć działające linki i odpowiednio edytować mój post. Dzięki!
Sean Adkins
4

Są to zasady podane przez Eurostat, gdy prosi on o zgłoszenie lokalizacji gospodarstw. Lokalizacje są zgłaszane z zaokrąglonymi współrzędnymi, aw niektórych przypadkach przez zastosowanie dodatkowego przesunięcia pół losowego. Nie wiem, czy dają dobrą ogólną zasadę, ale przynajmniej te zasady są stosowane przez dobrze znany europejski organ.

W odniesieniu do lokalizacji gospodarstwa stosuje się dwie zasady: (i) dokładne współrzędne nie są wymagane; oraz (ii) lokalizację z tylko jednym zasobem zostanie przekodowana.

(i) dokładne współrzędne nie są wymagane: współrzędne długości i szerokości geograficznej nie będą wymagane w odniesieniu do sekund lub ułamków dziesiętnych minut. Konieczne będzie podanie lokalizacji tylko z dokładnością do 5 minut, co stanowi powierzchnię około 3 000 - 7 000 ha, w zależności od lokalizacji w Europie.

ii) zostanie przekodowana lokalizacja z tylko jednym gospodarstwem: Możliwe jest, że na obszarach o bardzo dużych gospodarstwach lokalizacja określona z dokładnością do 5 minut długości i szerokości geograficznej może zawierać tylko jedno gospodarstwo, które byłoby w związku z tym bezpośrednio identyfikowalne. Aby zapewnić, że bezpośrednia identyfikacja nie może mieć miejsca, miejscowość z tylko jednym gospodarstwem powinna zostać przydzielona do najbliższego sąsiedniego punktu (wybranego losowo) z przynajmniej jednym gospodarstwem. Jeśli którakolwiek z 8 sąsiednich lokalizacji nie ma co najmniej jednego gospodarstwa, sąsiednie lokalizacje muszą zostać przedłużone, dopóki inne nie zostaną zlokalizowane z co najmniej jednym innym gospodarstwem. Jednakże, gdy tylko jest to możliwe, gospodarstwo rolne należy przydzielić regionowi NUTS 3, w którym się znajduje.

użytkownik30184
źródło
1

Pomyślałem, że umieściłem tę przydatną stronę jako dodatkowy link: UK Anonimization Network

Nie jest on specyficzny dla GIS i jest skierowany do Wielkiej Brytanii, ale zapewnia użyteczne informacje i zasoby dotyczące zmniejszania ryzyka ujawnienia.

Prowadzą również szereg bezpłatnych warsztatów i klinik anonimizacji

Tumbledown
źródło
Kolejny przydatny link, struktura decyzyjna z UKAN: ukanon.net/ukan-resources/ukan-decision-making-framework
Tumbledown