Okazy muzeum georeferencji ze złymi opisami miejscowości

10

Obecnie zestawiam listę okazów z baz danych różnych muzeów historii naturalnej do dalszych badań. Jednak dobrze znanym problemem związanym z większością danych historycznych jest brak odpowiedniej szerokości i długości geograficznej, co uniemożliwia korzystanie z tych danych.

Istnieją sposoby na przezwyciężenie tych danych - takie jak utworzenie bufora wokół regionu i zapewnienie zakresu niepewności związanej z tą lokalizacją.

Na przykład funkcja - biogeomancer z pakietu „przestrzennego” w R automatyzuje proces georeferencji, pod warunkiem, że istnieje kilka opisów tekstowych, takich jak „2 mile na zachód od XYZ”. Zobacz dokumentację tutaj.

Jednak moim głównym zmartwieniem jest stosowanie takiego protokołu dla regionów o powierzchni 200 km kwadratowych. Czy istnieje sposób na rozwiązanie tego problemu? Chciałbym skorzystać z tej bogatej bazy danych muzealnych, pod warunkiem, że poradzę sobie z niepewnością związaną z jej lokalizacją.

Przykład niektórych okazów w moim zestawie danych pokazano poniżej. Należy pamiętać, że wiele z nich zawiera wzmiankę o wysokości, ale większość zapisów jest bardzo niejasna.

wprowadź opis zdjęcia tutaj

EDYTOWAĆ

W sekcji komentarzy jeden z was wspomniał o celu tego pytania i o tym, co zwykle osiągam z tego samego.
1. Interesuje mnie, jak kiedyś zmniejszyć promień niepewności z naprawdę szerokiego regionu wielokąta do mniejszego promienia niepewności (jeśli to możliwe).
2. Informacje te pomogą mi przeprowadzić przyszłą analizę przestrzenną, na przykład modelowanie rozmieszczenia gatunków / modelowanie zajmowania.

Vijay Ramesh
źródło
Czy słyszałeś o GBIF? gbif.org Może już mieć to, czego szukasz.
GISKid
@GISKid Tak, to dane z GBIF. Niestety w większości tych danych brakuje dobrego georeferncingu.
Vijay Ramesh
Interesujące pytanie! Jest jednak trochę niejasne, co masz nadzieję zrobić - elementy są już georeferencyjne, ponieważ zawierają informacje o lokalizacji, chociaż dla regionów wielokątnych. Czy mógłbyś edytować i rozwinąć sposób, w jaki masz nadzieję „poradzić sobie” z problemem dużych wielokątów? Czy ma to pomóc w analizie przestrzennej?
Simbamangu,
1
Jakiej metody używasz do swojego SDM? A jaki obszar badań wielkości? W zależności od tych dwóch - sądzę, że duży obszar niepewności osobiście zmniejszyłby użyteczność SDM. Zamiast tego wyeliminowałbym dane, które mają duży wielokąt niepewności, i trzymam się używania „bardziej precyzyjnych” zdarzeń. Zwłaszcza jeśli liczba wystąpień nie stanowi problemu
GISKid
2
Wydaje się, że możesz być w stanie zawęzić, w zależności od przypadku , niektóre dane dotyczące lokalizacji - np. Używając danych wysokości rastra 3500 '± 250' do maskowania wewnątrz wielokąta Santhapara. Bez użycia „umiejętności detektywistycznych” i dodatkowych danych utkniesz w zabraniu środka ciężkości wielokąta - i (mówiąc z doświadczenia) jest to niebezpieczne! Dlaczego? Teraz masz coś, co wygląda na dokładne dane punktowe, ale tak nie jest, a może się to zgubić podczas udostępniania lub etapów analizy.
Simbamangu,

Odpowiedzi:

2

Zastanów się nad datami zdarzeń i postaraj się zdobyć (zbudować, georeferencję) mapę dróg, linii kolejowych, mostów i miast (wsi, stacji kolejowych) znanych lub dostępnych w tym czasie dla regionu, ponieważ przyrodnik zwykle opuszczał znana wioska i przynajmniej częściowo skorzystaj z istniejącej drogi lub linii kolejowej, aby dostać się do obszarów, w których dostali okazy. Czasami naprawdę zmniejsza prawdopodobny obszar gromadzenia / występowania. Jeśli znajdziesz więcej informacji ekologicznych na temat gatunku, możesz wykluczyć obszary, np. tereny otwarte i leśne, tereny podmokłe vs tereny podmokłe, również z dodatkowymi informacjami na temat historycznego rozmieszczenia tych ekosystemów.

Chociaż definitywnie nie użyłbym tych lokalizacji do szkolenia modelu SDM, możesz użyć wyników modelu, aby zmniejszyć niepewność lokalizacji tych źle georeferencyjnych zdarzeń w połączeniu z danymi wymienionymi powyżej.

Niektóre najnowsze prace dotyczą wpływu uprzedzeń tych niepewnych lokalizacji, a jeśli używa się podsumowanych danych środowiskowych, można je wykorzystać do zrekompensowania tej niewyraźnej lokalizacji:

Gdzie niepewność pozycjonowania stanowi problem w modelowaniu rozmieszczenia gatunków? https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1600-0587.2013.00205.x

Ocena ilościowa stopnia odchylenia od wykorzystania danych w skali hrabstwa w modelowaniu rozmieszczenia gatunków: Czy zwiększenie wielkości próby lub wykorzystanie danych środowiskowych uśrednionych dla hrabstwa może zmniejszyć nadmierne przewidywanie dystrybucji? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5551104/

Priscilla Minotti
źródło
Dziękuję za odpowiedź Priscilla. Obecnie próbuję uzyskać historyczne mapy pokrycia terenu oraz dane, które dostarczają informacji o drogach i gminach. Mamy nadzieję, że odniesiemy te informacje do tagów pochodzących z okazów z muzeów historycznych w celu lepszego odniesienia do nich. Chociaż aspekt SDM nie jest poważnym problemem, naprawdę chciałbym je dokładnie georeferencyjnie, ponieważ chcę próbkować te próbki do analizy genetycznej. Masz jakieś przemyślenia na temat tego ostatniego?
Vijay Ramesh