Obecnie zestawiam listę okazów z baz danych różnych muzeów historii naturalnej do dalszych badań. Jednak dobrze znanym problemem związanym z większością danych historycznych jest brak odpowiedniej szerokości i długości geograficznej, co uniemożliwia korzystanie z tych danych.
Istnieją sposoby na przezwyciężenie tych danych - takie jak utworzenie bufora wokół regionu i zapewnienie zakresu niepewności związanej z tą lokalizacją.
Na przykład funkcja - biogeomancer z pakietu „przestrzennego” w R automatyzuje proces georeferencji, pod warunkiem, że istnieje kilka opisów tekstowych, takich jak „2 mile na zachód od XYZ”. Zobacz dokumentację tutaj.
Jednak moim głównym zmartwieniem jest stosowanie takiego protokołu dla regionów o powierzchni 200 km kwadratowych. Czy istnieje sposób na rozwiązanie tego problemu? Chciałbym skorzystać z tej bogatej bazy danych muzealnych, pod warunkiem, że poradzę sobie z niepewnością związaną z jej lokalizacją.
Przykład niektórych okazów w moim zestawie danych pokazano poniżej. Należy pamiętać, że wiele z nich zawiera wzmiankę o wysokości, ale większość zapisów jest bardzo niejasna.
EDYTOWAĆ
W sekcji komentarzy jeden z was wspomniał o celu tego pytania i o tym, co zwykle osiągam z tego samego.
1. Interesuje mnie, jak kiedyś zmniejszyć promień niepewności z naprawdę szerokiego regionu wielokąta do mniejszego promienia niepewności (jeśli to możliwe).
2. Informacje te pomogą mi przeprowadzić przyszłą analizę przestrzenną, na przykład modelowanie rozmieszczenia gatunków / modelowanie zajmowania.
źródło
Odpowiedzi:
Zastanów się nad datami zdarzeń i postaraj się zdobyć (zbudować, georeferencję) mapę dróg, linii kolejowych, mostów i miast (wsi, stacji kolejowych) znanych lub dostępnych w tym czasie dla regionu, ponieważ przyrodnik zwykle opuszczał znana wioska i przynajmniej częściowo skorzystaj z istniejącej drogi lub linii kolejowej, aby dostać się do obszarów, w których dostali okazy. Czasami naprawdę zmniejsza prawdopodobny obszar gromadzenia / występowania. Jeśli znajdziesz więcej informacji ekologicznych na temat gatunku, możesz wykluczyć obszary, np. tereny otwarte i leśne, tereny podmokłe vs tereny podmokłe, również z dodatkowymi informacjami na temat historycznego rozmieszczenia tych ekosystemów.
Chociaż definitywnie nie użyłbym tych lokalizacji do szkolenia modelu SDM, możesz użyć wyników modelu, aby zmniejszyć niepewność lokalizacji tych źle georeferencyjnych zdarzeń w połączeniu z danymi wymienionymi powyżej.
Niektóre najnowsze prace dotyczą wpływu uprzedzeń tych niepewnych lokalizacji, a jeśli używa się podsumowanych danych środowiskowych, można je wykorzystać do zrekompensowania tej niewyraźnej lokalizacji:
Gdzie niepewność pozycjonowania stanowi problem w modelowaniu rozmieszczenia gatunków? https://onlinelibrary.wiley.com/doi/pdf/10.1111/j.1600-0587.2013.00205.x
Ocena ilościowa stopnia odchylenia od wykorzystania danych w skali hrabstwa w modelowaniu rozmieszczenia gatunków: Czy zwiększenie wielkości próby lub wykorzystanie danych środowiskowych uśrednionych dla hrabstwa może zmniejszyć nadmierne przewidywanie dystrybucji? https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5551104/
źródło