Mam 2 pytania na temat analizy zestawu danych GPS.
1) Wyodrębnianie trajektorii Mam ogromną bazę danych zarejestrowanych współrzędnych GPS formularza (latitude, longitude, date-time)
. Zgodnie z wartościami daty i godziny kolejnych rekordów próbuję wyodrębnić wszystkie trajektorie / ścieżki, po których następuje osoba. Na przykład; powiedzmy od czasu M
, (x,y)
pary ciągle się zmieniają aż do czasu N
. Potem N
zmiana (x,y)
par maleje, w którym momencie dochodzę do wniosku, że ścieżka od czasu M
do czasuN
można nazwać trajektorią. Czy jest to przyzwoite podejście do wyciągania trajektorii? Czy są jakieś znane podejścia / metody / algorytmy, które możesz zasugerować? Czy są jakieś struktury lub formaty danych, które chciałbyś zasugerować, żebym utrzymał te punkty w wydajny sposób? Być może przy każdej trajektorii przydatne byłoby ustalenie prędkości i przyspieszenia?
2) Wydobywanie trajektorii Kiedy mogę śledzić wszystkie trajektorie / podążać ścieżkami, jak mogę je porównywać / grupować? Chciałbym wiedzieć, czy punkty początkowy lub końcowy są podobne, a jak się różnią ścieżki pośrednie?
Jak porównać 2 ścieżki / trasy i stwierdzić, czy są one podobne, czy nie. Ponadto; jak mogę grupować podobne ścieżki razem?
Byłbym bardzo wdzięczny, jeśli możesz wskazać mi badania lub coś podobnego w tej sprawie.
Rozwój będzie w języku Python, ale mile widziane są wszelkie sugestie dotyczące bibliotek.
Otwieram dokładnie to samo pytanie /programming/4910510/comparing-clustering-trajectories-gps-data-of-xy-points-and-mining-the-data w StackOverflow. Myślałem, że otrzymam więcej odpowiedzi tutaj ...
źródło
Odpowiedzi:
Dwa artykuły, które prawdopodobnie Cię zainteresują, ponieważ mają podobne motywacje do twojego:
Granice przewidywalności w mobilności człowieka przez: Chaoming Song, Zehui Qu, Nicholas Blumm, Albert-László Barabási. Science , Vol. 327, nr 5968. (19 lutego 2010 r.), S. 1018–1021.
Zrozumienie indywidualnych wzorców mobilności człowieka : Marta C. Gonzalez, Cesar A. Hidalgo, Albert-Laszlo Barabasi. Nature , Vol. 453, nr 7196. (05 czerwca 2008 r.), S. 779–782.
Pamiętaj, że dwa badania wykorzystują te same dane, które są podobne do twoich, ale nie na poziomie precyzji w przestrzeni lub czasie. Nie sądzę, bym opisał to, co chciałbyś znaleźć jako trajektorię, ale nie jestem pewien, jak nazwałbym to. Dlaczego dokładnie chcesz klastować początkowe / końcowe węzły „trajektorii”.
źródło
PySAL - biblioteka analizy przestrzennej Python może być dobrym początkiem - http://code.google.com/p/pysal/
W szczególności sekcja autokorelacji:
http://pysal.org/1.2/users/tutorials/autocorrelation.html
Możesz również rozważyć użycie bibliotek R http://cran.r-project.org/web/views/Spatial.html do analizy wzorca punktowego .
Inne pakiety R:
Może to również uprościć analizę, jeśli przyciągniesz punkty do istniejących liniowych sieci transportowych (drogi / kolej) dostępnych z OSM. Następnie możesz symbolizować na podstawie tych linii i ilu osób korzysta z nich w określonych porach dnia.
źródło
Chociaż nie mogę komentować trajektorii ani ścieżek waszych ludzi, myślę, że podążacie właściwą ścieżką i czasem.
W zeszłym roku przygotowałem wersję demo dla Esri UC podczas pracy z niektórymi osobami w Snow Leopard Conservancy, dostępnej pod adresem : http://resources.arcgis.com/gallery/file/geoprocessing/details?entryID=1F9F376F-1422-2418 -7FBC-C359E9644702
Patrzy na „miejsca żerowania” (skupiska) lampartów śnieżnych na podstawie podanych kryteriów:
Chociaż do analizy odległości używa narzędzi Esri, skrypt Pythona wewnątrz może ci pomóc w tworzeniu klastrów, gdy tylko dowiesz się, które punkty są blisko siebie. (wykorzystuje teorię grafów: http://en.wikipedia.org/wiki/Graph_theory )
Jak wspomniano w innych odpowiedziach, tam są dokumenty, aby określić atrybuty potrzebne do podjęcia decyzji.
Analiza została luźno oparta na koncepcjach: Knopff, KH, ARA Knopff, MB Warren i MS Boyce. 2009. Ocena technik telemetrycznych globalnego systemu pozycjonowania do szacowania parametrów drapieżnictwa kuguara. Journal of Wildlife Management73: 586-597.
źródło
Aby uruchomić dowolny rodzaj grupowania na zestawie trajektorii, musisz mieć sposób na obliczenie podobieństwa lub odległości par trajektorii. Istnieje kilka istniejących metod, a nowe są opracowywane dla specjalnych przypadków lub w celu naprawy wad tradycyjnych (osobiście pracuję nad nową dla mojej pracy doktorskiej). Dobrze znane algorytmy są następujące:
Jeśli zajmujesz się tą dziedziną, gorąco polecam książkę „Computing with Spatial Trajectories” autorstwa wielu ekspertów Microsoft Asia.
źródło
Może ci to również pomóc:
Orellana D, Wachowicz M. Badanie modeli zawieszenia ruchowego w ruchu pieszym. Geogr Anal. 2011; 43 (3): 241–60. PubMed PMID: 22073410.
Zobacz także tego bloga:
ideasonmovement.wordpress.com/
źródło