Czy podczas dopasowywania pacjentów na podstawie danych demograficznych istnieją jakieś zalecenia dotyczące tego, jakie pola powinny być dopasowane, aby pacjent był „tym samym pacjentem”?
Wiem, że algorytmy będą różne dla różnych implementacji. Jestem ciekawy, czy istnieją jakieś najlepsze praktyki lub zalecenia dotyczące tego procesu.
First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip
itp?
Odpowiedzi:
Jest ten wspaniały esej (po hiszpańsku, przepraszam) napisany przez Pablo Pazosa, inżyniera CS z Urugwaju, który pracuje nad IT Healthcare od 2006 roku i wniósł duży wkład w tę dziedzinę, w którym opisuje algorytm do tego.
Możesz uruchomić artykuł za pośrednictwem tłumacza, ale jego podstawową informacją jest to, że podstawowe informacje pozwalające ustalić tożsamość osoby to jej imię i nazwisko (zarówno ojca, jak i matki), płeć i data urodzenia. Co ciekawe, w szczególności wyklucza numery identyfikacyjne takie jak SSN z algorytmów dopasowywania tożsamości, ponieważ „jakikolwiek identyfikator NIE jest częścią jego tożsamości” (myślę jednak, że ten punkt może być dyskusyjny). Ponadto wyklucza atrybuty takie jak adres, numery telefonów itp., Ponieważ nie są one tak naprawdę powiązane z tożsamością kogoś, nie są powiązane z „kim naprawdę jest”.
Ponadto przypisuje różne „wagi” do każdego z poprzednich atrybutów, jak poniżej:
Z dopasowaniami znalezionymi w każdym z tych atrybutów opisuje on metodologię uzyskania złożonego „indeksu zgodności zgodności”, z którym możliwe jest porównanie między rekordami. Możliwe są również „częściowe” dopasowania atrybutów nazwy za pomocą algorytmów takich jak odległość Levenshteina .
Dobra lektura, IMO. Przepraszam, to po hiszpańsku, ale mam nadzieję, że udało mi się przekazać jego główne pomysły.
źródło
Nie ma jednego magicznego algorytmu dopasowywania pacjentów i wątpię, by kiedykolwiek istniał.
Na początek istnieją regionalne wariancje. Jak zauważył MMattoli, to, co działa dobrze w miejskim szpitalu w USA, prawdopodobnie nie będzie dobrze pasować w wiejskiej australijskiej klinice leczącej Aborygenów.
Ponadto poszczególne strony mają różne poglądy na temat odporności na uszkodzenia. Gdybyś pasował tylko wtedy, gdy byłeś absolutnie pewien , dostałbyś dużo pominiętych meczów. Powoduje to zduplikowanie danych pacjenta, co stwarza zupełnie inny zestaw problemów. Większość stron zechce się osiedlić z całą pewnością , ale na ile to wystarczające? Zapytaj 10 osób, a otrzymasz 12 odpowiedzi.
Dlatego też „najlepszy” algorytm będzie konfigurowalny, aby Twoi klienci mogli go dostosować do swoich potrzeb.
Rozważając dopasowanie, różne pola oferują różne stopnie pewności.
Identyfikatory właściwe dla opieki zdrowotnej dają największą pewność, ponieważ ich jedynym celem jest jednoznaczna identyfikacja osoby w systemie opieki zdrowotnej. Szpitale zwykle starają się, aby się nie powielały.
Przykłady:
Inne identyfikatory pacjentów mogą również zapewniać wysoką pewność, w zależności od systemu. Na przykład dowód wojskowy jest prawdopodobnie bardzo istotny w szpitalu wojskowym.
Przykłady:
W przypadku braku niepowtarzalnych identyfikatorów należy skorzystać z informacji demograficznych. Nie zaleca się dopasowywania na jednym polu, ale im więcej pól demograficznych, tym bardziej pewne dopasowanie.
Rzeczy o osobie, która często się nie zmienia, dobrze pasują:
Ale w meczu można wziąć pod uwagę jeszcze bardziej plastyczne informacje, aby zwiększyć pewność siebie:
źródło
Warto również sprawdzić poprzednie nazwiska, ponieważ często się zmieniają.
źródło
Oprócz oczywistych kombinacji trzech poniższych podanych w pytaniu
Pomyślałbym o dodaniu
phone number (Home and/or Cell)
do listy. Obecnie jest to dość powszechne i każdy będzie miał unikalny numer, a nawet jeśli czasami ludzie zmienią swoje numery telefonów, starsze numery są zapamiętywane przez większość ludzi, więc mogą się przydać.Odkryliśmy, że adres często cierpi z powodu wielu pisowni i wielu sposobów renderowania, szczególnie w krajach takich jak Indie, gdzie ludzie używają lokalnego języka, a oprogramowanie do zarządzania pacjentami „wciąż” używa angielskiego.
źródło
Płeć w zapisach wydaje się często pochodzić od imienia. Widziałem zwiększoną wariancję płci dla obcokrajowców, kiedy nie możemy wyprowadzić płci z imienia i nazwiska.
W Niemczech istnieją dalsze warianty z nazwami zawierającymi „Umlaute”, takie jak „äöü”, które czasami zastępuje się „ae oe ue”.
źródło
Moja myśl jest w kolejności jak poniżej 1). SSN, nazwisko i pierwsze 5 znaków imienia 2). SSN, data urodzenia i pierwsze 5 znaków imienia 3). SSN, data urodzenia i nazwisko 4). SSN, płeć, data urodzenia 5). Nazwisko, pierwsze 5 znaków imienia, miasto i kod pocztowy
źródło
To naprawdę trudny problem w USA. Imiona nie są unikalne i często zmieniają się w ciągu życia danej osoby lub są przedstawiane w różny sposób (na przykład Rob kontra Robert), więc nigdy nie można ich używać do identyfikacji pacjenta, chyba że w połączeniu z pewnymi bardziej wiarygodnymi informacjami. Numer ubezpieczenia zdrowotnego i dostawca zmieniają się znacznie częściej i mogą być takie same dla wielu członków rodziny. SSN jest podobno wyjątkowy, ale wokół niego występują oszustwa. To samo z numerem kadzidła kierowcy, który oczywiście nie każdy będzie miał.
Osobiście zaczynałbym od numeru polisy ubezpieczeniowej oraz kombinacji daty urodzenia i nazwiska, a następnie połączenia SSN i daty urodzenia i kombinacji nazwisk. Sprawdzałbym adres i telefon, aby dać mi dodatkową pewność, że pasują, ale nie mają zbyt dużej wagi, jeśli nie pasują. Dodatkowo użyłbym grupy krwi jako czynnika wykluczającego, jeśli jest ona znana (i wszyscy wiemy, że wampiry szpitalne będą pobierać próbki krwi), ponieważ to się nie zmienia. Dopasowywanie nazw musiałoby być dopasowaniem rozmytym ze względu na problem z nazwiskami. Inne rzeczy powinny na ogół szukać dokładnego dopasowania pierwszego zamazanego dopasowania, jeśli pewność nazwy jest naprawdę wysoka (może to być literówka wpisująca numer SSN).
źródło