Niedawno zacząłem eksperymentować z przetwarzaniem języka naturalnego (NLP) przy użyciu CoreNLP Stanforda i zastanawiam się, jakie są standardowe sposoby przechowywania analizowanych danych NLP dla czegoś takiego jak aplikacja do eksploracji tekstu?
Jednym ze sposobów, który moim zdaniem może być interesujący, jest przechowywanie dzieci jako listy sąsiedztwa i dobre wykorzystanie zapytań rekurencyjnych (Postgres to obsługuje i przekonałem się, że działa naprawdę dobrze).
Ale przypuszczam, że istnieje prawdopodobnie wiele standardowych sposobów, aby to zrobić, w zależności od tego, jakie analizy są przeprowadzane przez osoby pracujące w tej dziedzinie na przestrzeni lat. Jakie są więc standardowe strategie utrwalania analizowanych danych NLP i jak są one wykorzystywane?
źródło