Pracuję nad projektem z zakresu analizy danych związanym z eksploracją relacji społecznych i potrzebuję przechowywać dane w niektórych bazach danych z grafami. Początkowo jako bazę danych wybrałem Neo4j. Ale wydaje się, że Neo4j nie skaluje się dobrze. Alternatywą, którą odkryłem, są Titan i oriebtDB. Przejrzałem to porównanie na tych trzech bazach danych, ale chciałbym uzyskać więcej szczegółów na temat tych baz danych. Czy ktoś mógłby mi pomóc w wyborze najlepszego. Przede wszystkim chciałbym porównać wydajność, skalowanie, dostępną dokumentację / samouczki online, obsługę bibliotek Python, złożoność języka zapytań i obsługę algorytmów graficznych tych baz danych. Czy są jeszcze jakieś dobre opcje bazy danych?
data-mining
graphs
databases
social-network-analysis
Sreejithc321
źródło
źródło
Odpowiedzi:
Myślę, że być może będziesz musiał pamiętać o ogólnych potokach danych i potokach uczenia maszynowego. Do których potrzebujesz solidnej struktury do przenoszenia danych między tabelą a grafiką, oprócz wydajnego przetwarzania rozproszonego. Z mojego zrozumienia Spark GraphX obiecuje zbudować te rurociągi. Warto obejrzeć wykład Josepha Gonzaleza (jednego z twórców GraphLab z CMU) na temat GraphX na youtube.
źródło