Neo4j vs OrientDB vs Titan

13

Pracuję nad projektem z zakresu analizy danych związanym z eksploracją relacji społecznych i potrzebuję przechowywać dane w niektórych bazach danych z grafami. Początkowo jako bazę danych wybrałem Neo4j. Ale wydaje się, że Neo4j nie skaluje się dobrze. Alternatywą, którą odkryłem, są Titan i oriebtDB. Przejrzałem to porównanie na tych trzech bazach danych, ale chciałbym uzyskać więcej szczegółów na temat tych baz danych. Czy ktoś mógłby mi pomóc w wyborze najlepszego. Przede wszystkim chciałbym porównać wydajność, skalowanie, dostępną dokumentację / samouczki online, obsługę bibliotek Python, złożoność języka zapytań i obsługę algorytmów graficznych tych baz danych. Czy są jeszcze jakieś dobre opcje bazy danych?

Sreejithc321
źródło
1
Weź również pod uwagę Graphlab (oparty na pythonie): graphlab.com/products/create/overview.html Oto również dobry post na blogu na ten temat: bugra.github.io/work/notes/2014-04-06/… Nie mogę pomogę ci jednak w dyskusji na temat Titan kontra oriebtDB. Mam nadzieję, że ktoś się tym zajmie.
nfmcclure,
Możliwe jest również użycie Spark i GraphX
sheldonkreger
W tym artykule pokazano niektóre szczegóły dotyczące skalowalności, co jest szczególną zaletą dla Titan. groups.google.com/forum/#!topic/orient-database/CpPh42ukfH4
Henry H.
2
Nie, nie jest; GraphX ​​nie jest bazą danych.
Emre
Ponieważ było to kilka miesięcy temu, zakładam, że poczyniłeś pewne postępy. Dlaczego nie dodać własnej odpowiedzi (tutaj czy gdzie indziej?)
Jayan

Odpowiedzi:

1

Myślę, że być może będziesz musiał pamiętać o ogólnych potokach danych i potokach uczenia maszynowego. Do których potrzebujesz solidnej struktury do przenoszenia danych między tabelą a grafiką, oprócz wydajnego przetwarzania rozproszonego. Z mojego zrozumienia Spark GraphX ​​obiecuje zbudować te rurociągi. Warto obejrzeć wykład Josepha Gonzaleza (jednego z twórców GraphLab z CMU) na temat GraphX ​​na youtube.

Srini Vemula
źródło