Postanowiłeś więc poprzeć pomysł na powtarzalne badania i chcesz udostępnić swoje dane online, aby ludzie mogli je zobaczyć i wykorzystać. Pytanie brzmi: gdzie go hostujesz?
Moja pierwsza skłonność to oczywiście prywatna przestrzeń internetowa, którą mam na serwerze uniwersyteckim, ale te rzeczy nie są wcale tak trwałe - jeśli odejdę, katalog pozostanie otwarty przez bardzo krótki czas, zanim zniknie. Nie jest to odpowiednie ustawienie do przechowywania danych, z których ludzie będą mogli korzystać i pracować w przyszłości.
Czy używasz czegoś takiego jak GitHub lub SourceForge? Lub inna usługa?
Dane, o których mowa, są wynikiem niektórych symulacji o bardzo wąskim zainteresowaniu - więc niekoniecznie uważam, że miejsce takie jak InfoChimps lub inne publiczne repozytorium danych jest właściwym miejscem dla nich. To mniej: „Możesz nauczyć się tego kodu!” i więcej „Możesz replikować rysunek 3 w tym dokumencie”.
źródło
Odpowiedzi:
Jedną z prostych opcji jest github .
Używam go trochę do udostępniania danych i kodu analizy danych. Kilka dobrych przykładów innych osób udostępniających kod i dane w witrynie wymieniono w tym pytaniu .
Korzyści z github
Oczywiście github nie jest idealny do danych. Widzę zalety używania bardziej stałego repozytorium instytucjonalnego lub innego dedykowanego narzędzia do poważniejszej archiwizacji.
źródło
Inną opcją wydaje się być Dataverse , który jest dostępny jako usługa i oprogramowanie typu open source. Jednak nie próbowałem tego.
źródło
Jedną z możliwości dla osób akademickich jest korzystanie z repozytorium cyfrowego kampusu często hostowanego przez biblioteki kampusowe (dla mnie logiczne miejsce dla zbiorów danych towarzyszących publikacjom).
Popularnym (bezpłatnym) repozytorium cyfrowym jest DSpace, które, moim zdaniem, może przechowywać zestawy danych. Ale jest to usługa, którą musi hostować ktoś w Twojej instytucji.
źródło