Szukam zestawów danych sieci społecznościowych (Twitter, Friendfeed, Facebook, Lastfm itp.) Do zadań klasyfikacyjnych, najlepiej w formacie ARFF.
Moje wyszukiwania za pośrednictwem UCI i Google jak dotąd nie były udane ... jakieś sugestie?
źródło
Szukam zestawów danych sieci społecznościowych (Twitter, Friendfeed, Facebook, Lastfm itp.) Do zadań klasyfikacyjnych, najlepiej w formacie ARFF.
Moje wyszukiwania za pośrednictwem UCI i Google jak dotąd nie były udane ... jakieś sugestie?
Utworzono duży indeks stron na Facebooku i jest on dostępny jako torrent (jest to ~ 2,8 Gb) http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e9575
Zestawy danych na Twitterze są oznaczone na Infochimps: http://infochimps.com/tags/twitter
Zestaw danych lastfm jest dostępny pod adresem http://mtg.upf.edu/node/1671
Właśnie to znalazłem: 476 milionów tweetów z Twittera (przez @yarapavan ).
źródło
Opracowaliśmy zbiór danych na Twitterze dla przyjaciół użytkowników w 2009 r., A następnie w 2009 r. Więcej informacji można znaleźć tutaj: http://strict.dista.uninsubria.it/?p=364
źródło
Sprawdź kaggle.com, mają konkursy na temat sieci społecznościowych i rozdają zestawy danych.
SNAP Stanforda jest również świetnym źródłem. I ma badania do uruchomienia.
źródło
Wykres społecznościowy na Facebooku, instalacje aplikacji i użytkownicy Last.fm, wydarzenia, grupy na http://odysseas.calit2.uci.edu/research/
Dwa zestawy danych (zebrane od kwietnia do maja 2009 r.), Które zawierają reprezentatywne próbki około 1 miliona użytkowników na całym Facebooku, z kilkoma adnotacjami: dla każdego próbkowanego użytkownika dołączono listę znajomych, ustawienia prywatności i członkostwo w sieci. Trzeci zestaw danych (zebrany w lutym 2008 r.) Zawiera dwustronny wykres reprezentujący instalacje aplikacji przez użytkowników Facebooka. Czwarty zestaw danych z Daily Active Users i instalacjami aplikacji w ciągu 6 miesięcy (zebrany wrzesień 2007-luty 2008). Piąty zestaw danych, który obejmuje reprezentatywną próbkę użytkowników Last.fm uzyskaną za pomocą próbkowania multigraph (zebrane w lipcu 2010 r.).
źródło
Dobrym źródłem do znajdowania zestawów danych jest:
/ r / zestawy danych w Reddit.
Szybkie spojrzenie na tę stronę ujawnia to źródło , które może zawierać coś przydatnego.
źródło
W tym artykule wykorzystano zestaw danych Facebooka, który jest dostępny tutaj. Oto opis autorów:
źródło