Najpotężniejsze narzędzia analityki internetowej typu open source? [Zamknięte]

10

Potrzebujesz porady na temat wyboru narzędzi do analityki internetowej typu open source, w tym zarówno tagowania stron, jak i analizy plików dziennika. Znam niektóre z nich: piwik, otwarta analityka internetowa, awstats i więcej ... jakie są wśród nich najlepsze (typ tagowania strony i typ analizy pliku dziennika)?

Mickey Shine
źródło

Odpowiedzi:

11

W domenie analizatora plików dziennika są to najczęściej używane:

  • AWStats
  • Webalizer
  • Analog
  • W3Perl

Analogowe i Webalizer są napisane w C i są szybsze (10000-20000 linii na sekundę).

Jak wspomniano wcześniej przez @MadHatter Analog został opracowany przez byłego statystę z Cambridge, dzięki czemu Analog jest naprawdę precyzyjnym i technicznym narzędziem, ale od 2005 roku nie jest już rozwijany.

Webalizer nie jest już rozwijany, ale łatwiej jest go używać niż Analog.

AWStat i W3Perl są napisane w Perlu i są to najbardziej aktywne projekty, ale są znacznie wolniejsze niż Analog i Webalizer (3000/4500 linii na sekundę). Różnią się one między sobą wytwarzanymi danymi i sposobem ich renderowania.

AWStat wyświetla statystyki w bardzo atrakcyjny sposób, ale generuje mniej statystyk niż W3Perl.

Polecam te linki, aby uzyskać więcej informacji:

http://www.aardal.com/stats/docs/uk/speed.html
http://www.w3perl.com/
http://awstats.sourceforge.net/

Moja rada to:

  • W3Perl, jeśli chcesz uzyskać szczegółowe statystyki i nie masz zbyt wielu GB plików dziennika
  • AWStat w przypadku, gdy nie potrzebujesz zbyt wielu GB plików i potrzebujesz ładnej graficznej reprezentacji.
  • Webalizer, jeśli masz mnóstwo plików dziennika do analizy.
  • Analogicznie, jeśli potrzebujesz naprawdę dokładnych statystyk, ogromnych plików dziennika i masz doświadczenie w programowaniu w języku C (lub znasz kogoś, kto może pomóc).

Odnośnie tagowania stron Zwycięzcą jest z pewnością Google Analytics, gromadzenie i generowanie danych jest lepsze niż w przypadku innych rozwiązań, ale pewnego dnia może się zdarzyć, że Google poprosi o to ...

W3Counter i Xiti to dostawcy, którzy wymagają, aby w wersji bezpłatnej zainstalować obraz na każdej stronie internetowej, którą chcesz monitorować. Oba są dla małych witryn.

Open Web Analytics i Pikwik to świetne rozwiązania typu open source. Oba są dość dojrzałe i stabilne, ale wymagają bazy danych MySQL i obsługi PHP.

Jeśli nie potrzebujesz rozwiązania „domowego”, zdecydowanie wybrałbym Google Analytics, a pomiędzy projektami open source wybrałbym Open Web Analytics, ponieważ jest on bardziej dojrzały niż Piwik.

tmow
źródło
5

Jestem bardzo zadowolony z piwik. Po prostu tęsknię za możliwością dostosowania widżetów w zależności od strony internetowej. Używam go do sprawdzania moich stron z Drupalem i jest też moduł dla Drupala.

groovehunter
źródło
1

Za moje pieniądze najlepszym narzędziem do analizy logów jest analog . Jest niesamowicie szybki (modułowe wyszukiwania DNS, które są równie powolne dla wszystkich), jest napisany przez byłego statystykę z Cambridge i ma bardzo przydatną stronę, która mówi ci - i twojemu zarządowi - co może i nie może być właściwie znane z twoich dzienników sieciowych, pomimo dziwnych roszczeń handlowych.

Nie mogę jednak komentować tagowania stron; Przepraszam.

Szalony Kapelusznik
źródło
Wygląda na to, że Analog nie jest aktualizowany od 2005 r. W takim przypadku nie rozpoznaje poprawnie niektórych nagłówków HTTP.
tmow
Możesz mieć rację; takie jak co?
MadHatter
1

To oprogramowanie eksperymentalne, ale jednak imponujące:

Hummingbird pozwala zobaczyć, w jaki sposób odwiedzający wchodzą w interakcje z Twoją witryną w czasie rzeczywistym. A przez „w czasie rzeczywistym” nie mamy na myśli, że odświeża się co 5 minut - WebSockets umożliwiają Hummingbirdowi aktualizację 20 razy na sekundę. Hummingbird został zbudowany na bazie Node.js, nowego internetowego zestawu narzędzi javascript, który może obsługiwać duży ruch i wielu jednoczesnych użytkowników.

miku
źródło
1

Powiedziałbym (choć jestem stronniczy jako współzałożyciel ;-), że SnowPlow jest najpotężniejszym narzędziem analityki internetowej opartym na otwartym kodzie źródłowym.

SnowPlow ma luźno sprzężoną, rozproszoną architekturę, która korzysta z Hadoop i Hive, dzięki czemu skaluje się do milionów, a nawet miliardów zdarzeń - jest to coś, czego nie może zrobić żadne MySQL ani inne rozwiązanie oparte na RDBMS.

Inną dużą innowacją w SnowPlow jest to, że dane zdarzeń są przechowywane w czystej, niezmiennej, zdenormalizowanej, atomowej strukturze „płaskiego pliku” - innymi słowy, w hurtowni danych analitycznych. Umożliwia to wiele bardzo wyrafinowanych analiz za pomocą Hive, a także proste połączenia z danymi innych firm (np. CRM lub dane dotyczące sprzedaży). Ponownie, jest to bardziej wydajne niż inne rozwiązania, które mają tendencję do zwijania danych atomowych w agregaty, obcinania starych danych lub korzystania ze znormalizowanych struktur, które są naprawdę trudne do bezpośredniego zapytania lub połączenia z innymi źródłami.

Możesz przeczytać więcej o architekturze technicznej SnowPlow tutaj .

Alex Dean
źródło
0

Boomerang to najlepsze dostępne narzędzie do analizy wydajności po stronie klienta - ale to tylko agent js - nie znam żadnego gotowego narzędzia do raportowania, Pastmon jest przydatny do rzeczy sieciowych, Piwik i AwStats, o których już wspominałeś. Analog jest bardzo podobnym narzędziem do AwStats - mniej konfigurowalnym, ale znacznie szybszym przetwarzaniem.

Jeśli chcesz wdrożyć własne rozwiązanie, dostępne są bezpłatne dane ip do danych lokalizacji

symcbean
źródło
0

Znam ludzi, którzy używają Webalizera do analizy logów stron internetowych. Wystarczy wspomnieć o jeszcze jednej opcji.

Jest też ta dyskusja o możliwościach.

oherrala
źródło
1
Webalizer nie jest już aktywnie rozwijany, obawiam się, że nieuchronnie straci swój udział w rynku.
tmow
0

Po kilku badaniach dotyczących pakietów analityki internetowej typu open source, myślę, że wyraźnymi zwycięzcami są http://www.openwebanalytics.com i http://piwik.org/

Powodem jest łatwość użycia, instalacja możliwości w czasie rzeczywistym.

Jedną z imponujących funkcji, o której chciałbym wspomnieć, jest mapa ciepła generowana przez openwebanalytics.

dcode
źródło
Więcej informacji o kandydatach i sposobie wyboru zwycięzcy?
vonbrand