Analytics: CloudFlare vs Google - Jaka rozbieżność jest zbyt duża?

10

Korzystam z CloudFlare do jednej z naszych witryn już od około tygodnia, a CloudFlare zgłasza 450% więcej wyświetleń rzeczywistych stron odwiedzających niż Google Analytics (więc to nie są boty ani zablokowane zagrożenia).

Rozumiem, że będzie rozbieżność, ponieważ CloudFlare mierzy wszystkie żądania strony, Google Analytics odpala żądanie JavaScript po pobraniu strony, więc byłem przygotowany na 20-30%, może 50% różnicę, ale 450%?

Wygląda na to, że gdzieś jest problem. Użyłem debugera Google Analytics dla Chrome i wszystko wydaje się działać dobrze. Kod GA jest w głowie, więc powinien zostać wystrzelony dość szybko.

Czy tak duża luka jest normalna? Jeśli tak, dlaczego, a jeśli nie, co do licha to powoduje?

zaktualizowane

Przepraszam, nie sądzę, żeby było jasne, zrozumiałem różnice między statystykami CF i GA, zanim zacząłem z CF, i oczekiwałem, że będą się różnić. Jest to wielkość różnicy, która dotyczy.

CF wyraźnie oddziela roboty i roboty od zwykłych gości, więc liczba, którą porównuję z GA, to tylko zwykli goście; więc różnica mówi, że tylko 1 na 5 odwiedzających uruchamia Google Analytics ?

"your CloudFlare visitor number is most likely higher"

Nie robi tego sprawiedliwie!

CodeMonkey
źródło
Mam ten sam problem z jeszcze większą rozbieżnością. Myślę, że powodem może być liczba odwiedzających. Ile wyświetleń strony zgłasza Twoja GA przez miesiąc? Dla mnie liczba wyświetleń stron zgłoszona przez CF dla określonego okresu wynosi 223 000 000, podczas gdy liczba zgłoszona przez GA to 22 000 000. Z pewnością nie może to być spowodowane robotami lub .js. Wydaje mi się, że wynika to z limitu danych GA, które same zgłaszają, nie gwarantują one dostarczenia właściwych danych dla ponad 10 milionów wyświetleń strony miesięcznie. W każdym razie tak myślę i nadal nie jestem pewien.
Manoochehr
Kolejna rzecz: jeśli jeden z twoich zdjęć jest połączony za pomocą linku, prawdopodobnie wywołuje wizytę w Cloudflare, ale nie powinien. To trudne. Powiedziałbym, że solidne wizyty najprawdopodobniej zostaną zarejestrowane przez Google Analytics niż przez Cloudflare.
David 天宇 Wong

Odpowiedzi:

4

CloudFlare potwierdza to i przedstawia następujące wyjaśnienie :

CloudFlare Analytics a inne usługi

Google Analytics i inne internetowe programy analityczne śledzą użytkowników, którzy uruchamiają JavaScript. W rezultacie zagrożenia, boty i automatyczne roboty indeksujące nie są rejestrowane, ponieważ ci goście zwykle nie uruchamiają JavaScript. Usługi te również nie śledzą użytkowników, którzy opuszczają stronę, zanim zostanie w pełni załadowana lub ma wyłączony Javascript. CloudFlare śledzi cały ruch według żądań, więc liczba odwiedzających CloudFlare jest najprawdopodobniej wyższa.

Pamiętaj: CloudFlare może śledzić tylko użytkowników przechodzących przez system CloudFlare, który jest reprezentowany przez pomarańczową chmurę na stronie ustawień DNS.

Twierdzą, że ich własne dane analityczne „są często dokładniejsze niż inne usługi oparte na JavaScript”.

Andrew Lott
źródło
dziękuję za poświęcony czas, ale rozumiem rozumowanie, to dlatego, że mój umysł jest zdumiony skalą różnicy! Zaktualizowałem moje pytanie nieco bardziej szczegółowo
CodeMonkey
4

Zauważyłem podobne różnice podczas porównywania dzienników Apache z danymi analitycznymi i widziałem (jeden dzień) stosunek 1000: 1. Możliwe jest, że masz bazę użytkowników, która blokuje Google-Analytics za pomocą produktów takich jak NoScript i Ghostery lub w ogóle nie uruchamia javascript. Przekonałem się, że Piwik daje lepsze raporty i można go skonfigurować tak, aby blokery modułu śledzącego nie blokowały jego skryptu, a użytkownicy bez javascript nadal mogą być śledzeni za pomocą schematu śledzenia obrazu 1 x 1 piksela. Nie mam jednak żadnego doświadczenia w korzystaniu z CloudFlare lub CDN, więc nie wiem, czy wpłynie to na raportowanie Piwika.

Paweł
źródło
80% blokowania GA wydaje mi się bardzo wysokie, czy to brzmi dla ciebie normalnie? Z ciekawości, czego użyłeś do analizy dzienników Apache i odfiltrowania botów i zagrożeń?
CodeMonkey
Myślę, że typowy odsetek użytkowników aktywnie blokujących wtyczki byłby mniejszy niż 5%, ale nie mam prawdziwej podstawy do tego, poza obserwowaniem nawyków przeglądania znajomych, współpracowników itp. W przypadku dzienników Apache używam po prostu AWStats - nie robi tego t filtrować cokolwiek, przynajmniej nie tak, jak mam to ustawione. Przeszedłem na Piwik, ponieważ jedna z moich stron nie uruchamia żadnych skryptów, a dla innych stron bardziej podobają mi się raporty.
Paul
2

nie jest trudno zrozumieć, dlaczego liczby Cloudflare są o wiele wyższe niż wy GA. powodem jest to, że Cloudflare jest średnim człowiekiem. pozwól mi wyjaśnić szczegółowo.

Widzisz, gdy ktoś wchodzi na stronę internetową korzystającą z Cloudflare, użytkownicy wysyłają zapytanie do Cloudflare, które to informacje, takie jak klient użytkownika IP i inne. więc nie ma znaczenia, czy użytkownik korzystający z rozszerzeń, takich jak blokowanie skryptów lub inne Cloudflare, będzie wiedział, że ktoś odwiedził Twoją witrynę.

dlaczego liczby są wysokie? Widzisz za każdym razem, gdy witryna jest rejestrowana lub domena, a dokładnie taki wielki człowiek, jak Google, wysyła swoje boty w celu gromadzenia informacji. pamiętaj, że Google nie tylko wysyła swoje boty, ale jest wiele innych. Cloudflare ma wiele sposobów, by poznać swojego bota lub prawdziwą osobę, ale nie jestem pewien, czy oddzielają lub usuwają wizyty bota.

te środki różnicujące można łatwo oszukać.

wniosek: za każdym razem, gdy twoja witryna zostanie o to poproszona, dodaje +1 do całkowitej liczby.

dodatkowe przemyślenia: nie jestem do końca pewien, ale jeśli dodasz plik .js, .png lub jakiekolwiek inne pliki na swojej stronie. Twoja przeglądarka wysyła żądanie do podanego linku, które może również być liczone jako wizyta na stronie. Np .: jeśli na stronie znajduje się 10 zdjęć i aby je załadować, przeglądarka wysyła żądanie do wszystkich tych zdjęć osobno, co może oznaczać, że liczba odwiedzin wynosi od 1 do 11. (10 dla zdjęć i jedno dla HTML witryny)

użytkownik97589
źródło
1

Do tej pory nigdy nie patrzyłem na moją Cloudflare Analytics, ale twoje są bliżej Analytics niż moje. Cloudflare zgłasza 20-krotną liczbę unikalnych odwiedzin w porównaniu z Google i jest mniej więcej taki sam w przypadku wyświetleń strony.

nathangiesbrecht
źródło
Ciekawe, więc czy jest to coś, co prawdopodobnie zbadasz dalej?
CodeMonkey,
Przejrzałem trochę dzienniki i wydaje się, że to głównie boty powodują rozbieżności. To i mam narzędzie sprawdzające dostępność, które działa w Dokumentach Google, które odwiedza witrynę co 5 minut.
nathangiesbrecht
1

Niedawno zniszczyłem stronę kliencką opartą na WP i zapaliłem zupełnie nową. W tym samym czasie dodałem CF do jego nowej strony. Jego stara strona wciąż uderzała w limity serwera bc hotlinkowania złodziei. Podczas tworzenia nowej witryny udaremniłem je, niszcząc wszystkie stare adresy URL obrazów. Teraz CF zgłasza znacznie większy ruch niż GA i wierzę, że jego liczba żądań do serwera, które są teraz obrazem 404, nie została znaleziona przez wszystkich złodziei, którzy łączą jego stare obrazy. Tylko moje dwa centy.

Christopher Scott
źródło