woptimo

Hit, session et utilisateur : comprendre les rapports Google Analytics

Google Analytics est un outil très puissant d’analyse d’audience web, qui donne accès à de multiples données. Il n’est pas toujours évident de comprendre certains rapports et les confusions sont aisées. Il faut alors revenir aux bases du fonctionnement de l’outil, notamment les données hits, sessions et utilisateurs, afin de ne pas commettre d’erreurs de lecture et d’interprétation. 

Lors des formations Google Analytics que nous donnons régulièrement, une question revient sans cesse : pourquoi tous les rapports ne fournissent pas les mêmes possibilités de statistiques ? En particulier, « Pourquoi le rapport pages de destination (Illustration n°1 ci-dessous) n’a rien à voir avec le rapport toutes les pages (Illustration n°2 ci-dessous) ? »

 

Toutes les statistiques proposées sont différentes (hormis le taux de rebond) : suivi des conversions, sessions, pages vues, etc.

Comment se fait-il qu’il y ait autant de différences ? Pourquoi ne pourrait-on pas, par exemple, suivre les conversions sur le rapport toutes les pages ?

Comment sont comptabilisées les données d’un site ?

Pour répondre à cette question, il faut déjà intégrer les bases de Google Analytics et en savoir plus sur les données calculées.

Dimensions et statistiques

Il existe deux types de données différents qui construisent les rapports : les dimensions et les statistiques.

Une dimension Google Analytics est ce qui définit une donnée, une sorte d’attribut (exemple : URL d’une page, pays d’un utilisateur, source d’une session…) .

Une statistique est une valeur quantitative associée à la dimension (temps passé, montant de transaction, nombre de sessions…) et sur laquelle des opérations sont possible, comme des additions, ou un calcul de moyenne.

La portée de ces données

Pour toutes ces données, chacune est assimilée à une portée particulière (que ce soit une dimension ou une statistique). La portée d’une donnée correspond à une granularité différente au sein des données Analytics.

On en dénombre trois pour le Web Analytics : le hit, la session et l’utilisateur (User), qui sont hiérarchisées ainsi :

Classification des portées des données, dimensions et statistiques Analytics

Source : Justin Cutroni

Cette pyramide montre le degré de granularité de chaque donnée.

Un hit est une interaction entre l’utilisateur et le site web. Souvent il va s’agir d’une page vue, mais également d’une réalisation d’un événement et, éventuellement une transaction…
Un hit est unique et se passe à un instant T. C’est une information singulière collectée par Google Analytics lors de l’envoi de la requête au serveur.

Une session est une suite d’interactions ininterrompues par un utilisateur sur le site web. Une session va donc regrouper plusieurs hits. Lorsque l’on dit « ininterrompu », on entend généralement au moins une interaction en moins de 30 minutes. Au delà de 30 minutes d’inactivité la session est terminée.

Concrètement, prenons l’exemple suivant : Une visite qui arrive sur la homepage, depuis Google en organique, puis visite une page A, une page B, réalise un événement, de nouveau une page A puis sort du site. On a eu 4 hits pour 1 session.
Schéma expliquant la structuration en hits d'une session Analytics

Source : Justin Cutroni

Enfin, un utilisateur est un visiteur unique, qui peut réaliser plusieurs sessions. Il est reconnu par le site web grâce à un cookie stocké dans son ordinateur qui l’identifie. S’il fait une session, puis quitte le site puis revient le lendemain, ce seront 2 sessions, réalisant un ou plusieurs hits chacune, mais le même utilisateur.

Plus d’informations sur le sujet par Justin Cutroni, Google Analytics Evangelist chez Google (en anglais)

Quels sont les différents rapports et leur portée ?

Revenons maintenant à la question de départ : pourquoi peut-on voir le taux de conversion des objectifs sur le rapport pages de destination, mais pas sur toutes les pages, pourtant situé dans la même rubrique Comportement > Contenu du site ?

Et cette question se pose sur bien d’autres rapports, comme sur le rapport Principaux événements qui ne propose pas de données de conversions, alors que Canaux d’acquisition le propose.

A chaque rapport sa portée

La réponse est donc en lien avec la portée de chaque rapport, que nous venons d’aborder.

Pour Pages de destination, il s’agit d’une dimension de portée session, alors que Toutes les pages est de portée hit. La plupart des rapports Google Analytics ont l’une de ces deux portées, on ne trouve qu’assez rarement des rapports de portée utilisateur.

Dans Google Analytics, et d’ailleurs plus largement en analyse de données, on ne peut pas comparer des données de portée différentes, cela n’est pas cohérent.

On ne peut pas, par exemple, mettre en relation un rapport avec pour dimension le canal d’acquisition, avec le temps moyen passé sur la page. De quelle page parlerait-on : toutes les pages ? La première page ?

La portée des conversions ?

Et reprenons l’exemple cité en introduction : les conversions. Le rapport sur toutes les pages vues permet d’avoir une vision exhaustive de chacune des pages et du comportement sur la page, quel que soit le chemin de la session, sa source, Etc. L’idée est d’isoler une page et de voir sa performance. On ne peut donc pas avoir une notion de conversion qui n’est pas forcément liée à la page mais au chemin.

Par exemple, un utilisateur arrive sur le site, il visite une ou deux pages, puis tombe sur une page qui arrive à le convaincre, il clique sur un CTA pour entrer dans un tunnel de conversion. Il arrive au bout du tunnel de conversion et enregistre un objectif réalisé. La page qui a déclenché le processus en soi n’a pas d’objectif réalisé, en revanche, la session, oui. C’est donc trompeur d’analyser des objectifs en fonction d’une seule page. Une page de destination, oui, car elle initie une session. Une page vue toute seule, non.

Plus d’informations et exemples (en anglais) sur le blog du pape de l’Analytics lui-même, Avinash Kaushik ainsi que chez Jellyfish

Exemple concret :

Pour mieux illustrer la situation, prenons un cas pratique.

Les rapports personnalisés nous offrent la possibilité de mélanger les choux et les carottes : on peut y mettre des dimensions de portée hit avec des statistiques de portée session, et vice-versa à volonté et au mépris du bon sens.

Essayons de voir un exemple de données confrontées et pourquoi elles ne sont pas bonnes en créant deux rapports personnalisés dans ce sens.

Voici un rapport avec pour dimension les pages de destination (session) et pour statistique les pages vues (hit).

 

Jusque là ça à l’air inoffensif : les données sont variées, ça n’a pas l’air si mauvais. La lecture qu’on pourrait en faire : la page d’accueil a été vue 4173 fois sur la période.

Voici ensuite un rapport avec pour dimension la page (hit) et pour statistiques les pages vues (hit).

 

 

Une fois encore, tout à l’air inoffensif et normal, ça semble correct. La lecture qu’on pourrait en faire : la page d’accueil a été vue 1433 fois sur la période.

Mais mince alors ? Les deux rapports donnent une information différente ?

Qu’est-ce qui est donc calculé ?

Évidemment, l’interprétation du premier rapport est trompeuse. La vraie façon de lire le rapport devrait être : il y a eu 4173 pages vues lors de sessions commençant par la page d’accueil. Statistique plutôt peu utile, en plus d’être impropre. Ici pour avoir une information intéressante de ce registre, on chercherait plutôt le nombre moyen de pages vues par session (portée session) par exemple.

Finalement, il faut bien comprendre la portée de chaque rapport pour l’analyser, bien se poser la question de quel est le périmètre étudié. C’est d’autant plus important avec un niveau plus avancé d’Analytics quand on commence à construire des rapports personnalisés. La liberté que cela engendre est très puissante, mais il faut être très cohérent pour ne pas faire n’importe quoi.

 

Contact