Nouveautés dans GA4 : ajout de champs BigQuery pour ordonner la collecte des événements Web
Google Analytics 4 (GA4) continue de s’améliorer pour offrir aux analystes de données des outils de plus en plus sophistiqués, permettant une analyse plus précise et détaillée des comportements des utilisateurs. Une des mesures récentes les plus significatives concerne l’intégration de nouveaux champs dans les tables d’exportation d’événements vers BigQuery. Ces champs permettent une meilleure réplique de l’ordre de collecte des événements dans le navigateur, enrichissant ainsi les capacités analytiques des entreprises. Dans cet article, nous allons explorer ces nouvelles fonctionnalités et évaluer leur impact potentiel sur l’analyse des données.
Introduction à Google Analytics et BigQuery
Google Analytics est une solution de suivi de sites web et d’applications mobiles largement utilisée par les entreprises pour comprendre le comportement des utilisateurs et améliorer leur expérience. GA4, la dernière version de Google Analytics, introduit de nombreuses innovations par rapport à Universal Analytics, notamment une intégration native avec BigQuery, le service d’entrepôt de données de Google Cloud.
BigQuery permet de stocker et d’analyser de grandes quantités de données à une vitesse impressionnante. L’exportation des données de GA4 vers BigQuery offre une flexibilité et une profondeur d’analyse largement supérieures à celles disponibles dans l’interface utilisateur de GA4. Cela est particulièrement précieux pour les entreprises qui nécessitent des analyses avancées, comme le machine learning ou l’analyse prédictive.
Les nouvelles additions aux champs d’exportation BigQuery
Le 20 juillet 2024, Google a annoncé l’ajout de trois nouveaux champs dans les tables d’exportation d’événements BigQuery pour les propriétés GA4 Web :
- batch_page_id
- batch_ordering_id
- batch_event_index
Ces champs ont été introduits pour permettre une meilleure reconstitution de l’ordre de collecte des événements dans le navigateur.
batch_page_id
Le champ batch_page_id
est un identifiant unique attribué à chaque lot de collecte de pages. Il permet de grouper les événements associés à une même page ou session de navigation. Par exemple, si un utilisateur interagit avec plusieurs éléments d’une même page web, batch_page_id
permettra de regrouper ces interactions, facilitant ainsi l’analyse des comportements des utilisateurs au niveau d’une session de page web.
batch_ordering_id
Le champ batch_ordering_id
est un identifiant séquentiel qui aide à déterminer l’ordre dans lequel les événements ont été collectés au sein d’un même lot. Ce champ est particulièrement utile pour comprendre la chronologie des interactions des utilisateurs, permettant d’identifier l’enchaînement des actions et d’analyser les parcours utilisateurs avec plus de précision.
batch_event_index
Le champ batch_event_index
est un index qui numérote les événements au sein d’un lot spécifique. Cela apporte une granularité supplémentaire lors de l’analyse des données, en complément de batch_ordering_id
. Ce champ est fondamental pour les situations où plusieurs événements sont collectés simultanément ou de manière très rapprochée dans le temps.
Importance des nouveaux champs pour l’analyse des données
Les nouvelles additions des champs dans les tables BigQuery offrent plusieurs avantages notables :
Précision accrue des analyses
Avec l’ajout des champs batch_page_id
, batch_ordering_id
et batch_event_index
, les analystes peuvent reproduire beaucoup plus précisément l’ordre de collecte des événements tels qu’ils se produisent dans le navigateur. Cela assure que les analyses reflètent fidèlement le comportement des utilisateurs, réduisant ainsi les approximations et les erreurs d’interprétation.
Reconstructions complexes des parcours utilisateurs
Ces champs permettent de segmenter et d’analyser les données à un niveau beaucoup plus détaillé, facilitant la reconstruction des parcours utilisateurs de manière plus complexe et précise. Les analystes peuvent désormais suivre chaque interaction consécutive d’un utilisateur au sein d’une session ou à travers plusieurs sessions.
Améliorations des modèles prédictifs
Pour les entreprises utilisant des modèles de machine learning ou d’analyse prédictive, connaître l’ordre exact des événements est crucial. Ces nouveaux champs fournissent les informations nécessaires pour entraîner des modèles plus précis et plus fiables, améliorant ainsi la capacité de prédiction et la qualité des décisions basées sur ces modèles.
Détection des anomalies et des fraudes
Une compréhension détaillée de l’ordre des événements peut également révéler des comportements atypiques ou suspects. Cela aide à détecter des fraudes potentielles ou des dysfonctionnements dans le système de suivi, permettant ainsi aux entreprises de prendre des mesures correctives plus rapidement et efficacement.
Exemple pratique : analyse des événements avec les champs batch_page_id, batch_ordering_id, batch_event_index
Prenons un exemple concret pour illustrer comment ces nouveaux champs peuvent être utilisés dans une analyse pratique.
Une entreprise de commerce électronique souhaite analyser le parcours de ses utilisateurs pour comprendre comment ils interagissent avec le site avant de réaliser un achat. Avant l’ajout des nouveaux champs, l’entreprise avait des difficultés à comprendre l’ordre précis des événements, surtout lorsque les utilisateurs effectuaient de nombreuses actions en peu de temps. Avec les nouveaux champs, voici comment l’analyse peut être améliorée :
- Extraction des données : Utilisation d’une requête SQL pour extraire les données des événements avec
batch_page_id
,batch_ordering_id
etbatch_event_index
.
SELECT
user_pseudo_id,
event_name,
batch_page_id,
batch_ordering_id,
batch_event_index,
event_timestamp
FROM
`project-id.dataset_id.events_*`
WHERE
event_name IN ('page_view', 'add_to_cart', 'purchase')
ORDER BY
user_pseudo_id,
batch_page_id,
batch_ordering_id,
batch_event_index;
- Segmentation des parcours utilisateurs : Segmenter les données par
batch_page_id
pour identifier les sessions de page, puis utiliserbatch_ordering_id
etbatch_event_index
pour trier et comprendre la séquence des événements. - Analyse des interactions : Analyser les interactions pour chaque
batch_page_id
, en observant l’ordre des actions effectuées par les utilisateurs. Déterminer quelles séquences d’événements ont une corrélation plus forte avec les conversions (achats). - Optimisation du site : Utiliser les insights pour optimiser les éléments de la page et le flux utilisateur. Par exemple, si une séquence spécifique d’actions sur une page entraîne plus d’ajouts au panier, cette découverte peut être utilisée pour adapter le design de la page et le contenu.
Conclusion
L’ajout des champs batch_page_id
, batch_ordering_id
et batch_event_index
dans les tables d’exportation de GA4 vers BigQuery représente une avancée significative pour les analystes de données. Avec ces nouvelles informations, il est désormais possible de reproduire fidèlement l’ordre de collecte des événements, offrant ainsi une meilleure précision dans l’analyse des comportements des utilisateurs. En tirant parti de ces nouvelles additions, les entreprises pourront non seulement optimiser leurs analyses et leurs modèles de prévision, mais aussi améliorer leurs stratégies globales d’engagement client.
FAQ
1. Pourquoi GA4 a-t-il ajouté ces nouveaux champs ?
Ces champs ont été ajoutés pour améliorer la précision de l’analyse des événements collectés, permettant de répliquer l’ordre des événements tels qu’ils se produisent dans le navigateur.
2. Comment ces nouveaux champs peuvent-ils aider à la détection de fraude ?
En analysant les séquences d’événements et en identifiant des comportements atypiques ou des anomalies, ces champs peuvent révéler des fraudes potentielles ou des dysfonctionnements dans le système de suivi.
3. Les champs batch_page_id
, batch_ordering_id
et batch_event_index
sont-ils disponibles pour toutes les propriétés GA4 ?
Oui, ces champs sont disponibles pour toutes les propriétés GA4 Web exportant leurs données vers BigQuery.
4. Peut-on utiliser ces champs pour améliorer les modèles de machine learning ?
Absolument. La connaissance précise de l’ordre des événements est cruciale pour entraîner des modèles de machine learning plus précis et fiables.
5. Où puis-je trouver plus d’informations sur l’exportation des données GA4 vers BigQuery ?
Vous pouvez consulter la documentation officielle de Google sur le schéma d’exportation des événements BigQuery ici.