Google Analytics 4 – Assurer la continuité du pilotage dans BigQuery

Article Analytics 20.06.2024
Par Simon Gay

Simon Gay, Consultant Senior data analyst chez Converteo, expert des sujets d’analytics engeneering : GCP, BigQuery. Il accompagne nos clients sur l’utilisation et l’appropriation de leurs données marketing pour leurs analyses.

Régulièrement, des clients viennent nous voir avec cette problématique : comment assurer la transition entre mes datasets BigQuery UA et GA4 ? 

Il est en effet crucial pour les équipes de pouvoir piloter leurs KPIs sans discontinuité.

Universal Analytics, dans sa version 360, baissera définitivement le rideau en juillet. On constate cependant que de nombreux clients désirent l’utiliser jusqu’à la fin, et que la résistance au changement et à la transition vers GA4 est forte.

Nous évoquons ici plusieurs approches pour lever les freins concernant l’adoption de l’outil :  

  • Connaître les différents écueils du data model GA4 dans BigQuery
  • Re-modéliser convenablement ses données pour matcher avec Universal Analytics

 

Connaître le data model GA4 dans BigQuery

L’export des données GA4 dans BigQuery permet d’avoir accès à des données brutes et granulaires ce qui offre des opportunités de pilotage et d’analyse pour les équipes Data Marketing. 

Deux modèles de données différents

Au contraire d’Universal Analytics qui propose un modèle de données exportées parfois complexe basé sur une imbrication de hits et de sessions, GA4 opte pour un modèle de données plus “à plat” où chaque ligne est un évènement. On a donc deux outils différents et deux modèles différents. 

Pour chaque KPI que l’on va vouloir piloter en continu, il faut au préalable se poser la question de son calcul entre les différents modèles, pour savoir si, intellectuellement, il est possible de les comparer.

A ce sujet, nous vous conseillons la lecture de https://www.ga4bigquery.com/ qui propose des tas de requêtes SQL préconstruites sur les indicateurs de base.

 

… et des écueils à connaître dans le data model GA4

Le modèle d’export des données GA4 propose quelques certains défis qu’il est important de surmonter. Voici les principaux que nous rencontrons dans nos missions : 

  • La gestion des types : GA4 classe automatiquement un paramètre dans une colonne selon son type (integer / string / double value / float). Renvoyer la bonne valeur d’un paramètre est un petit casse tête en SQL qu’il faut savoir maîtriser : les fonctions COALESCE() et SAFE_CAST() sont vos meilleures alliées. Les principales fonctions à connaître sont listées dans cet article Medium ; ainsi que sur celui-ci spécifiquement pour la gestion des dates

 

Un trait d’humeur sur X

  • La modification des données : les données peuvent être modifiées – dans la table journalière – jusqu’à 72h après disponibilité. En conséquence, vos routines de calcul et d’appels à ces tables doivent référencer les tables d’origine pendant 3 jours si vous voulez avoir un calcul exhaustif.
  • Unicité du session_id : rappeler qu’un ID de session se requête en combinant le ga_session_id et le user_pseudo_id

  • Gestion du consent_mode : les hits non-consentis “privacy_info.analytics_storage = no” sont inclus dans l’export – même si avec un nombre de paramètres associés minimes – pensez à ne pas les compter
  • Absence de dimension à la session – vu que le modèle est à l’event – au contraire d’Universal Analytics. Vous devrez donc “sessioniser” certaines dimensions.
  • Pas d’intégration avec les outils Ads – la réconciliation doit se faire soi-même
  • Pas de données d’attribution – qui est également à recalculer par soi-même – notamment si vous voulez reproduire une logique “last-click non direct”
  • Des événements envoyés en batch ont le même event timestamp – c’est à vous au niveau de la collecte de créer un timestamp distinct si vous souhaitez recréer une notion d’ordre – en attendant une évolution côté Google !

 

Une fois que nous avons défini clairement les KPIs que nous souhaitons suivre et leur méthode de calcul, nous pouvons aborder la question de leur rapprochement entre UA et GA4.

 

Modéliser et rapprocher les données entre GA4 et UA

Pour travailler sur les données GA4, nous recommandons de les subdiviser en sous-ensembles de tables répondant à une logique de scope : users, sessions, ecommerce, événements, pages… 

Le principal intérêt de cette subdivision étant de maximiser la performance et de diminuer les coûts – autrement dit éviter d’appeler la table principale qui peut contenir des dizaines de millions de lignes à chaque requête. 

Prenons un exemple : notre équipe Data Marketing pilote le KPI “Fréquence de sessions par utilisateur” dans Universal Analytics. Nous créons une table “ga4_user” qui calcule ce KPI pour GA4 ; puis nous mergeons ensuite ce KPI avec son historique Universal Analytics. 

Chez Converteo, nous avons décidé de nous appuyer sur les outils de modelling standards du marché pour effectuer cette partie : DBT et Dataform.

Deux exemples publics existent pour montrer les capacités de ces outils : 

  • Pour DBT, la ressource la plus intéressante concerne le package Velir/dbt-ga4 qui permet de recréer des tables au niveau user / session / page et d’y associer des taux de conversion par exemple.
  • Pour Dataform, j’apprécie le travail fourni par Artem Korneev notamment pour la gestion du modèle d’attribution

Notre rôle chez Converteo est de créer et de livrer toutes les tables pré-calculées clé-en-main pour les équipes de nos clients et leur offrir une continuité de pilotage.

 

Les limites de l’approche

Prenons un exemple de table “session” avec différents KPI associés : 

  • Taux d’accès au checkout
  • Nb de sessions par source / medium

Une fois les données modélisées et réconciliées, nous pouvons les visualiser dans l’outil de notre choix (Looker Studio / Tableau). Cependant, les courbes ne se suivront pas exactement: car les sessions ne sont pas calculées de la même manière entre les outils.

Même s’il peut être tentant de vouloir “redresser” ses courbes avec modèle de Data Science, l’approche est de notre expérience – assez vaine. 

C’est pour cela qu’il est essentiel, dès la phase de cadrage, de bien choisir les KPIs et de challenger via un Sanity Check le niveau de confiance à rapprocher GA4 et UA.

 

L’incontournable BigQuery

L’utilisation de BigQuery pour GA4 offre un vaste champ des possibles en termes d’analyse marketing : analyse de data quality, clustering, recréation de visualisations personnalisée.

C’est également une belle opportunité offertes aux organisations pour progresser dans leur usage d’outils de modelling comme DBT et Dataform. L’utilisation de BigQuery, intégré au stack GCP, avec toutes les innovations autour de Gemini notamment, est clairement un marqueur de maturité digitale et ce vers quoi notre métier se dirige.

L’avantage est qu’il n’est jamais trop tard pour se lancer ou s’y perfectionner, bien qu’il faille connaître les conditions : la réussite d’un projet GA4 x BigQuery nécessite à la fois de l’expérience – car les problèmes inhérents au modèle de données sont nombreux – et un engagement important des équipes pour maintenir la qualité des données au cours du temps.

 

Inscrivez-vous à notre newsletter dédiée aux métiers de l’Analytics, du tracking et du CRO :

Par Simon Gay

Consultant Senior data analyst

1 / 1
tommy-lambert

Au-delà du code : l’architecture multi-agents est la prochaine frontière de notre gouvernance IT

Pourquoi l'architecture multi-agents est-elle la nouvelle frontière de la gouvernance IT ? Optimisez vos workflows et triplez votre productivité

Agents vocaux en 2026 : qu’est-ce qui change vraiment ?

Comment les agents vocaux révolutionnent-ils les interactions en 2026 ?
Maeva Le Menn

Programme à points ou à statuts : comment choisir le bon modèle pour son programme de fidélité ?

Comment choisir le bon modèle de programme de fidélité ? Découvrez les avantages des mécaniques à points, à statuts ou hybrides pour engager vos clie...

Converteo Launches an International AI and Agentic Systems Offering Dedicated to the Pharma & Life Sciences Industry

Rolled out across all markets where Converteo operates (France, Italy, Spain, the United States, and Canada), this new offering enables healthcare pl...

Converteo lance une offre en IA et systèmes agentiques dédiée à l’industrie pharmaceutique

Communiqué de presse, 12 juin 2026 Déployée sur l’ensemble des marchés où Converteo est présent (France, Italie, Espagne, États-Unis et Canada), ce...

Converteo accélère son expansion internationale avec la nomination de 3 Partners et l’ouverture de 2 nouveaux bureaux à Toronto et Milan

Paris, 23 juin 2026 – Converteo, cabinet de conseil leader en Data & IA, franchit une étape majeure dans son déploiement mondial. Déjà présent à ...
Maeva Le Menn

Fidélité dans le travel : pourquoi 90 % des programmes sont à statuts ?

Comment le secteur du voyage utilise-t-il les statuts pour fidéliser ? Inspirez-vous des stratégies d'Air France et Accor pour maximiser la rétention...
Maeva Le Menn

Programmes de fidélité : où en est-on en 2026 ?

Comment moderniser votre programme de fidélité face à la saturation ? Évitez les frictions, créez un engagement émotionnel et ROIste en 2026

Conformité IA agentique : le guide 2026 de l’AI Act

Comment préparer votre entreprise à l'AI Act de 2026 ? Maîtrisez les obligations de transparence et d'IA literacy pour votre conformité IA agentique.

Test agent vocal IA : clients virtuels et LLM-as-a-judge

Comment sécuriser et tester un agent vocal IA à l'échelle ? Utilisez les clients virtuels, le LLM-as-a-judge et le bug bounty pour éviter les dérives...

Architecture agent vocal : pipeline vs voice-to-voice

Quelle architecture agent vocal choisir entre le pipeline STT/TTS et le voice-to-voice ? Comparez latence, coûts et contrôle pour votre IA.

IA dans le tourisme : non, le conseil humain ne va pas disparaître !

Comment intégrer l'IA dans le tourisme sans perdre la relation client ? Alliez automatisation et conseil humain pour une expérience voyageur unique.

1 / 1

Utiliser Looker Studio avec la donnée Piano Analytics

Dans cet article, nous vous guiderons pour construire vos tableaux de bord Looker Studio avec votre donnée Piano en ayant conscience de ces quelques....
tommy-lambert

Au-delà du code : l’architecture multi-agents est la prochaine frontière de notre gouvernance IT

Pourquoi l'architecture multi-agents est-elle la nouvelle frontière de la gouvernance IT ? Optimisez vos workflows et triplez votre productivité

Agents vocaux en 2026 : qu’est-ce qui change vraiment ?

Comment les agents vocaux révolutionnent-ils les interactions en 2026 ?
Maeva Le Menn

Programme à points ou à statuts : comment choisir le bon modèle pour son programme de fidélité ?

Comment choisir le bon modèle de programme de fidélité ? Découvrez les avantages des mécaniques à points, à statuts ou hybrides pour engager vos clie...

Converteo Launches an International AI and Agentic Systems Offering Dedicated to the Pharma & Life Sciences Industry

Rolled out across all markets where Converteo operates (France, Italy, Spain, the United States, and Canada), this new offering enables healthcare pl...

Converteo lance une offre en IA et systèmes agentiques dédiée à l’industrie pharmaceutique

Communiqué de presse, 12 juin 2026 Déployée sur l’ensemble des marchés où Converteo est présent (France, Italie, Espagne, États-Unis et Canada), ce...

Converteo accélère son expansion internationale avec la nomination de 3 Partners et l’ouverture de 2 nouveaux bureaux à Toronto et Milan

Paris, 23 juin 2026 – Converteo, cabinet de conseil leader en Data & IA, franchit une étape majeure dans son déploiement mondial. Déjà présent à ...
Maeva Le Menn

Fidélité dans le travel : pourquoi 90 % des programmes sont à statuts ?

Comment le secteur du voyage utilise-t-il les statuts pour fidéliser ? Inspirez-vous des stratégies d'Air France et Accor pour maximiser la rétention...
Maeva Le Menn

Programmes de fidélité : où en est-on en 2026 ?

Comment moderniser votre programme de fidélité face à la saturation ? Évitez les frictions, créez un engagement émotionnel et ROIste en 2026

Conformité IA agentique : le guide 2026 de l’AI Act

Comment préparer votre entreprise à l'AI Act de 2026 ? Maîtrisez les obligations de transparence et d'IA literacy pour votre conformité IA agentique.

Test agent vocal IA : clients virtuels et LLM-as-a-judge

Comment sécuriser et tester un agent vocal IA à l'échelle ? Utilisez les clients virtuels, le LLM-as-a-judge et le bug bounty pour éviter les dérives...

Architecture agent vocal : pipeline vs voice-to-voice

Quelle architecture agent vocal choisir entre le pipeline STT/TTS et le voice-to-voice ? Comparez latence, coûts et contrôle pour votre IA.

1 / 1

Exploiter le potentiel de l’interface GA4 avec les collections

A l’occasion de l’arrêt du traitement des données d’Universal Analytics, il est indispensable de maitriser son remplaçant Google Analytics 4.
tommy-lambert

Au-delà du code : l’architecture multi-agents est la prochaine frontière de notre gouvernance IT

Pourquoi l'architecture multi-agents est-elle la nouvelle frontière de la gouvernance IT ? Optimisez vos workflows et triplez votre productivité

Agents vocaux en 2026 : qu’est-ce qui change vraiment ?

Comment les agents vocaux révolutionnent-ils les interactions en 2026 ?
Maeva Le Menn

Programme à points ou à statuts : comment choisir le bon modèle pour son programme de fidélité ?

Comment choisir le bon modèle de programme de fidélité ? Découvrez les avantages des mécaniques à points, à statuts ou hybrides pour engager vos clie...

Converteo Launches an International AI and Agentic Systems Offering Dedicated to the Pharma & Life Sciences Industry

Rolled out across all markets where Converteo operates (France, Italy, Spain, the United States, and Canada), this new offering enables healthcare pl...

Converteo lance une offre en IA et systèmes agentiques dédiée à l’industrie pharmaceutique

Communiqué de presse, 12 juin 2026 Déployée sur l’ensemble des marchés où Converteo est présent (France, Italie, Espagne, États-Unis et Canada), ce...

Converteo accélère son expansion internationale avec la nomination de 3 Partners et l’ouverture de 2 nouveaux bureaux à Toronto et Milan

Paris, 23 juin 2026 – Converteo, cabinet de conseil leader en Data & IA, franchit une étape majeure dans son déploiement mondial. Déjà présent à ...
Maeva Le Menn

Fidélité dans le travel : pourquoi 90 % des programmes sont à statuts ?

Comment le secteur du voyage utilise-t-il les statuts pour fidéliser ? Inspirez-vous des stratégies d'Air France et Accor pour maximiser la rétention...
Maeva Le Menn

Programmes de fidélité : où en est-on en 2026 ?

Comment moderniser votre programme de fidélité face à la saturation ? Évitez les frictions, créez un engagement émotionnel et ROIste en 2026

Conformité IA agentique : le guide 2026 de l’AI Act

Comment préparer votre entreprise à l'AI Act de 2026 ? Maîtrisez les obligations de transparence et d'IA literacy pour votre conformité IA agentique.

Test agent vocal IA : clients virtuels et LLM-as-a-judge

Comment sécuriser et tester un agent vocal IA à l'échelle ? Utilisez les clients virtuels, le LLM-as-a-judge et le bug bounty pour éviter les dérives...

Architecture agent vocal : pipeline vs voice-to-voice

Quelle architecture agent vocal choisir entre le pipeline STT/TTS et le voice-to-voice ? Comparez latence, coûts et contrôle pour votre IA.