quest_claude_code_data_analyst_ga4.exe
_
×

Claude Code pour le data analyst : interroger GA4 et BigQuery

Comment un data analyst connecte Claude Code à GA4 et BigQuery via le MCP pour interroger ses données en langage naturel, et où l'IA hallucine.

claude-code ga4 bigquery ia guide

En 2026, Claude Code pour le data analyst n’est plus un gadget : c’est un agent IA en terminal qui lit votre schéma, écrit ses requêtes, les exécute et explique les résultats. Branché sur GA4 et BigQuery via le MCP, il transforme la phrase « croissance du revenu par catégorie ce trimestre » en SQL exécuté, sans que vous touchiez à UNNEST. La promesse est réelle. Le piège aussi : l’IA voit la donnée brute, pas votre métier. Ce guide montre comment monter un workflow fiable, et où ne jamais lui faire confiance les yeux fermés.

De « écrire du SQL » à « parler à ses données »

Pendant dix ans, l’analyst passait l’essentiel de son temps à traduire une question business en SQL. L’export GA4 vers BigQuery a démultiplié la puissance d’analyse, mais aussi la friction : tables imbriquées, event_params à déballer, partitions à filtrer. Écrire une requête propre prenait des minutes, parfois des heures de debug.

L’IA agentique inverse la charge. Vous formulez l’intention en langage naturel, l’agent propose le SQL, l’exécute, et vous présente le résultat commenté. Le travail ne disparaît pas : il se déplace vers la formulation précise de la question et la relecture critique de ce que l’agent a produit. C’est exactement là que la compétence d’un analyst reste décisive.

Claude Code et le MCP, en une minute

Claude Code est l’agent IA d’Anthropic qui tourne dans votre terminal. Il ne se contente pas de répondre : il agit, en lisant des fichiers, en lançant des commandes et en appelant des outils externes.

Ces outils externes, il y accède via le MCP (Model Context Protocol), un protocole ouvert qui relie un modèle IA à des sources de données et des services. Un « serveur MCP » expose des capacités (lire un schéma BigQuery, lancer une requête, appeler l’API GA4) que l’agent peut utiliser. En 2026, le MCP s’est imposé comme standard, et les connecteurs analytics se sont multipliés.

Retenez la nuance qui change tout : un serveur MCP BigQuery donne un accès SQL brut. Il n’y a pas de couche métier, pas de définitions de métriques validées, pas de logique de jointure gouvernée. L’agent voit des colonnes, pas votre logique d’entreprise.

Deux portes d’entrée pour un analyst

Selon la question, deux chemins existent, avec des compromis nets.

CritèreMCP de l’API GA4MCP / connexion BigQuery (export GA4)
Type de donnéesAgrégées (dimensions et métriques)Brutes, au niveau événement
FraîcheurDonnées quasi temps réelSelon l’export (J+1 en quotidien)
Limite de lignesPlafonds d’API, échantillonnage possibleAucune limite, données non échantillonnées
Cas d’usageQuestions rapides, vérifs, reporting légerAttribution custom, parcours, requêtes lourdes
CoûtQuotas APIFacturation à la donnée scannée
Risque principalDéfinitions de métriques mal interprétéesJointures et UNNEST mal cadrés, coûts

Porte 1 : le MCP de l’API GA4

Idéal pour les questions du quotidien : « quelles sont mes 10 pages les plus vues sur 28 jours ? », « quel canal a converti le mieux la semaine dernière ? ». Vous interrogez des dimensions et métriques déjà calculées par GA4, donc avec les définitions officielles. La contrepartie : vous héritez aussi des limites de l’interface (échantillonnage, plafonds de lignes, cardinalité).

Porte 2 : BigQuery sur l’export GA4

C’est la puissance maximale. Données brutes, au niveau événement, non échantillonnées : vous pouvez reconstruire des parcours, calculer une attribution sur mesure, croiser avec d’autres sources. C’est aussi là que la rigueur compte le plus, car l’agent écrit du SQL libre sur un schéma complexe. Si l’export GA4 vers BigQuery n’est pas encore en place chez vous, c’est le prérequis numéro un : voir le guide d’exploitation de l’export GA4 dans BigQuery.

Mise en place pas à pas

Prérequis

Avant de connecter quoi que ce soit : un export GA4 vers BigQuery actif, un projet Google Cloud avec la facturation activée, et un compte de service (ou une auth utilisateur) avec des droits en lecture seule sur le dataset. Ne donnez jamais à l’agent plus de droits que nécessaire.

Brancher un serveur MCP

Plusieurs options coexistent en 2026. Google Cloud propose une intégration officielle pour BigQuery ; côté écosystème, des acteurs comme Composio, Windsor.ai, Porter, Stape ou Sequel proposent des serveurs MCP orientés analytics. Vérifiez toujours l’état réel et les permissions du connecteur au moment de l’installer, car l’offre bouge vite. Le principe reste identique : vous déclarez le serveur MCP dans la configuration de Claude Code, avec les identifiants d’accès, puis vous redémarrez l’agent.

Premier prompt de vérification

Ne lui demandez pas tout de suite une analyse. Commencez par valider la connexion et la compréhension du schéma :

« Liste les tables de mon dataset GA4 et décris la structure de la table d’événements la plus récente. »

Si l’agent renvoie vos tables events_YYYYMMDD et décrit correctement event_name, event_params ou user_pseudo_id, la chaîne fonctionne. C’est aussi le moment de vérifier qu’il a bien identifié les colonnes imbriquées.

Cas d’usage concrets à fort ROI

Audit express d’une propriété

« Sur les 7 derniers jours, liste les 20 event_name les plus fréquents, et signale ceux qui ressemblent à du doublon ou à un nommage incohérent. » En quelques secondes, vous obtenez une photo de la qualité du tracking. La qualité de ces réponses dépend directement de la propreté de votre collecte ; si vos événements partent déjà faux, l’agent le reflétera fidèlement. C’est tout l’enjeu rappelé dans les 7 erreurs de dataLayer qui faussent vos données GA4.

Exploration ad hoc

« Calcule la croissance MoM du revenu par catégorie de produit sur les 6 derniers mois. » L’agent déballe items, agrège, pivote et commente. Vous validez la logique en quelques secondes au lieu d’écrire la requête.

Générer des requêtes BigQuery complexes

C’est l’un des meilleurs usages : laisser l’agent rédiger un premier jet de requête lourde (jointures multiples, filtres de partition, UNNEST imbriqués), que vous corrigez ensuite. Vous gagnez sur la syntaxe et la plomberie, vous gardez la main sur la logique métier.

Brouillon de modèle d’attribution

Sur données brutes, vous pouvez demander un squelette d’attribution (premier clic, dernier clic non direct, position) à reconstruire depuis les sessions. À traiter comme un brouillon à auditer, jamais comme un résultat publiable tel quel.

Là où l’IA déraille

Voici le cœur de l’article, et ce que les tutos « no-code » passent sous silence. L’agent est bluffant sur la syntaxe, faillible sur le sens.

Les jointures hallucinées sont le risque numéro un. L’agent peut joindre deux tables sur une clé plausible mais fausse, ou inventer une relation qui n’existe pas dans votre modèle. Le SQL tourne, le chiffre s’affiche, et il est faux.

Les définitions de métriques sont l’autre piège. « Session », « utilisateur actif », « conversion » ont des définitions précises dans GA4. Sur l’export brut, l’agent recalcule à sa manière, qui ne correspond pas forcément à celle de l’interface. Deux chiffres « revenu » peuvent diverger sans que ce soit un bug.

Les coûts comptent aussi. Une requête mal cadrée, sans filtre de partition, peut scanner des téraoctets et vous coûter cher. L’agent n’a aucune notion native de votre budget.

Enfin, la confidentialité. L’export GA4 peut contenir des identifiants et des données sensibles. Donner un accès large à un agent IA mérite une vraie réflexion sur le périmètre, les droits et la conformité.

Règle d’or : toujours faire relire le SQL et recouper les chiffres avec une source connue avant de décider quoi que ce soit.

Bonnes pratiques pour fiabiliser

Documentez le contexte que l’agent ne peut pas deviner : un fichier décrivant votre schéma, vos définitions de métriques et vos règles de jointure améliore radicalement la pertinence. Restreignez les accès au strict minimum, en lecture seule, sur les datasets concernés. Imposez systématiquement un filtre de partition pour contrôler les coûts. Relisez le SQL généré avant de l’exécuter sur de gros volumes. Et gardez l’humain dans la boucle pour toute décision : l’agent propose, l’analyst valide.

Pour les livrables récurrents, l’IA brille en préparation et en vérification plus qu’en automatisation aveugle. Elle aide à monter et auditer ce que vous publierez ensuite dans vos rapports, comme expliqué dans automatiser ses rapports avec Looker Studio et BigQuery.

Verdict : par où commencer

Claude Code branché sur GA4 et BigQuery fait gagner des heures sur l’exploration, la génération de requêtes et le debug. Il ne remplace pas l’analyst : il déplace sa valeur vers la gouvernance, la connaissance du schéma GA4 et le contexte business, qui deviennent plus importants, pas moins.

Commencez sans risque : connectez d’abord le MCP de l’API GA4 en lecture seule, posez-lui des questions dont vous connaissez déjà la réponse, et observez où il se trompe. Quand vous aurez calibré votre confiance, ouvrez la porte BigQuery pour les analyses lourdes. À noter au passage : ce blog est lui-même opéré avec ces outils, ce qui aide à mesurer concrètement leurs forces et leurs limites.

Curieux de l’IA sous l’autre angle, celui de l’IA comme source de trafic et non comme outil ? Voir tracker le trafic ChatGPT, Gemini et Claude dans GA4.