En 2026, Claude Code pour le data analyst n’est plus un gadget : c’est un agent IA en terminal qui lit votre schéma, écrit ses requêtes, les exécute et explique les résultats. Branché sur GA4 et BigQuery via le MCP, il transforme la phrase « croissance du revenu par catégorie ce trimestre » en SQL exécuté, sans que vous touchiez à UNNEST. La promesse est réelle. Le piège aussi : l’IA voit la donnée brute, pas votre métier. Ce guide montre comment monter un workflow fiable, et où ne jamais lui faire confiance les yeux fermés.
De « écrire du SQL » à « parler à ses données »
Pendant dix ans, l’analyst passait l’essentiel de son temps à traduire une question business en SQL. L’export GA4 vers BigQuery a démultiplié la puissance d’analyse, mais aussi la friction : tables imbriquées, event_params à déballer, partitions à filtrer. Écrire une requête propre prenait des minutes, parfois des heures de debug.
L’IA agentique inverse la charge. Vous formulez l’intention en langage naturel, l’agent propose le SQL, l’exécute, et vous présente le résultat commenté. Le travail ne disparaît pas : il se déplace vers la formulation précise de la question et la relecture critique de ce que l’agent a produit. C’est exactement là que la compétence d’un analyst reste décisive.
Claude Code et le MCP, en une minute
Claude Code est l’agent IA d’Anthropic qui tourne dans votre terminal. Il ne se contente pas de répondre : il agit, en lisant des fichiers, en lançant des commandes et en appelant des outils externes.
Ces outils externes, il y accède via le MCP (Model Context Protocol), un protocole ouvert qui relie un modèle IA à des sources de données et des services. Un « serveur MCP » expose des capacités (lire un schéma BigQuery, lancer une requête, appeler l’API GA4) que l’agent peut utiliser. En 2026, le MCP s’est imposé comme standard, et les connecteurs analytics se sont multipliés.
Retenez la nuance qui change tout : un serveur MCP BigQuery donne un accès SQL brut. Il n’y a pas de couche métier, pas de définitions de métriques validées, pas de logique de jointure gouvernée. L’agent voit des colonnes, pas votre logique d’entreprise.
Deux portes d’entrée pour un analyst
Selon la question, deux chemins existent, avec des compromis nets.
| Critère | MCP de l’API GA4 | MCP / connexion BigQuery (export GA4) |
|---|---|---|
| Type de données | Agrégées (dimensions et métriques) | Brutes, au niveau événement |
| Fraîcheur | Données quasi temps réel | Selon l’export (J+1 en quotidien) |
| Limite de lignes | Plafonds d’API, échantillonnage possible | Aucune limite, données non échantillonnées |
| Cas d’usage | Questions rapides, vérifs, reporting léger | Attribution custom, parcours, requêtes lourdes |
| Coût | Quotas API | Facturation à la donnée scannée |
| Risque principal | Définitions de métriques mal interprétées | Jointures et UNNEST mal cadrés, coûts |
Porte 1 : le MCP de l’API GA4
Idéal pour les questions du quotidien : « quelles sont mes 10 pages les plus vues sur 28 jours ? », « quel canal a converti le mieux la semaine dernière ? ». Vous interrogez des dimensions et métriques déjà calculées par GA4, donc avec les définitions officielles. La contrepartie : vous héritez aussi des limites de l’interface (échantillonnage, plafonds de lignes, cardinalité).
Porte 2 : BigQuery sur l’export GA4
C’est la puissance maximale. Données brutes, au niveau événement, non échantillonnées : vous pouvez reconstruire des parcours, calculer une attribution sur mesure, croiser avec d’autres sources. C’est aussi là que la rigueur compte le plus, car l’agent écrit du SQL libre sur un schéma complexe. Si l’export GA4 vers BigQuery n’est pas encore en place chez vous, c’est le prérequis numéro un : voir le guide d’exploitation de l’export GA4 dans BigQuery.
Mise en place pas à pas
Prérequis
Avant de connecter quoi que ce soit : un export GA4 vers BigQuery actif, un projet Google Cloud avec la facturation activée, et un compte de service (ou une auth utilisateur) avec des droits en lecture seule sur le dataset. Ne donnez jamais à l’agent plus de droits que nécessaire.
Brancher un serveur MCP
Plusieurs options coexistent en 2026. Google Cloud propose une intégration officielle pour BigQuery ; côté écosystème, des acteurs comme Composio, Windsor.ai, Porter, Stape ou Sequel proposent des serveurs MCP orientés analytics. Vérifiez toujours l’état réel et les permissions du connecteur au moment de l’installer, car l’offre bouge vite. Le principe reste identique : vous déclarez le serveur MCP dans la configuration de Claude Code, avec les identifiants d’accès, puis vous redémarrez l’agent.
Premier prompt de vérification
Ne lui demandez pas tout de suite une analyse. Commencez par valider la connexion et la compréhension du schéma :
« Liste les tables de mon dataset GA4 et décris la structure de la table d’événements la plus récente. »
Si l’agent renvoie vos tables events_YYYYMMDD et décrit correctement event_name, event_params ou user_pseudo_id, la chaîne fonctionne. C’est aussi le moment de vérifier qu’il a bien identifié les colonnes imbriquées.
Cas d’usage concrets à fort ROI
Audit express d’une propriété
« Sur les 7 derniers jours, liste les 20 event_name les plus fréquents, et signale ceux qui ressemblent à du doublon ou à un nommage incohérent. » En quelques secondes, vous obtenez une photo de la qualité du tracking. La qualité de ces réponses dépend directement de la propreté de votre collecte ; si vos événements partent déjà faux, l’agent le reflétera fidèlement. C’est tout l’enjeu rappelé dans les 7 erreurs de dataLayer qui faussent vos données GA4.
Exploration ad hoc
« Calcule la croissance MoM du revenu par catégorie de produit sur les 6 derniers mois. » L’agent déballe items, agrège, pivote et commente. Vous validez la logique en quelques secondes au lieu d’écrire la requête.
Générer des requêtes BigQuery complexes
C’est l’un des meilleurs usages : laisser l’agent rédiger un premier jet de requête lourde (jointures multiples, filtres de partition, UNNEST imbriqués), que vous corrigez ensuite. Vous gagnez sur la syntaxe et la plomberie, vous gardez la main sur la logique métier.
Brouillon de modèle d’attribution
Sur données brutes, vous pouvez demander un squelette d’attribution (premier clic, dernier clic non direct, position) à reconstruire depuis les sessions. À traiter comme un brouillon à auditer, jamais comme un résultat publiable tel quel.
Là où l’IA déraille
Voici le cœur de l’article, et ce que les tutos « no-code » passent sous silence. L’agent est bluffant sur la syntaxe, faillible sur le sens.
Les jointures hallucinées sont le risque numéro un. L’agent peut joindre deux tables sur une clé plausible mais fausse, ou inventer une relation qui n’existe pas dans votre modèle. Le SQL tourne, le chiffre s’affiche, et il est faux.
Les définitions de métriques sont l’autre piège. « Session », « utilisateur actif », « conversion » ont des définitions précises dans GA4. Sur l’export brut, l’agent recalcule à sa manière, qui ne correspond pas forcément à celle de l’interface. Deux chiffres « revenu » peuvent diverger sans que ce soit un bug.
Les coûts comptent aussi. Une requête mal cadrée, sans filtre de partition, peut scanner des téraoctets et vous coûter cher. L’agent n’a aucune notion native de votre budget.
Enfin, la confidentialité. L’export GA4 peut contenir des identifiants et des données sensibles. Donner un accès large à un agent IA mérite une vraie réflexion sur le périmètre, les droits et la conformité.
Règle d’or : toujours faire relire le SQL et recouper les chiffres avec une source connue avant de décider quoi que ce soit.
Bonnes pratiques pour fiabiliser
Documentez le contexte que l’agent ne peut pas deviner : un fichier décrivant votre schéma, vos définitions de métriques et vos règles de jointure améliore radicalement la pertinence. Restreignez les accès au strict minimum, en lecture seule, sur les datasets concernés. Imposez systématiquement un filtre de partition pour contrôler les coûts. Relisez le SQL généré avant de l’exécuter sur de gros volumes. Et gardez l’humain dans la boucle pour toute décision : l’agent propose, l’analyst valide.
Pour les livrables récurrents, l’IA brille en préparation et en vérification plus qu’en automatisation aveugle. Elle aide à monter et auditer ce que vous publierez ensuite dans vos rapports, comme expliqué dans automatiser ses rapports avec Looker Studio et BigQuery.
Verdict : par où commencer
Claude Code branché sur GA4 et BigQuery fait gagner des heures sur l’exploration, la génération de requêtes et le debug. Il ne remplace pas l’analyst : il déplace sa valeur vers la gouvernance, la connaissance du schéma GA4 et le contexte business, qui deviennent plus importants, pas moins.
Commencez sans risque : connectez d’abord le MCP de l’API GA4 en lecture seule, posez-lui des questions dont vous connaissez déjà la réponse, et observez où il se trompe. Quand vous aurez calibré votre confiance, ouvrez la porte BigQuery pour les analyses lourdes. À noter au passage : ce blog est lui-même opéré avec ces outils, ce qui aide à mesurer concrètement leurs forces et leurs limites.
Curieux de l’IA sous l’autre angle, celui de l’IA comme source de trafic et non comme outil ? Voir tracker le trafic ChatGPT, Gemini et Claude dans GA4.