Server Side : comprendre et organiser sa collecte de données

Le 22 mars 2024

43 minutes

Partager sur :

Dans ce 46e numéro du Wamcast, nous abordons le thème de la collecte de données. Et, plus précisément, de la meilleure manière de pérenniser cette collecte via la technologie Server Side.

Pour échanger sur ce sujet, Martin Champetier, manager du pôle Wam Data, et David Eichholtzer, fondateur et dirigeant de l’Agence WAM.

Collecte de données : où en est-on ? (1’10)

La collecte de données a pris un virage il y a 5 ans avec l’introduction du Règlement général sur la protection des données (RGPD). Le but est simple : protéger la vie privée des internautes européens en encadrant la collecte de leurs données de navigation. Et, par la même occasion, lutter contre les grandes sociétés américaines qui, sujettes aux lois de leurs pays, doivent fournir l’ensemble des données à leur disposition si l’exécutif le leur demande.

Avant ça, c’était le « Far West » : on déposait des pixels sur nos sites sans savoir ce qu’ils collectaient. Il y a d’ailleurs eu quelques scandales autour des données collectées et leurs confidentialités, comme Cambridge Analytica.

Les grandes dates à retenir

Une décision lourde de conséquences pour les annonceurs :

  • En 2018 : on leur demande d’informer les utilisateurs des technologies présentes sur le site.
  • En 2020 : il faut désormais avoir le consentement de l’utilisateur avant de pouvoir collecter.
  • En 2022 : l’outil Google Analytics – gratuit et qui représente plus de 80 % d’équipement chez les annonceurs – est attaqué par les différentes CNIL (Commission nationale de l’informatique et des libertés) européennes. Elles considèrent l’outil comme non conforme au RGPD, créant un stress chez tous les annonceurs de devoir se débarrasser de leur outil et payer une licence chez d’autres comme Piano Analytics ou Matomo.
  • En 2023 : Google Analytics entame une migration obligatoire vers Google Analytics 4 (GA4) pour répondre aux besoins RGPD mais également faire évoluer sa plateforme. 

Le cas des Adblockers

Et ce n’est pas tout. Avec les discours de protection de la vie privée en ligne, les internautes se sont naturellement tournés vers les Adblockers pour éviter d’être systématiquement exposés aux publicités ciblées.

Cela a également contribué à une perte de données pour les annonceurs : certains Adblockers empêchent l’envoi de données vers une plateforme analytics, par exemple.

La suppression des cookies (3’22)

Dans ce contexte, les navigateurs eux-mêmes ne souhaitaient plus être affiliés à cette notion de tracking. Pour tous les navigateurs concurrents à Chrome, la suppression des cookies tiers est déjà actée. C’est par exemple le cas de Safari en 2020, Mozilla en 2021 ou encore Brave, qui a été fondé et réfléchi dans ce sens.

Il est important de bien faire la distinction entre :

  • Cookies propriétaires (first-party cookie) déposés par l’annonceur du site lui-même.
  • Cookies tiers (third-party cookie), ceux qui posent problème, déposés par des tiers externes sur le site annonceur. L’exemple le plus connu reste le cas de Facebook. 

La fin des cookies sur Chrome en 2024 

Si Google Chrome a mis du temps à s’y mettre, la suppression des cookies tiers semble actée pour fin 2024.

Google était désireux de respecter la vie privée des utilisateurs tout en maintenant la publicité en ligne qui permet la gratuité d’une partie de l’information. Avec 63 % d’équipements mondiaux, la sortie des cookies tiers a dû être réfléchie et préparée.

Cela a été réalisé à travers le projet participatif Privacy Sandbox, qui a permis une collaboration entre les équipes de Google, les développeurs et les plus grosses régies de pub pour vérifier que tout le monde s’y retrouve.

Une évolution également dictée par la pression des autres navigateurs. Mais Google étant le leader, il fallait trouver une solution pérenne pour l’écosystème de la pub.

Moins de données à disposition

Pour résumer, on part d’une situation où un site possédait 100 % des données utilisateurs.

Si tous les réglages de bannière cookies sont optimisés, on constate une perte de 25 % du trafic. À laquelle il faut retrancher 25 % liés aux Adblockers ainsi que 30 % supplémentaires de navigation des autres navigateurs. Et bientôt, ceux de Google.

Cela ne fait plus beaucoup de données à la fin. Il fallait donc trouver une solution qui allie collecte de données et respect de la vie privée des utilisateurs.

Comment la technologie Server Side peut répondre à ces pertes ? (8’10)

Le Server Side permet de résoudre de nombreux soucis liés à la collecte de données. Mais attention, il ne sert pas à contourner le RGPD. Le consentement de vos utilisateurs reste et restera toujours un prérequis à la collecte. 

Pour bien comprendre le Server Side, il faut regarder la manière dont on collecte actuellement. La grande majorité des annonceurs avec lesquels nous travaillons organisent leur collecte via un Tag Management System (TMS). Le plus connu de ces outils restant Google Tag Manager (GTM).

Comment fonctionne Google Tag Manager ?

Pour vulgariser, GTM permet d’insérer un morceau de code sur le site – le container – et gérer l’envoi de données vers d’autres technologies directement depuis la plateforme, via des balises (tags). Plusieurs avantages à cela :

  • moins d’aller-retour avec l’IT ;
  • moins de temps de chargement de page ;
  • la centralisation de l’ensemble des technologies utilisées dans un même outil ;
  • la récolte du consentement et la gestion des envois directement sur la plateforme.

Généralement, les marques utilisent GTM pour :

  • déclencher la Plateforme de gestion des consentements (CMP) ;
  • collecter des données pour leur plateforme analytics : majoritairement Google Analytics 4 et Piano Analytics ;
  • collecter des données pour leurs outils d’acquisition : Google Ads, Facebook, Pinterest, etc ;
  • pour leurs plateformes d’affiliation : Criteo , Kwanko, etc. ;
  • pour d’autres technologies comme un chat, de l’AB testing, etc.

C’est donc devenu central dans la vie d’un site web. On appelle ça la gestion Client Side.

Quels sont les problèmes rencontrés ?

Dans ce cas de figure, la marque n’est plus souveraine de ses données. Les technologies associées au site déposent des cookies tiers et ce sont eux qui choisissent ce qu’ils collectent.

C’est par exemple le cas de Pixel Facebook. Lorsqu’un tag se déclenche depuis GTM, un cookie est déposé sur le navigateur de l’internaute et cette donnée sera accessible par Facebook. Cela pose déjà un premier problème de maîtrise des envois de données

Deuxième problème, comme évoqué précédemment : les navigateurs et les Adblockers ne veulent plus de ces échanges de données entre sites. Dans l’installation GTM Client Side décrite ci-dessus, si Safari ou des Adblockers décident qu’il n’est plus possible d’envoyer de données à Facebook, alors elles ne seront pas envoyées. Vous devenez donc dépendant d’autres technologies pour vos propres données et vous ne faites plus la loi chez vous.

Comment reprendre le contrôle ?

Bizarrement, en ajoutant une étape. Au lieu d’envoyer la donnée directement à vos technologies depuis le navigateur de l’internaute, vous envoyez la donnée à l’extérieur vers la plateforme Server Side. Ensuite, depuis cette plateforme, vous renvoyez la donnée vers ces technologies via API.

Trois avantages à cela :

  • regagner toutes les données bloquées par les Adblockers et les navigateurs : vous restez donc indépendant et non plus sujet aux décisions extérieures ;
  • contrôler et voir ce que vous envoyez ;
  • n’avoir plus qu’un envoi vers l’extérieur du navigateur, donc améliorer la vitesse de chargement du site.

Server Side au service des données perdues et dans la légalité du RGPD

Restons dans le cadre de l’utilisation de Google Tag Manager car il représente plus de 90 % de l’équipement dans le monde. Dans GTM, c’est assez simple : il suffit de recréer un container Server Side. C’est simple et gratuit. Ce nouvel environnement permettra de renvoyer, via API (interface de programmation d’application), les données collectées vers les technologies qu’utilise votre site. 

La partie la plus compliquée reste de monter le serveur. Trois possibilités s’offrent à vous :

  • Votre équipe IT crée l’infrastructure nécessaire : il faudra monter le serveur, le maintenir et suivre les nouvelles réglementations pour être à jour. C’est la solution « bas coût » sur le papier mais attention au temps passé sur le projet.
  • Vous utilisez Google Cloud : moyennant un forfait en fonction du nombres de hit envoyés (des envois de données), vous obtenez une mensualité à verser pour maintenir votre écosystème.
  • Vous utilisez Addingwell, notre partenaire de confiance sur le sujet : grâce une redevance mensuelle en fonction du nombre de hit avec une plateforme claire et précise, un service technique à l’écoute, une veille efficace et hébergée en Europe. 

Qu’importe votre choix, vous avez l’infrastructure, il ne vous manque plus que la donnée.

👉 Retrouvez le point complet de Martin Champetier sur Google Tag Manager à partir de la 8e minute de ce Wamcast.

Comment envoyer la donnée collectée sur mon site dans mon serveur ? (18’22)

Tout transite par Google Analytics 4. Mais attention à ne pas confondre deux notions. GA4 est à la fois la plateforme analytics où vous consultez vos données de trafic, mais aussi un véhicule qui transporte toutes les données de votre site vers votre serveur : c’est ce que l’on appelle Client GA4.

Pour vulgariser, le Client GA4 est un train dans lequel vous rangez toutes vos données dans les bons wagons et que vous envoyez dans votre Server Side. Ce format générique développé par Google permet de retrouver une multitude de données de la navigation en cours : navigateurs, action, langue, région, etc.

Ces données, une fois arrivées dans votre serveur, peuvent être exploitées par d’autres technologies via les fameuses API. Au vu du taux d’équipement de GA4 dans le monde, toutes les API des plus grosses technologies s’adaptent au format proposé par Google. 

Pour résumer, les API piochent les données dont elles ont besoin dans le format générique du Client GA4. Pour une collecte Server Side optimisée, il faut donc dresser la liste des données dont vos API ont besoin, les lister dans un plan de taggage personnalisé et les envoyer au bon format, au bon moment, pour qu’elles soient correctement exploitées.

👉 Retrouvez l’analyse et les explications de Martin Champetier et David Eichholtzer sur GA4 à partir de la 18e minute de ce podcast.

Comment réussir sa migration vers le Server Side ? (31’52)

Google a annoncé la suppression des cookies tiers pour le 4ème trimestre 2024. Nous allons commencer à observer des changements courant septembre 2024. De plus, le changement des autres navigateurs est déjà en place et impacte votre collecte. Il est donc conseillé de se mettre en conformité le plus tôt possible, et de commencer dès maintenant, en prévision de la rentrée 2024.

Pour bien mener une migration vers le Server Side, voici quelques conseils :

  • choisir votre manière de l’implémenter : développement en interne ou choix d’une solution ;
  • lister l’ensemble des APIs que vous allez utiliser et lister l’ensemble de leurs besoins en données ;
  • lister l’ensemble des données que vous souhaitez consulter dans votre plateforme analytics pour mesurer et améliorer la performance de votre site ;
  • synthétiser l’ensemble de ce besoin dans un plan de taggage personnalisé ;
  • déployer votre plan de taggage et l’envoi du Client GA4 vers votre Server ;
  • brancher vos APIs à votre Server ;
  • contrôler la bonne remontée des données ;
  • étudier l’impact sur vos performances.

👉 Retrouvez l’analyse complète de Martin Champetier sur la migration Server Side ainsi que des exemples concrets à partir de la 31e minute de ce Wamcast.

Nos derniers Wamcasts

Voir tous les podcasts