Design de l’attention : pourquoi et comment faciliter l’UX ?

Le 26 juillet 2024

60 minutes

Les participants

Dans ce 50^ème numéro du Wamcast, on s’intéresse au design de l’attention, cette méthode utilisée pour améliorer l’UX – expérience utilisateur. Qu’est-ce que c’est ? Pourquoi et comment engager l’utilisateur via le design d’une interface ? Nous décryptons ce sujet avec Stéphane Maltor, Lead UX et Directeur Général Adjoint de La Haute Société et David Eichholtzer, fondateur et dirigeant de l’agence WAM.

Comment définir le design de l’attention ? (1’14)

Avant d’arriver à proprement parler à la définition du design de l’attention, il faut d’abord bien comprendre le concept de poupée russe dans lequel le design de l’attention est inséré, en commençant par le design persuasif. Il s’agit d’une méthode de design UX qui vise à orienter les choix de l’utilisateur au travers d’une interface ou d’un produit numérique. Comme son nom l’indique, il s’agit de persuader l’utilisateur de faire quelque chose.

Lorsque la persuasion se focalise sur l’attention de l’utilisateur, on parle de design de l’attention.

On peut ouvrir les dictionnaires pour s’intéresser au sens du mot attention :

nom féminin 1. Capacité de concentrer volontairement son esprit sur un objet déterminé […] ;
2. Sollicitude, gentillesse envers quelqu’un ; marque d’intérêt, d’affection.

De ce fait, l’attention désigne à la fois une capacité psychique et sociale. Psychique : être attentif. Sociale : être attentionné.

Il n’y aurait apparemment pas une seule et unique attention, mais plusieurs types différents ?(3’)

Il y a en effet beaucoup de finesse dans la façon dont on peut catégoriser l’attention. Thomas Davenport et John Beck, des auteurs spécialistes du management, proposent une approche un peu plus poussée que celle du Larousse pour granulariser l’attention. Une approche basée sur 3 paires qui pose 6 critères. À chaque fois, les paires sont opposées.

Une image contenant texte, capture d’écran, ligne, diagramme

Description générée automatiquement

La première paire, c’est celle qui oppose une attention captive à une attention volontaire. Captive, comme c’est le cas lorsque vous allez au cinéma pour voir Le Comte de Monte-Cristo. Vous vous installez dans votre siège pour profiter de cette histoire de vengeance qui se mange froid, et au moment où le film doit débuter, vous voyez la pub Haribo.

À l’inverse, l’attention peut être volontaire quand vous partez en vacances et que vous faites le choix de lire le livre d’Alexandre Dumas père, Le Comte de Monte-Cristo, plutôt que de faire une sieste sur la plage.

La deuxième paire : attractive-répulsive. L’attention peut être attractive, lorsque c’est la perspective d’un gain qui m’amène à m’intéresser à quelque chose. Par exemple, un gain émotionnel avec la viralité d’une vidéo à caractère potentiellement divertissant. Inversement, l’attention peut être répulsive lorsqu’un gros panneau de couleur vive m’annonce un danger de mort.

Enfin, l’attention peut être focalisée, lorsque je suis concentré sur une tâche à laquelle je consacre consciemment mes efforts – comme rédiger un texte complexe – ou périphérique, lorsque je conduis une voiture en parlant avec un passager, tout en écoutant la musique, ce qui ne m’empêche (normalement) pas de réagir si un piéton s’engage sur la chaussée.

Qu’est-ce que l’économie de l’attention ? (5’44)

Pour y répondre, on peut citer Yves Citton, un chercheur et philosophe suisse qui a écrit ou dirigé plusieurs ouvrages, dont L’économie de l’attention, nouvel horizon du capitalisme ? et Pour une écologie de l’attention.

Yves Citton fait mention de deux dates. D’abord, l’origine de l’expression « économie de l’attention », qui remonterait à 1971, avec les oppositions entre des sociétés pauvres en information et, à l’inverse, des sociétés riches en information.

Puis son utilisation réelle, qui débute en 1996. Une date qui n’est pas due au hasard, car 1996, c’est le début des internets et donc de la montée en puissance du digital.

Yves Citton ne s’arrête pas là, il précise son propos. Je cite : « Cette rareté se situe du côté de la réception des biens culturels, et non plus seulement du côté de leur production, alors que l’économie traditionnelle se définit par l’optimisation de la production des biens à partir de ressources limitées. Tout le monde sait que la principale difficulté, aujourd’hui, n’est pas tant de produire un film, un livre ou un site Web, que d’attirer l’attention d’un public submergé de propositions, souvent gratuites, plus attrayantes les unes que les autres. »

« Un public submergé de propositions, souvent gratuites, plus attrayantes les unes que les autres » : c’est-à-dire ? (8’28)

Cela veut dire qu’on invente de nouvelles unités de mesures, comme le zettaoctet qui équivaut à 1 000 milliards de gigaoctets. Ce qui est prévu, c’est qu’en 2025, l’humanité produira tous les ans 181 zettaoctets de données. Là, on parle de volume global. Maintenant, on peut regarder le rythme de production puisqu’on estime que le volume d’informations disponible double tous les deux ans. Enfin, la fraîcheur, la nouveauté des contenus : en juillet 2024, 90% des données accessibles ont été produites au cours des deux dernières années.

On parle ici de volume global, ce qui est bien différent de la pertinence des contenus.

Patrick Le Lay, ancien PDG de TF1 avait dit à l’époque en 2004 : « Ce que nous vendons à Coca-Cola, c’est du temps de cerveau humain disponible ». Une formulation qui avait fait grand bruit à l’époque, et dont on parle toujours aujourd’hui. Que révèle cette phrase, sur les procédés télévisuels ? (10’33)

On va opposer Yves Citton et Patrick Le Lay. On a d’un côté quelqu’un qui a davantage une approche philosophique de l’économie de l’attention. Là où Patrick Le Lay est arrivé avec une approche très business de la façon avec laquelle il pouvait décrire le modèle d’affaires d’un média qu’est celui de TF1.

TF1 est un médium qui génère une audience sur la base de programmes, de contenus. Cette audience est ensuite vendue à des marques qui diffusent de la publicité sur l’antenne de TF1. Simple, efficace, basique.

Il faut se remettre en contexte de 2004 : c’est Docteur House, Lost : Les Disparus ou encore Desperate Housewives.

Il y a aussi un contexte de consommation des contenus sur TF1. Il y a 20 ans, on ne consommait pas les contenus de la même façon que nous les consommons aujourd’hui. En 2004, la spécificité technologique du médium TF1, c’est sa linéarité, c’est-à-dire que le programme est disponible à un instant T. Pas avant, pas après, à un instant T. En 2004, Netflix n’est qu’un loueur de DVD à distance. On en parlera plus tard. Le monde n’est pas celui que nous connaissons aujourd’hui, où la consommation de contenus se fait massivement à la demande.

Pour Patrick Le Lay, en soi, une audience qui regarde un contenu de divertissement sur le médium TF1 n’a aucune valeur. Ce qui a de la valeur pour Patrick Le Lay, c’est un public, une audience qui regarde la publicité.

Quel est le secret, justement, pour garder l’attention de l’utilisateur au moment où je lance une page de publicité ? (13’05)

L’un des secrets, c’est ce que l’on appelle le cliffhanger. Il s’agit d’une technique narrative qui consiste à introduire une rupture dans le récit au moment où est créée une tension qui appelle une résolution pressante.

Technique narrative, certes. Mais aussi technique de captation de l’attention intégrée dans les règles d’écriture et de réalisation des séries pour donner envie à l’utilisateur de rester devant son écran pendant la page publicitaire. Pourquoi ? Pour ne pas rater la résolution de la situation de tension précédente.

Je vous donne quelques exemples de cliffhangers célèbres, pour vous, fans de séries :

Desperate Housewives, pilote de la saison 1 – Le premier épisode se termine par la découverte de la note de suicide de Mary Alice Young, qui indique qu’elle a été poussée à l’acte par un terrible secret – Mais quel est-il ?
Friends, Saison 5, Double épisode 23/24 – Après avoir beaucoup bu, Ross et Rachel se réveillent pour découvrir qu’ils se sont mariés à Las Vegas – Quelles seront les conséquences de cette impulsion ?

En 2017, on va encore plus loin avec la déclaration du patron de Netflix qui dit « Nous sommes en compétition avec le sommeil ». On s’attaque là aux besoins physiologiques des utilisateurs finalement… (15’)

J’adore parler de Netflix parce que c’est la caricature du dilemme de l’entrepreneur. À la base, Netflix est une entreprise qui envoie des DVD par la poste sur le continent américain. Donc c’est une entreprise logistique, avec une chaîne de valeur de logisticien. Et puis la taille des tuyaux fibre augmente, ils sont capables de transporter de plus en plus de données. Cela les amène à se poser la question du changement intégral de modèle d’affaires : passer d’une entreprise logistique, qui distribue des contenus par courrier, à une entreprise technologique, qui distribue des contenus par le streaming. Et ils l’ont fait.

👉 Retrouvez toutes les précisions de Stéphane Maltor et David Eichholtzer à partir de la 16^ème minute de ce Wamcast.

Pourquoi déclare-t-il la guerre au sommeil ?(19’38)

Pour comprendre cette déclaration de guerre, je vous propose de nous mettre quelques instants dans la peau d’un stratégiste produit de la compagnie Netflix. Forcément, en tant que stratégiste, on va commencer par une étude des tendances pour capter la taille potentielle du marché. Quel est le terrain de jeu dans lequel mon produit évolue ?

Force est de constater que la tendance est plutôt bonne. Netflix est un produit qui se consomme dans des moments qui sont compatibles avec le divertissement. Il s’agit principalement des moments où l’on ne travaille pas.

Or, depuis plusieurs siècles, le temps disponible – le temps non travaillé – a augmenté. Sur les soixante-dix dernières années, en France, on travaille 850 heures de moins par an. On est passé de 2 351 heures travaillées à 1 505. Annuellement. Mécaniquement, le temps non travaillé – donc le temps « disponible » pour notre entreprise qu’est Netflix – ce temps a augmenté de 850 heures par an. C’est donc une ressource supplémentaire qui se crée. En l’occurrence, il s’agit d’une ressource de l’attention. En faisant le lien avec ce que nous disait Yves Citton tout à l’heure, c’est un moment où on va pouvoir positionner le produit sur le marché du divertissement.

👉 Retrouvez les explications plus précises de Stéphane Maltor à partir de la 21^ème minute de ce Wamcast.

🎧 À écouter aussi : Quelles sont les synergies entre SEO et UX ?

Comment a évolué le temps de concentration dans ce contexte d’infobésité ? (26’35)

Il est vrai que l’on peut se demander si l’on a gardé ou non la même attention ou la même capacité de concentration. En 2000, la durée d’attention moyenne d’une personne, dans un contexte de travail, était de 12 secondes. Cela fait un peu peur. Elle n’est plus que de 8 secondes aujourd’hui, d’après une étude de Microsoft : un temps de concentration qui est, nous dit-on, inférieur à celui d’un poisson rouge. Et ce, alors même que nous sommes quotidiennement exposés à 1 200 messages publicitaires par jour et cela, c’est Think With Google qui nous l’apprend, contre 300 dans les années 1980.

Puisque l’on parlait de guerre contre le sommeil, quels sont les chiffres sur l’évolution de notre temps de sommeil ? (27’44)

Le temps de sommeil moyen des Français passe en dessous de 7 heures par nuit, selon Le Monde. Les nuits ont perdu en moyenne entre 1h et 1h30 en 50 ans, d’après un baromètre de Santé Publique France. En cause en partie : l’omniprésence des écrans, justement.

De ce fait, quelles sont les solutions aujourd’hui pour garder l’attention de l’utilisateur ? (28’16)

On peut utiliser des dispositifs de captation de l’attention qui vont permettre une extension de la ressource attention, notamment des dispositifs de facilitation de la consommation des contenus.

La compression

Le premier dispositif est de travailler techniquement sur la logique de compression. Le vice-président de l’innovation de Netflix disait : « Nous sommes allergiques au buffering, personne ne souhaite être interrompu au milieu de Bojack Horseman ou de Stranger Things ». Un travail de compression des vidéos de Netflix permet d’alléger le poids des contenus, et donc la bande passante internet nécessaire. Cela permet de ne pas interrompre un utilisateur dans son expérience de consommation. Une rupture dans la consommation de contenus, c’est un temps mort qui peut détourner l’utilisateur de son intention de consommer ce contenu, c’est une possibilité de switcher sur une autre activité. Et cela, quand on est Netflix, on ne veut pas. On souhaite que l’utilisateur aille au bout de son contenu et qu’il continue de payer l’abonnement Netflix correspondant.

L’autre point positif associé à la compression, c’est que ça permet aussi de s’adresser à des marchés plus importants. Autrement dit, il est possible de rendre accessible notre produit sur des marchés géographiques où la fibre n’est pas forcément déployée.

L’autoplay

L’autoplay est par défaut activé. Il s’agit d’une fonctionnalité qui fait que les épisodes s’enchaînent les uns après les autres, et ce, sans action de l’utilisateur. Finalement, à 22h55, quand on arrive à la fin du 3^e épisode de Dark et que, juste avant le générique de fin, ce petit CTA « prochain épisode » apparaît, qu’il se remplit pour montrer que le prochain épisode est déjà là, et prêt… Et qu’on est trop fatigué pour se lever et prendre la télécommande pour stopper, que se passe-t-il ? On regarde le 4^e épisode de Dark, et on dort une heure de moins.

La recommandation

Le dispositif de recommandation est un moteur de recommandations permettant à l’interface de suggérer de manière extrêmement fine des nouveaux contenus. Il s’agit de l’outil le plus puissant peut-être : sur les deux dernières années, 80% du contenu consommé sur Netflix l’a été à la suite d’une recommandation du moteur de personnalisation.

👉 Découvrez les précisions de Stéphane Maltor sur la personnalisation de l’interface Netflix comme moyen de capter notre attention, dès la 33^ème minute de ce Wamcast.

Est-ce que pour autant, avec tous ces outils, Netflix réduit vraiment notre temps de sommeil ? (41’)

Regardons les chiffres. En 2024, un Français dort en moyenne 6h42. C’est 1h30 de moins qu’il y a 50 ans. 40 minutes, c’est la durée moyenne d’endormissement d’un Français. Et 80% des Français se réveillent régulièrement dans la nuit. On dort donc moins, et on dort moins bien. Dire que Netflix est le seul responsable de cette baisse quantitative et qualitative, ce serait assez caricatural, un sacré raccourci. Mais cela doit nous amener à nous poser des questions.

🎧 À écouter aussi : Comment répondre aux enjeux de visibilité sur les réseaux sociaux ?

Le sommeil fait effectivement partie de nos besoins physiologiques mais ce n’est pas le seul, on peut aussi évoquer le besoin de séduction… (43’02)

C’est vrai, on peut revenir à la pyramide de Maslow. Au premier étage de la pyramide, dans les besoins physiologiques, il y a le besoin de rencontre amoureuse. Si l’attention est un marché, c’est pareil pour la séduction. On avait les petites annonces dans les journaux, on avait les agences matrimoniales… Aujourd’hui on a un autre acteur de la tech qui s’est implanté sur le marché de l’amour, le marché la rencontre : Tinder.

J’aime bien le design de l’application Tinder, parce que la relation avec la boîte de Skinner est assez simple. Quand je lance l’app Tinder, je découvre, un par un, des profils d’utilisateurs, de manière aléatoire, et donc, avec une récompense aléatoire. Je swipe pour découvrir la suite de la pile de profil, de manière aléatoire.

Dans l’expérience de la boîte de Skinner, un rat est placé dans une boîte transparente. Ce rat doit appuyer sur un levier pour obtenir de la nourriture. Au début, l’animal met un certain temps à comprendre que son action déclenche la récompense, mais une fois l’apprentissage acquis, le rat actionne le levier de manière raisonnable, c’est-à-dire quand il a faim.

Dans la suite de l’expérience, la distribution de friandises devient aléatoire. Quand le rongeur appuie, parfois il reçoit une dose normale, et de temps en temps, la ration est surabondante, et très souvent, rien ne sort du tuyau. Le rat ne pouvant jamais prévoir ce qu’il obtiendra se met à appuyer avec frénésie sur le levier, de manière quasi automatique et de plus en plus violente. Même rassasié, il continue d’appuyer. La nourriture devient secondaire, sans rapport avec son comportement.

Skinner a donc mis à jour le biais comportemental lié à la récompense aléatoire. Comme pour le bandit manchot, comme pour Tinder, c’est l’incertitude qui produit la compulsion.

On a donc déjà, dans le design même de Tinder, un principe de captation de l’attention ?(46,04)

Oui, puis le geste à proprement parler de swipe ramène cette notion d’attention. On peut aussi regarder les formules d’abonnement de Tinder. Par exemple, dans la formule Tinder +, on a la feature Rewind. L’option Rewind permet d’annuler la dernière action sur un profil, un like ou non. Si l’utilisateur a swipé gauche par erreur, il peut corriger son inattention et annuler pour swiper droit. L’économie de l’attention jusqu’au bout, donc, y compris sur des erreurs qui peuvent être créées par le produit lui-même. L’interaction swipe est facile, rapide, si bien qu’elle peut amener des erreurs. Et l’utilisateur paye pour pouvoir revenir sur ces erreurs.

Les Likes VIP sont une fonctionnalité réservée aux membres Tinder Platinum, qui fait en sorte que les Likes et Superlikes soient vus plus rapidement par la personne à qui l’utilisateur les envoie, en passant avant les likes des non-membres, c’est-à-dire de ceux qui n’ont pas payé pour. Il s’agit d’un coupe-file de la séduction, comme le fait Disney.

Tinder, finalement, c’est du SEA – Seduction Engine Advertising.

Si l’on s’intéresse au processus cognitif lors de la Search Experience cette fois, on peut citer l’étude Messy Middle de Google parue il y a quelques années. En quoi consiste-t-elle ?(49’25)

Le Messy Middle est cette boucle quasi infinie, dans laquelle on se trouve lors de nos pérégrinations dans Google, lorsque l’on est à la recherche d’une offre sur une paire de Jordan, par exemple. L’offre en la matière est surabondante, la SERP de Google est un véritable sapin de Noël, il y a des annonces payantes, des vidéos, des illustrations, des grilles de produits, des liens bleus classiques. À partir de là, l’utilisateur va passer son temps entre l’exploration de l’abondance des offres, à travers les différents formats de contenus que j’ai mentionnés à l’instant et leur évaluation. Et cette boucle – exploration des offres, évaluation des offres – va durer tant que mon attention ne sera pas accrochée par l’un des biais cognitifs suivants, ce que l’on appelle des déclencheurs, pour me faire passer à l’action, c’est-à-dire acheter ma paire de Jordan.

Quels sont ces éléments déclencheurs qui font passer l’utilisateur à l’action ?(50’50)

Le biais de rareté par exemple : si la paire de Jordan est de telle couleur ;
La preuve sociale : il y a tant d’avis positifs sur le shop qui la vend ;
Le pouvoir de l’instant : cette paire de Jordan est à ce prix pour 24h, pas plus ;
L’heuristique catégorielle : la description m’indique des éléments-clés pour me décider, par exemple : cette édition limitée est un hommage à la période universitaire de Michael Jordan à l’université de Caroline du Nord ;
Le biais d’autorité : ce shop est connu ou pas connu ;
Le pouvoir de gratuité : frais de livraison offerts, etc.

Tous ces éléments concourent à retenir mon attention et me faire passer à l’action.

👉 Retrouvez les conseils de nos experts pour retenir l’attention de l’utilisateur sur une page de destination en provenance de Google, à partir de la 51^ème minute de ce Wamcast.

D’un point de vue éthique du design de l’attention, où est la frontière entre la facilitation et la manipulation ?(55’50)

Lors d’une conférence des designers éthiques, j’ai découvert un code qui date de 1999 que je ne connaissais pas : « Les créateurs de technologie persuasive ne devraient jamais chercher à persuader des personnes de quelque chose qu’elles ne consentiraient pas à faire elles-même d’être persuadées de faire ».

👉 Découvrez les explications de David Eichholtzer sur les agents IA type ChatGPT/Gemini, à partir de la 56^ème minute de ce Wamcast.

Nos derniers Wamcasts

Voir tous les podcasts

V Voir tous les articles podcasts