Engagement de l’audience : quand les médias se penchent sérieusement sur l’IA
Les faits sont là : plus d’un quart des 70 plus grands projets financés par Google DNI Fund, le fond de Google pour promouvoir l'innovation de la presse en Europe, traitent d’engagement. L’enjeu est double : dans la guerre actuelle que se livrent les médias pour capter l’attention d’utilisateurs sur-sollicités, l’engagement devient clé. Tant dans la stratégie de fidélisation des audiences que dans l’hybridation des stratégies de monétisation pour sortir du modèle tout publicitaire. Lorsque l’on sait qu’un client est 5 à 10 fois plus cher à acquérir qu’à conserver (1), l’importance stratégique de la fidélisation ne laisse plus de doute.
Mais les médias possèdent une arme encore trop peu utilisée pour faire grandir l’engagement : l'Intelligence Artificielle.
Avant d’augmenter l’engagement : apprendre à le mesurer…
Pour améliorer l’engagement, la première étape consiste à définir et mettre en place des indicateurs de mesure. Parmi les métriques qui le traduise, on peut citer classiquement : la fréquence (nombre de connexions pour consommer du contenu), la récence (jours depuis la dernière consommation), le volume (nombre de pages visitées, minutes de vidéo vues…), ou encore le nombre d’interactions avec le média (partages, commentaires sur les réseaux sociaux…). Face à cette multiplicité de données, définir une North Star Metric qui combine plusieurs de ces indicateurs permettra d’optimiser la mesure de l’engagement.
Ainsi, le Financial Times a défini sa North Star Metric par un modèle Récence - Fréquence - Volume (RFV) qui calcule un score par utilisateur sur la base de son activité des 90 derniers jours (2). Cette métrique a, entre autres, permis de confirmer que les utilisateurs ayant téléchargé l’application myFT sont en moyenne 86% plus engagés que les utilisateurs classiques, validant la pertinence de l’application et l’importance de l’indice d’engagement.
Grâce au machine learning, qui permet de traiter des sets de données contenant des centaines de variables, la modélisation de l’engagement peut se complexifier pour prendre en compte à la fois des données sociodémographiques et des données comportementales. Les modèles de churn (taux d’attrition) ou de « durée de vie », étudient de nombreuses variables issues du comportement de l’audience afin de mesurer le risque qu’un utilisateur quitte le média dans les trois prochains mois, ou pour estimer combien de valeur un utilisateur pourrait générer sur la prochaine année.
C’est le sens du projet High Fidelity du Groupe Les Échos-Le Parisien, qui vise à optimiser le modèle de prédiction du churn, en multipliant les sources de données analysées. Il permet de calculer la probabilité qu’un utilisateur quitte bientôt le média (1) et donc d’entamer des actions adaptées pour retenir les profils les plus à risque.
Enfin, les indicateurs doivent être adaptés au business model du média. Il ne faut pas hésiter à créer ses propres KPI, alignés à l’objectif qu’on s’est fixé. Le Neue Zurcher Zeitung, site de contenu au modèle exclusivement basé sur l’abonnement, a combiné plus de 100 variables dans un algorithme d’apprentissage supervisé pour prédire le point chaud du lecteur. Autrement dit, anticiper le moment où il aura le plus de chances de s’abonner (3) et lui proposer une page de paiement personnalisée à ce moment précis. Ce modèle a permis au journal de multiplier son taux de conversion par cinq.
… puis le maximiser à l'aide de l'IA, à chaque étape de la vie du contenu
Pour favoriser l’engagement, l'intelligence artificielle permet d'intervenir à chaque étape de la chaîne de valeur d'un contenu média.
Création de contenu : les analyses de données historiques sur de gros volumes fournissent des insights qui peuvent aider les rédactions à produire du contenu engageant. Le Times a ainsi développé INCA, une plateforme qui interprète les données issues des articles. INCA permet d’extraire en temps réel de l’information précise des articles, via une extension Chrome, simple et intuitive pour tous les journalistes. Ces données granulaires consolident un indice (le DTI) estimant la performance d’un article par rapport à ses caractéristiques (longueur, style, format…). Les journalistes peuvent alors identifier des tendances et des signaux faibles pour rendre leur contenu futur de plus en plus engageant (4).
Distribution du contenu : la personnalisation dans la distribution des contenus est devenue indispensable pour tous les médias, et a permis l’émergence des nouvelles plateformes comme Netflix ou Spotify, mais aussi le succès de la digitalisation de médias traditionnels comme le New York Times et le Washington Post. Récemment, les techniques avancées d’IA ont permis d'aller encore plus loin, en enrichissant automatiquement les contenus avec des métadonnées, afin d’optimiser la distribution en fonction des envies des utilisateurs.
C’est ce qu’a mis en œuvre la radio néerlandaise BNR en combinant des technologies Speech-To-Text, qui retranscrivent l’audio en format texte, et des technologies de traitement du langage naturel (NLP), pour trouver automatiquement les thèmes de chaque émission à partir du texte transcrit. La conjugaison de ces deux technologies permet à la radio de découper ses émissions par thèmes (9). L'auditeur peut alors paramétrer ses sujets de prédilection, et se créer une émission sur mesure.
Interactions : l’une des meilleures façons de générer de l'engagement passe par l'interaction. Selon le Financial Times, les lecteurs qui commentent sont 7 fois plus engagés (10). Cependant, l'interaction doit être encadrée, et implique un travail de modération important. Ici encore, l’IA peut faciliter le travail à l'aide de techniques d'analyse sémantique, qui détectent automatiquement la toxicité de certains commentaires.
Google a développé l’outil Perspective, un modèle de deep learning basé sur les plongements lexicaux pour identifier les chaînes linguistiques nocives. Disponible via une API (utilisée entre autres par The Economist et El Pais), Perspective priorise les commentaires selon leur niveau de toxicité, et identifie les commentaires nécessitant l’action d’un modérateur.
Si les opportunités sont réelles, l’IA reste encore embryonnaire dans la plupart des groupes médias traditionnels. Certainement parce que les challenges qu’elle suppose sont connus : ils sont techniques (qualité et quantité des données, infrastructures adaptées…), organisationnels (besoin de compétences scientifiques de haut niveau) et nécessitent une phase préparatoire de validation des opportunités (capacité de mesure, ROI, etc.). Mais cet investissement apparaît aujourd’hui incontournable pour survivre aux mutations du secteur et répondre aux attentes croissantes d’un public difficile à engager dans la durée.
(Les tribunes publiées sont sous la responsabilité de leurs auteurs et n'engagent pas CB News)