Une analyse contextuelle pourrait-elle remplacer le cookie?


Ce n'est pas une actualité, mais elle est nouvelle: Internet est bien trop grand pour que les annonceurs, ou quiconque, le lisent.

Le Web contenait environ six milliards de sites Web indexés au début de 2020, et il ne cesse de croître. Cela n'inclut même pas le dark web, dont le nom effrayant dément à quel point nous comptons sur lui. Le zoom est le web sombre. L'email aussi.

(Bien sûr, nous ne pouvons pas lire l'intégralité d'Internet – nous avons besoin de hacks de productivité pour gérer nos propres boîtes de réception.)

Ainsi, à l'échelle macro, les algorithmes nous ont remplacés en tant que lecteurs. Ils font ce que nous ne pouvons pas, et lisent – enfin, «explorent» – l’ensemble de l’Internet, classent et catégorisent le contenu, signalant les activités potentiellement nuisibles ou illégales. Ces robots-lecteurs incluent des algorithmes de recherche; des algorithmes de modération de contenu qui fonctionnent en tandem avec des modérateurs humains pour surveiller les plateformes sociales et des algorithmes d'analyse contextuelle qui permettent la publicité contextuelle.

Vous n'avez peut-être pas entendu parler de publicité contextuelle, mais ne la sous-estimez pas. C'est un marché de plus de 100 milliards de dollars. Ce pourrait aussi être l'avenir de la publicité ciblée.

Plus sur l'IAL'apprentissage fédéré fusionne l'intelligence artificielle et la confidentialité – et il pourrait transformer les soins de santé

l'anti cookie
Image: ShutterStock

L'anti-cookie?

L'analyse contextuelle résout deux problèmes pour les annonceurs: le problème de longue date de la lecture à grande échelle et le nouveau problème du cookie.

Pendant longtemps, les annonceurs ont proposé aux consommateurs des publicités ciblées basées sur des données anonymisées provenant de cookies tiers. Ces extraits de code, comme le Pixel de Facebook, pourraient suivre le comportement des consommateurs sur le Web, que l'utilisateur soit sur le site de Facebook ou non. Pour les consommateurs, cela garantit que si vous cliquez sur une annonce Facebook pour un canapé-lit, vous verrez des annonces similaires partout en ligne pendant des semaines.

Ce n'était pas controversé; c'était totalement normal.

Cependant, la confidentialité des données est devenue une préoccupation de plus en plus importante des consommateurs, et les cookies tiers sont devenus de plus en plus réglementés et impopulaires. L'Union européenne a adopté le règlement général sur la protection des données, ou RGPD, qui limite l'utilisation des cookies; La Californie a adopté sa propre loi sur la confidentialité à l'échelle de l'État qui fait de même. Le navigateur Firefox de Mozilla bloque actuellement les cookies tiers par défaut; Google, quant à lui, prévoit de supprimer les cookies tiers de Chrome d'ici 2022.

Mais comment le ciblage publicitaire fonctionnera-t-il dans un avenir sans cookies?

L'analyse contextuelle offre une option. Il permet de cibler non pas le comportement des utilisateurs, mais la nature du contenu que l'utilisateur a choisi de visualiser. Et cela implique de lire le Web comme le ferait un annonceur – mais à grande échelle.

"Vous n'allez pas nécessairement sur Google et recherchez toutes les pages classées dans une catégorie sportive. Mais nous pourrions le faire. »

Par exemple, Verity de GumGum recherche le ton et se concentre sur une large catégorisation lors de la recherche par mot clé.

"Vous n'allez pas nécessairement sur Google et recherchez toutes les pages qui sont classées dans une catégorie sportive", a expliqué Ken Weiner, directeur technique de GumGum, "mais nous pourrions le faire."

Verity explore également les sites à la recherche de menaces pour la «sécurité des marques» – un terme dont la définition varie selon la marque. Mais, explique Ken, une compagnie aérienne pourrait ne pas vouloir publier une annonce dans un reportage sur un accident d'avion; Disney, quant à lui, pourrait ne pas vouloir faire de la publicité à proximité de contenu «mûr en termes de contenu sexuel ou de choses sur les drogues».

Souvent, selon Weiner, Verity est la seule entité qui lit une page avant qu'une marque ne place une annonce dessus. Il s'agit d'une couche du flux de travail publicitaire programmatique, qui se déroule à une vitesse de distorsion; l'espace publicitaire est acheté et rempli dans les millisecondes nécessaires au chargement de la page. Les humains ne peuvent tout simplement pas travailler assez rapidement pour participer au processus; c'est purement algorithmique. Verity, par exemple, transmet ses résultats à un serveur publicitaire, qui évalue automatiquement si le rapport de Verity sur une page donnée correspond aux critères de campagne de son annonceur.

"Personne ne regarde les données de la page en temps réel avec des milliers et des milliers d'impressions publicitaires", a déclaré Weiner.

Sauf si vous considérez Verity comme quelqu'un.

comment lit la vérité
Image: ShutterStock

Comment la vérité «Reads»

Bien sûr, Verity ne répond pas à de nombreux critères de personnalité – pas de corps, pas de sentiments – mais c'est certainement une technologie sophistiquée. Autrefois une fonctionnalité de la plus grande plate-forme multimédia de GumGum, elle est désormais déployée comme sa propre fonctionnalité autonome, que les éditeurs et les annonceurs peuvent intégrer dans leurs processus de marketing programmatique via l'API.

Ce qui le distingue des autres outils d'analyse contextuelle, a déclaré Weiner, c'est qu'il combine le traitement du langage naturel avec la vision par ordinateur. En d'autres termes, il explore non seulement le texte, mais visualise également les images et même «regarde» les vidéos en téléchargeant le fichier vidéo et en examinant chaque image.

Si cela semble trop lent pour la fenêtre d’achat de la publicité programmée qui dure des millisecondes, c’est le cas. Lorsqu'un serveur publicitaire se renseigne sur un site Web fraîchement publié, Verity n'a pas encore été analysé, il y a un décalage. Au début, le logiciel répond essentiellement: "Je ne sais pas encore ce que c'est", a déclaré Weiner. Ensuite, il effectue un scan, qui prend entre quelques secondes et quelques minutes.

C'est une chose unique, cependant. Une fois le rapport terminé, Verity peut le remonter ultra-rapidement pour toujours.

Et pour le prix de ce bref décalage, les annonceurs ont une meilleure compréhension de ce que sont réellement les pages Web. Par exemple, Weiner a déclaré que si un texte comportait le mot «tir», cela pourrait soulever des drapeaux rouges pour la sécurité de la marque – mais Verity peut voir qu'il apparaît à côté d'une vidéo d'un match de basket-ball, et comprendre que la page fait probablement référence à l'athlétisme, pas la violence.

C'est tout ce que le Media Ratings Council appelle «évaluation du niveau de contenu». Il permet une compréhension plus approfondie du contenu qu'une évaluation purement au niveau de la propriété – ainsi, l'analyse des légendes et le balisage des mots clés d'arrière-plan sur les images et les vidéos. Ces données saisies manuellement, en particulier en ce qui concerne la vidéo, ne saisissent pas toujours la «nature holistique» du contenu, comme le dit Weiner.

Le processus de lecture multicouche de Verity se rapproche. Tout d'abord, il trouve la viande de l'article sur la page, a déclaré Weiner – ce qui signifie le différencier de toutes les publicités de l'encadré et de l'en-tête. Ensuite, il analyse le texte du corps, les titres, les légendes d'images et similaires avec le traitement du langage naturel; en même temps, il utilise la vision par ordinateur pour analyser les principaux visuels. Enfin, il fusionne son analyse textuelle et visuelle dans un rapport cohérent, qu'il envoie aux serveurs publicitaires.

Ce rapport n'est peut-être pas destiné aux yeux des humains, mais il est assez détaillé. Il place la page dans une catégorie générale, comme le sport, et documente les mots clés les plus importants. Il indique également si le contenu aborde ou non un événement sensible au temps, comme un jour férié ou les Jeux olympiques. Une autre section se concentre sur le ton de la page: positif, négatif ou neutre? (Il s'agit plus de sentiment que de contenu, a déclaré Weiner; si l'écrivain était ravi d'une tragédie, cela se lirait comme «positif».)

Le rapport évalue également la «sécurité de la marque», signalant les menaces possibles avec des algorithmes d'apprentissage automatique. Dernièrement, a déclaré Weiner, GumGum a entraîné les algorithmes de Verity à reconnaître les symboles de haine.

"Une croix gammée se trouve être l'une de celles à laquelle elle est la meilleure", a-t-il déclaré.

avenir de l'analyse contextuelle
Image: ShutterStock

L'avenir de l'analyse contextuelle

Les compétences de lecture et de «vision» de Verity dépendent fortement des données de formation qu'il a ingérées. Plus il s'entraîne, plus sa capacité à reconnaître les matchs de basket-ball, les menaces de marque et tout le reste, s'améliore et se développe.

La formation, cependant, est une activité structurée.

"Vous ne pouvez pas vraiment l'entraîner contre tout Internet", a expliqué Weiner. "Ce serait impossible. Vous devez organiser les données sur Internet, puis les former avec ces données. »

Il existe de nombreux modes d'algorithmes d'apprentissage, mais l'un d'eux est simplement de lui donner des exemples étiquetés des choses que vous voulez qu'il reconnaisse. Si vous entraînez un algorithme sur des exemples étiquetés de pistolets à eau et de vrais pistolets, il apprendra à faire la différence.

Cela s'applique même aux mouvements stylistiques moins concrets, a déclaré Weiner – comme une ironie.

"Habituellement, le défi dans ce genre de choses est que les gens n'ont pas les données de formation avec lesquelles jouer. Où trouvez-vous des milliers de pages étiquetées qui parlent d'ironie? »

Nulle part … encore. Dans l'intervalle, les algorithmes de Verity continueront de s'entraîner sur les menaces de marque plus concrètes et contesteront le blocage du cookie sur le ciblage publicitaire.

Cependant, l'analyse contextuelle n'est pas le seul moyen de remplacer le cookie. Weiner note que d'autres options ont également émergé. L’initiative Google Privacy Sandbox, par exemple, a suscité des discussions sur l’apprentissage fédéré. Il s'agit d'une méthode de ciblage publicitaire par laquelle votre navigateur, plutôt que des cookies, suit votre activité sur le Web. Vos données sont stockées sur votre appareil, plutôt que d'être envoyées à un référentiel central basé sur le cloud, mais le navigateur de votre appareil partage une large vue d'ensemble de votre activité avec les serveurs publicitaires, pour vous assurer que vos annonces sont pertinentes.

"Vous pouvez toujours avoir une stratégie … où vous utilisez l'automatisation pour réduire les choses ou faire surface des problèmes probables, puis les humains entrent pour le jugement final."

L'apprentissage fédéré est un mot à la mode pour l'IA, mais la précision de son utilisation pour le ciblage publicitaire reste floue. L'analyse contextuelle, quant à elle, est déjà là, et elle a un énorme potentiel de croissance. Non seulement de nouveaux ensembles de données de formation peuvent émerger, mais la technologie d'exploration peut devenir plus précise. Weiner était optimiste quant aux algorithmes de «fusion précoce», qui pourraient permettre à GumGum de lire des images et du texte ensemble, plutôt qu'avec des algorithmes séparés qui réconcilieraient plus tard leurs résultats.

En ce qui concerne l'analyse de contenu, cependant, il ne pense pas que l'intelligence humaine sera totalement exclue du processus. Les humains doivent organiser les ensembles de données, et les humains saisissent les distinctions culturelles nuancées et en constante évolution d'une manière que les machines ne peuvent souvent pas.

"Je ne sais pas [AI] remplacera jamais complètement [humans], mais cela peut certainement aider [them]», A déclaré Weiner. "Vous pouvez toujours avoir une stratégie … où vous utilisez l'automatisation pour réduire les choses ou faire surface des problèmes probables, puis les humains entrent pour le jugement final."

En d'autres termes, les algorithmes peuvent «lire» Internet dans toute son étendue et dire aux humains ce qui a besoin d'une lecture traditionnelle, les yeux sur la page.

En savoir plus sur le marketingNouvelle mission du pionnier du référencement Rand Fishkin? Aider les marques à quitter Google.

.



2020-05-21 08:00:00

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *