Plus de 50 M€ en cash pour 100% du capital. C’est le prix qu’a payé le groupe IPSOS pour racheter la société française « d’écoute et d’analyse des médias sociaux » Synthesio. La valorisation peut sembler exorbitante : d’après les comptes déposés au greffe, la société a réalisé 4,3 M€ de chiffre d’affaires en 2016 (-2,3% vs 2015) pour un résultat négatif, la même année, de -3,5 M€. Mais à l’ouverture des cotations après l’annonce de l’opération, l’action IPSOS était en hausse de plus de 2%. Comme une illustration de la mutation nécessaire des métiers d’analyse des usages et des opinions – l’activité historique d’IPSOS – qu’elle vient illustrer et à laquelle elle s’attache à apporter une réponse.
Mauvaise nouvelle donc pour les sondages d’opinion. Dans le domaine politique, on en a depuis longtemps relevé les limites : taille des échantillons, composition en fonction de comportements passés (électoraux notamment) qui masque les dynamiques de montée en puissance des forces nouvelles, biais déclaratif qui conduit à sous-évaluer systématiquement les partis « hors système », donc politiquement moins « corrects »… Jusqu’à produire l’arrivée non anticipée de Jean-Marie le Pen au 2ème tour de l’élection présidentielle de 2002, et sans avoir connu depuis d’évolution significative. Les analyses proposées lors de la Présidentielle 2017 – par Benjamin Grange et Véronique Reille Soult notamment – à partir de l’analyse des dynamiques observées sur les réseaux sociaux, avaient l’avantage de s’appliquer aux comportement « réels » (i.e. non biaisés) de l’ensemble des Internautes, c’est-à-dire la presque totalité des Français (vs un échantillon) et en intégrant des éléments de fonds (sujets qui entrainent l’adhésion ou font polémique…) pour éclairer le commentaire.
Le champ économique et culturel n’échappe pas à ce biais du « bien paraître » : fin 2017, un sondage réalisé par BVA affirmait que 58% des Français « préfèrent regarder la télévision pour y voir des documentaires »… Alors même que les 100 meilleures audiences de l’année se partagent entre cinéma, fiction, divertissements et programmes politiques liés à la présidentielle (le débat du 2ème tour en particulier)… mais pas de « doc ». Et, là aussi, une première observation des centres d’intérêt réels, tels que perceptibles à travers les usages des réseaux numériques, aurait suffi à corriger l’interprétation : quand la page Facebook de The Voice totalise plus de 2 millions d’abonnés, celle de Rendez vous en terre inconnue – pourtant pas le programme de découverte le plus exigeant – n’en atteint pas 230 000.
Les sujets d’innovation ajoutent une difficulté supplémentaire : celle, pour le consommateur, de se projeter vers des offres ou fonctionnalités qu’il n’a pas en main, et dans des contextes d’utilisation qu’il ne maîtrise pas davantage. Quadrature du cercle, concèdent la plupart des spécialistes du marketing B2C.
La stratégie suivie par Synthesio et par nombre de ses concurrents Français (Linkfluence…) ou internationaux (Digimind…) consiste à retourner la table : travailler à partir de ce que dit le grand nombre sur les réseaux sociaux plutôt que des réponses d’un échantillon limité. Mais le mouvement ne va pas jusqu’à son terme ni au bout de sa logique : parce que les réseaux sociaux ne constituent pas tous un reflet fidèle de la population, loin s’en faut (cf. par exemple la difficulté de Twitter à étendre son empreinte et à se débarrasser des comptes fake ou celle de Snap à fidéliser ses utilisateurs), d’une part ; parce qu’il s’agit là encore de propos publics plutôt que de comportements, donc là-aussi soumis à la préoccupation du « qu’en pensera-t-on », de l’autre. Et parce que concentrés de surcroît sur ceux qui s’expriment, vs ceux qui se bornent à écouter mais n’en agissent pas moins.
La démarche data vise, précisément, à se focaliser sur la pratique plus que le dit.
Directement enregistrée : tickets de caisse, log de connexion…. Aux armées d’enquêteurs, elle substitue les bataillons de data scientists chargés d’agréger et de donner du sens aux data collectées. Au risque, à l’inverse, de d’être victime du « vertige de la profusion » et de peiner à donner du sens aux données collectées.
Ou assumée comme étant plus indirecte. Le numérique ouvre ainsi la voie à des exploitations plus simples, mais plus immédiatement exploitables d’un point de vue opérationnel. De la curiosité pour un sujet particulier, via les courbes de recherche dans Google, à l’analyse « chirurgicale » des parcours clients par D-Rating dans les secteurs de la banque de détail, de l’assurance et des télécoms, en passant par l’agrégation de critères d’attractivité de l’étude THEMA (chaînes thématiques et services de SVoD) ou par les analyses proposées par SPORT INDEX (à titre d’exemple : le poids des différentes disciplines dans les line-up des différentes enseignes est le reflet des ventes qu’elles escomptent, et l’évolution de la « part de linéaire » celui des anticipations à la hausse ou à la baisse).
Nous ne sommes décidément qu’aux tous premiers pas de la smart data !.