Le regard et l’expérience d’Hélène Jacquenet, directrice de ContentSide, une société spécialisée dans l’ingénierie de contenu.

Entretien mené par Valérie Larroche, le 30 août 2024

Hélène Jacquenet

Directrice de la société ContentSide

helene.jacquenet@contentside.com

Valérie Larroche

Enseignante-chercheuse et membre du laboratoire ELICO

ENSSIB

valerie.larroche@enssib.fr

Nous donnons la parole à Hélène Jacquenet, formée à l’information et à la documentation et devenue directrice générale de la société ContentSide1, spécialisée dans l’ingénierie de contenu, pour qu’elle nous partage son retour d’expérience et son opinion en matière de compétences info-communicationnelles et de données.

Entretien

Valérie Larroche : Nous vous remercions d’accepter notre entretien. Le numéro de la revue Communication & Professionnalisation dans lequel s’intègre votre interview s’intéresse aux données et à la professionnalisation des communicants et des spécialistes de l’information. Que pensez-vous des termes que l’on entend en ce moment dans les organisations autour des données ? Je pense notamment à « plateformisation », « datadriven », « écosystème des données » ou « datafication ». Qu’est-ce que cela vous évoque ? Est-ce que vous utiliseriez d’autres termes ?

Hélène Jacquenet : Ces termes sont rarement utilisés dans mon environnement professionnel et si je devine à peu près ce qu’ils peuvent désigner, je ne les emploie pas. Cela m’évoque un discours typique de consultance, qui somme les organisations de s’adapter à une nouveauté méthodologique, technologique ou managériale sous peine de maux irréversibles, injonction accompagnée d’une créativité terminologique attestant du caractère fondamentalement nouveau.

Certains termes comme « driven » et « écosystème » me paraissent par ailleurs polysémiques donc nécessitant un contexte pour mieux les comprendre : s’agit-il d’architecture technique, de méthode de développement logiciel, de stratégie économique ou marketing ?

En fonction de l’audience à laquelle je m’adresserais, j’utiliserais des termes différents. La plupart du temps, mon discours vise les clients présents et futurs, sinon les partenaires de ContentSide, et dans ce contexte la simplicité et la clarté me semblent impératives. Je vais donc plutôt choisir une terminologie qui leur est familière, tout en vérifiant régulièrement qu’elle désigne bien la même chose pour tout le monde.

En effet, le terme « donnée » lui-même est loin de faire consensus. En fonction des interlocuteurs il peut signifier un contenu, la description de ce contenu, une information, une information sur cette information, voire même un document, mais aussi tout ce qui est à l’intérieur d’un système de base de données, tout ce qui est calculable, combinable, synthétisable, etc.

En informatique, une donnée est la représentation numérique binaire d’une information intelligible humainement, donc un signal électronique sous forme de suite de 0 et 1. Si je n’utilisais que cette acception, j’aurais du mal à me faire comprendre de la plupart de mes interlocuteurs et nos échanges tourneraient rapidement au quiproquo.

J’utilise le terme « donnée » pour désigner un élément informationnel qui ne devient réellement une information que lorsqu’il est encadré, structuré, organisé par des « métadonnées » ou des « bases de données ». La métadonnée explicite la donnée, elle donne le contexte dans lequel il faut la comprendre, de même pour le champ d’une base de données. Prenons l’exemple d’un élément informationnel composé d’un prénom et d’un nom. Sans métadonnée (ou champ), on ne peut savoir s’il s’agit d’un auteur, d’un patient, d’une personnalité citée, d’un bâtiment, d’un détenteur de copyright, d’un parent, etc.

Généralement les professionnels de l’information nomment ces ensembles données-métadonnées « informations structurées ».

Valérie Larroche : Depuis 2018, vous travaillez chez ContentSide. Pouvez-vous nous présenter les services et produits qu’elle offre à ses clients en soulignant les données qu’elle aide à produire, à exploiter ou à diffuser ?

Hélène Jacquenet : ContentSide a développé un produit fondé sur des techniques d’intelligence artificielle nommé Semantic Platform, dont le principe est de réaliser différentes analyses sémantiques sur des contenus afin de contextualiser ceux-ci en synthétisant leur apport informationnel dans des formes structurées.

Depuis sa création en 2010, la société est spécialisée dans l’ingénierie du contenu, nous fournissons donc également des services autour de ce produit, orientés sur la production éditoriale : nous développons des applications métier sur mesure permettant de créer du contenu, de le structurer, de l’organiser le plus finement possible pour pouvoir l’exploiter ensuite sur différents supports et sous différentes formes. Enfin, étant de fait spécialistes dans ce domaine, nous réalisons des missions de conseil et d’accompagnement sur des projets de gestion de contenu.

Semantic Platform fournit des données structurées après analyse des contenus qui lui sont soumis grâce à différents modules qui exploitent des techniques de machine learning et de traitement du langage naturel. Par exemple, certains de nos clients disposant d’un vocabulaire contrôlé, hiérarchisé ou non, peuvent obtenir une proposition de termes pertinents issus de celui-ci pour représenter les principaux concepts traités dans le contenu qu’ils viennent de créer. D’autres obtiennent une typologie des noms propres figurant dans leurs contenus, ce qui leur permet de distinguer les noms de personnes, de lieux et d’organisation cités dans ceux-ci. L’un de nos modules fournit, pour un contenu, la donnée identifiant d’autres contenus qui en sont les plus proches en termes de sens.

Valérie Larroche : Pourriez-vous nous préciser les clients qui bénéficient de vos prestations ? Quelles sont leurs représentations des données ? Sont-elles compatibles avec les données gérées par votre produit Semantic Platform ?

Hélène Jacquenet : Nos clients sont des organisations dont l’activité est étroitement liée aux informations à forte valeur ajoutée, donc la plupart sont des producteurs-fournisseurs d’information, comme la presse et l’édition : Lextenso, Hachette Livre, Le Point, Les Inrockuptibles, L’Humanité, 1Health, Le journal des entreprises, Clubic, etc. ou bien des infomédiaires, comme BnF-Partenariats avec sa plateforme RetroNews Services dédiée à la valorisation d’archives de presse.

Pour nos clients, les données, associées à leurs métadonnées sont une richesse supplémentaire, un moyen de valoriser l’information qu’ils produisent et fournissent. En gros, deux modèles peuvent résumer leur représentation, en fonction de leur dépendance économique à Google : soit le couple donnée-métadonnée est un moyen d’augmenter leur visibilité dans les pages de résultats du moteur de recherche, soit il est un moyen d’augmenter la qualité de l’expérience de recherche et de consultation au sein du corpus informationnel qu’ils produisent.

Ceci est d’autant plus vrai dorénavant, avec les robots conversationnels comme ChatGPT, dont la conception est fondée sur de grands modèles de langue, que les usagers détournent de leur seule compétence à interagir et formuler, pour en faire leurs fournisseurs d’information en complément, voire en remplacement, des moteurs de recherche. Cet usage détourné force à concevoir de nouveaux outils de recherche, capables de sourcer correctement et d’interpréter finement les informations, ce qui nécessite donc des couples pertinents de données-métadonnées décrivant l’information fournie.

Ces représentations des données sont tout à fait compatibles avec celles que nous produisons via Semantic Platform car, comme son nom l’indique, son principe fondamental est l’analyse de la signification des informations qui lui sont présentées et sa restitution synthétique.

Valérie Larroche : Pouvez-vous nous faire un historique du projet Semantic Platform et de ses objectifs stratégiques ? Pouvez-vous préciser les services et partenaires de ContentSide à l’œuvre dans le projet de cette plateforme, dans sa mise en œuvre et dans son fonctionnement ?

Hélène Jacquenet : En 2015, nous avons créé une activité de recherche scientifique afin d’améliorer le caractère innovant des solutions informatiques sur mesure que nous concevions et réalisions pour nos clients : s’ils avaient besoin d’une application spécifique c’était parce qu’aucun outil du marché, aucun état de l’art, ne correspondait précisément à leurs attentes.

Nos travaux scientifiques ont été orientés sur deux axes principaux : comment exploiter des gisements d’information pour les enrichir ensuite, et comment intégrer simplement cette exploitation dans tout type de système informatique, sans rien bouleverser.

Nos premiers résultats, fondés sur des techniques d’intelligence artificielle, ont été obtenus grâce à des travaux fournis dans le cadre d’un appel à projets scientifiques2 européen. Puis, au début des années 2020, nous avons rencontré un client sponsor, qui nous a permis d’industrialiser ces premiers résultats au sein d’un produit standard, que nous avons nommé Semantic Platform.

Il est disponible sous la forme d’une API documentée, les services sémantiques étant fournis en SaaS. Ce qui signifie que le produit est facile et rapide à intégrer dans un système existant, et qu’il ne nécessite aucune installation locale, uniquement une clé d’accès au service.

Sur cette API, nous avons développé une extension WordPress, ce qui rend encore plus rapide l’intégration au système d’information, puisqu’elle ne nécessite, de ce fait, aucune compétence en développement informatique.

Cette façon de mettre en œuvre Semantic Platform, via une intégration dans un CMS, est celle que nous retrouvons chez la plupart de nos clients, qui utilisent souvent des CMS généralistes de type WordPress ou spécialisés comme Melody, SWYP ou S-Pulse par exemple. Ceux-ci disposant désormais d’une intégration de Semantic Platform dans leurs interfaces, cela permet à des clients comme Les Inrockuptibles, L’Humanité, 1Health, Le Point ou Le Journal des Entreprises de bénéficier des services de Semantic Platform dans leur système d’information standard.

Pour nos clients ayant des besoins spécifiques en termes d’application de production, nous avons conçu et réalisé l’outil éditorial en y intégrant Semantic Platform. C’est le cas par exemple de Lextenso et de BnF-Partenariats.

Valérie Larroche : Pourriez-vous nous préciser le positionnement de votre plateforme par rapport à un moteur de recherche comme Google ?

Hélène Jacquenet : Notre produit enrichit l’information d’une façon qui correspond aux critères de pertinence de Google, car nous avons la même conception de ce qui rend une information fiable et donc exploitable. Conception que nous n’avons pas inventée, ni Google ni ContentSide, qui est fondée sur les principes documentaires connus des professionnels de l’information depuis l’émergence des métiers de la documentation dans les années 19303. De ce fait, Semantic Platform peut être utilisé comme un outil de SEO, notamment.

Plus largement que Google, Semantic Platform est un partenaire des outils de recherche car il permet, via les couples données-métadonnées qu’il produit, de nourrir intelligemment l’indexation par les moteurs, donc de fournir ensuite des services avancés d’exploration.

Valérie Larroche : Pour un bon usage de votre produit Semantic Platform, faut-il que vos clients se représentent bien les différents services qui collectent, traitent, préservent, publient et/ou réutilisent les données ? Pourriez-vous nous décrire les compétences communicationnelles et informationnelles attendues lors de ces différentes actions ?

Hélène Jacquenet : Il vaut mieux en effet que nos clients, sans nécessairement les connaître et les nommer, se représentent bien les différentes étapes d’un cycle documentaire, leur fonctionnement et leur intérêt, afin de comprendre l’usage de Semantic Platform.

Pour bien appréhender le fonctionnement de Semantic Platform et savoir l’utiliser à bon escient, les compétences suivantes sont intéressantes :

Valérie Larroche : Quelles sont les compétences requises pour assurer votre poste de directrice générale de ContentSide, notamment les compétences info-communicationnelles indispensables ?

Hélène Jacquenet : Dans mon poste actuel de direction générale pour ContentSide, j’ai besoin au minimum de connaître, et si possible de maîtriser, les compétences info-communicationnelles internes à une société ayant notre activité, ainsi que celles de nos clients.

En dehors de l’aspect communicationnel et marketing classique pour toute société quelle que soit son activité, ces compétences sont plus informationnelles que communicationnelles.

Il s’agit notamment de celles que j’ai citées précédemment, mais aussi de comprendre les processus métiers dans les secteurs de l’édition et de la presse, donc, entre autres :

Moins spécifiquement, mon poste requiert également des compétences info-communicationnelles dédiées au commerce, au recrutement, à la gestion et à l’interaction avec nos différents prestataires, comme :

Valérie Larroche : Selon vous quelles sont les compétences info-communicationnelles attendues dans le secteur de la donnée aujourd’hui ?

Hélène Jacquenet : Je ne sais pas si on peut parler d’un secteur de la donnée, je n’en connais pas. Il existe en revanche des métiers, des spécialisations autour de la donnée, qui sont très divers (ceux dont la dénomination commence par « Data » notamment). D’après ce que j’observe, les compétences info-communicationnelles nécessaires dépendent de la compétence première attendue : celle-ci peut être mathématique (calcul, statistique, etc.), informatique (architecture, infrastructure, automates de manipulation et d’exploitation), socio-économique (exploitation, représentation, interprétation) ou celle que j’ai déjà évoquée à plusieurs reprises, une compétence première documentaire (manipulation, exploitation, analyse, représentation).

Lorsque les opérations sur la donnée sont de l’ordre de la manipulation, l’exploitation, l’analyse, la représentation et l’interprétation, des compétences info-communicationnelles peuvent être souhaitables, comme :

Valérie Larroche : Revenons maintenant sur votre carrière antérieure. Vous avez commencé votre carrière en 1999 comme documentaliste chez Hachette Filipacchi Media. Pouvez-vous préciser vos missions et la représentation de la donnée que vous aviez à l’époque ? Est-elle très différente de votre représentation aujourd’hui ?

Hélène Jacquenet : J’étais documentaliste dans une photothèque dédiée au cinéma et au spectacle vivant, dont les clients étaient les titres de presse du groupe. Ma principale mission était d’analyser les images et les textes du fonds et de les indexer (au sens documentaire) dans des bases dédiées. Je réalisais également des recherches d’images et d’information sur commande, ainsi que des revues de presse sur les domaines du cinéma et du spectacle vivant. La donnée était une grande partie de ce que je produisais et de ce qui me permettait de faire mes recherches : ce qui était structuré et stocké dans des bases documentaires. Donc je dirais que ma représentation n’était pas tellement différente de celle d’aujourd’hui.

Valérie Larroche : L’engouement pour la donnée aujourd’hui est finalement une préoccupation ancienne. Que pensez-vous de la communication médiatique aujourd’hui sur cette question de la donnée ?

Hélène Jacquenet : Je ne fais pas particulièrement attention à la communication médiatique sur ce sujet, donc ma réponse est plus ou moins fondée. Ce que j’ai déjà constaté sur d’autres sujets intéressant la presse informatique, notamment sur le RSE (réseau social d’entreprise) que j’ai étudié, c’est que la communication médiatique sur des sujets technologiques a tendance à prophétiser jusqu’à devenir performative. C’est-à-dire par exemple qu’elle crée des besoins, des objets, des méthodes, en dehors du réel vécu professionnel. Parfois elle convainc et ses créations intègrent donc finalement ce réel, confirmant ce qu’elle avait prophétisé.

En ce qui concerne la donnée, une partie de la communication médiatique s’intéresse aux données privées et à leur protection, aux réglementations nationales, européennes ou internationales et dans ce cas il s’agit plutôt d’un discours factuel, rapportant l’état d’avancement ou les événements liés. Cette partie est sans doute assez mince dans l’ensemble de la production médiatique autour de la donnée.

Valérie Larroche : Vous avez ensuite passé une dizaine d’années chez un éditeur de logiciels. Quelles étaient vos fonctions ? : Au sein de ces activités, était-il déjà question de données ? Comment les abordiez-vous ?

Hélène Jacquenet : J’ai été embauchée comme consultante formatrice sur les logiciels documentaires qui étaient produits, puis j’ai occupé les postes de cheffe de projet web, cheffe de projet fonctionnel, business analyst, consultante avant-vente et customer relationship manager.

Oui, il était déjà question de données au sein de ces activités, car nous produisions des logiciels permettant d’acquérir, décrire, stocker et rechercher des documents. Le stockage pouvait faire appel à des bases de données Oracle ou SQL, la description des documents était une information structurée dans une fiche documentaire, elle-même alimentée par des listes de vocabulaire plus ou moins contrôlées et complexes. L’un de nos logiciels permettait de construire et de gérer des thesaurus, donc des vocabulaires contrôlés, hiérarchisés et organisés. Enfin, le logiciel principal comportait deux moteurs de recherche, l’un indexait les fiches documentaires et l’autre les documents stockés, après une éventuelle opération de reconnaissance de caractères.

Nous parlions plutôt de donnée lorsqu’il était question du format de stockage (Oracle ou SQL) ou de migrer un fonds documentaire dans l’un de nos logiciels, auquel cas nous parlions de reprise de données. Pour le reste, nous utilisions plutôt des termes comme « champ » et « contenu de champ », « description », « index », « information ». Il était également question de métadonnées et de structuration d’information, car nous utilisions des formats type CSV, XML ou RSS pour les transferts, extractions, importations de données.

Valérie Larroche : Quels étaient vos clients ? Avaient-ils une représentation de la donnée ?

Hélène Jacquenet : Nos interlocuteurs opérationnels étaient majoritairement des professionnels de l’information, sinon des communicants. Nos clients étaient de tous secteurs d’activité, ils avaient en commun un besoin de gérer finement de l’information, pour leur production, parfois pour leur communication interne, voire externe. Ils disposaient donc de gros volumes d’information, soit acquise à l’extérieur, soit produite en interne, soit un mélange des deux. Il s’agissait de photothèques, de bases brevets, de bases d’articles de presse, d’ouvrages, de littérature grise, de documentation technique, d’archives, etc.

Il me semble qu’ils avaient une représentation de la donnée, oui, elle était différente en fonction de leur métier, de l’activité de leur organisation, des objectifs qu’ils poursuivaient, et de l’importance que cela revêtait dans leur cycle de production.

Valérie Larroche : Pour faire le tour de votre expérience, je ne peux pas passer sous silence votre doctorat. Pouvez-vous me rappeler le sujet et me dire si ce travail a eu des incidences sur votre vision de la donnée ?

Hélène Jacquenet : J’ai effectivement soutenu une thèse de doctorat en sciences de l’information et de la communication. Elle visait les différents discours qui traversaient le dispositif du réseau social d’entreprise, ou RSE, dans une position critique du modèle managérial qui était supposé mener à son intégration dans les organisations. Ce qui m’a permis, en outre, de réinterroger la notion d’activité à l’aune de la représentation du RSE en tant que nouvel outil collaboratif et de gestion des connaissances, et de montrer que l’une des particularités de ce dispositif était qu’il semblait véhiculer un certain nombre de contradictions, voire provoquer des paradoxes pragmatiques, du fait notamment que son principal mécanisme reposait sur une visibilité permanente.

Ce travail a eu des incidences sur ma vision de la donnée, il m’a permis de mieux la cerner et donc d’en proposer une définition, en m’appuyant sur la distinction introduite par Yves Jeanneret en ce qui concerne l’information : l’information1 qui est mathématique, inintelligible humainement et l’information2 qui est sociale, donc nécessairement soumise à interprétation. Je distingue la donnée1 qui est un signal électronique, d’une donnée2, qui est une trace numérique intelligible socialement et potentiellement interprétable en tant qu’information2 structurée, en fonction de méta-informations2 qui la contextualisent. J’ai synthétisé cette vision dans un tableau incluant également une distinction entre communication1 et communication2, ce qui permettrait, de mon point de vue, de lever pas mal d’ambiguïtés et contresens dans les discours.

Tableau n°1. Synthèse des caractéristiques distinguant les sens « mathématique » (indice 1) et « social » (indice 2) des termes informations, donnée et communication

Formation

Valérie Larroche : Pensez-vous que les formations actuelles en information communication préparent à intervenir dans des organisations mobilisant les données ? Que doit-on prévoir dans les formations pour acculturer les communicants à la donnée ? à l’opposé, est-il envisageable de prévoir un socle info-communicationnel de formation pour les acteurs de la donnée ?

Hélène Jacquenet : Je ne connais pas suffisamment bien l’offre actuelle de formation en information communication pour dire si elles préparent à intervenir dans des organisations mobilisant les données. Certaines formations que je connais me semblent intégrer des contenus nécessaires, ce sont celles qui sont vues comme « techniques » car comportant des enseignements en informatique documentaire (bases de données, analyse et condensation de l’information, manipulations de flux XML, etc.).

De mon point de vue, il est indispensable de prévoir dans toutes les formations un socle minimum de connaissances et de compétences en information communication, comprenant une culture générale de l’informatique, la définition de ce qu’est une information, la maîtrise des techniques d’analyse et synthèse documentaires, voire des manipulations/exploitations de flux de données. Je le conçois comme un minimum culturel fondamental, permettant de contribuer à la formation de l’esprit critique des étudiants.

Les offres d’emploi Open data & communication

Valérie Larroche : Pourriez-vous nous préciser l’intérêt d’intégrer des communicants dans un projet ou un service lié aux données ? Quels doivent être les atouts de ces communicants pour travailler avec des spécialistes de la donnée ?

Hélène Jacquenet : Intégrer des communicants dans un projet ou un service lié aux données peut être intéressant à deux étapes différentes. Ils peuvent apporter une contribution pertinente dans le travail de constitution et de qualification des jeux de données, permettant ainsi de s’assurer de la qualité et donc de l’efficacité dans l’exploitation des données. D’un autre côté, leur apport peut être intéressant lorsqu’il s’agit d’exploiter et de diffuser les données, pour imaginer et créer différentes représentations issues de celles-ci.

Leurs principaux atouts doivent être du côté de l’analyse et de la synthèse d’information : savoir condenser en quelques termes choisis et adaptés à l’usage tout l’intérêt que peut représenter une information, et à l’inverse savoir interpréter une représentation informationnelle synthétique. Ce qui nécessite également une bonne compétence en techniques de médiation.

Pour travailler avec des spécialistes de la donnée il faut aussi être familier avec des aspects technologiques, avoir une bonne culture informatique.

Valérie Larroche : Vous avez recruté au sein de votre société des alternants en communication digitale4. Qu’attendez-vous des formations avec lesquelles vous contractez ? Quelles compétences faut-il pour espérer être recruté en alternance chez ContentSide?

Hélène Jacquenet : J’attends des formations un programme qui comporte les fondamentaux en termes d’information et de communication, c’est-à-dire qui ne soit pas focalisé uniquement sur la maîtrise d’outils en vogue qui seront supplantés dans six mois par d’autres. La communication, désormais, est rarement étanche aux aspects numériques qui ne sont qu’un moyen et un canal sur lesquels la communication compte, quoi qu’il en soit, dans sa stratégie.

Pour être recruté en alternance chez ContentSide il faut démontrer d’excellentes capacités d’apprentissage, en premier lieu, c’est le plus important. Ensuite une bonne culture générale informatique est appréciée, sinon une excellente capacité d’adaptation. Enfin, nous privilégions les profils qui semblent avoir une certaine exigence de qualité, une bonne créativité et du bon sens.

Valérie Larroche : Je vous remercie pour cet échange. Pouvez-vous préciser le meilleur moyen de vous contacter si des lecteurs du numéro de la revue Communication & Professionnalisation souhaitent vous joindre ?

Hélène Jacquenet : Oui, je suis joignable par email : helene.jacquenet@contentside.com.


  1. 1 https://www.contentside.com/

  2. 2 https://itea4.org/project/papud.html

  3. 3 « Les buts de la documentation organisée consistent à pouvoir offrir sur tout ordre de fait et de connaissances des informations : universelles quant à leur objet ; sûres et vraies ; complètes ; rapides ; à jour ; faciles à obtenir ; réunies d’avance et prêtes à être communiquées ; mises à disposition du plus grand nombre. » (Otlet P. (1934). Traité de documentation : le livre sur le livre, théorie et pratique. Éditions Mundanéum).

  4. 4 Un exemple d’offre parue en 2022 : https://teamopendata.org/t/sncf-recrute-un-e-charge-e-de-mission-communication-open-data-et-contenus-en-alternance/3641