Newsletter Semantic Platform – Mai 2024

Clubic utilise Semantic Platform !

Grâce à la solution Semantic Platform, Clubic améliore son maillage interne et rend à nouveau visibles plusieurs milliers d’articles. Cliquez sur le bouton pour découvrir le cas client dans son intégralité.

Nouvelles fonctionnalités

⚙️  API – Classification

Une nouvelle fonctionnalité permet de classer un lot de documents de manière asynchrone.

⚙️  API – Reconnaissance d’entités nommées

Nous avons totalement refondu le moteur de reconnaissance automatique d’entités nommées (mode découverte) qui possède désormais une précision accrue. En supplément, un quatrième type d’entité est désormais disponible : les communautés. Il permet de mettre en évidence des groupes de personnes partageant des caractéristiques communes (géographique, linguistique, etc.).

Aussi, différentes fonctionnalités ont été ajoutées à notre moteur :

  • possibilité de ne renvoyer que la 1re occurrence d’une entité nommée qui apparaît plusieurs fois dans le document
  • paramétrage de la précédente option par type d’entité (lieu, personne, organisation, communauté)
  • personnalisation des liens créés sur les entités reconnues et possibilité d’ajouter des métadonnées à ces liens (en mode dictionnaire)
  • possibilité d’importer les dictionnaires et variantes par lot
  • lorsqu’une entité a été reconnue par dictionnaire, le nom du dictionnaire est précisé dans le retour
  • possibilité de blacklister des entités nommées

💻 Portail client – Nouveauté

La plupart de nos clients souhaitent que les enrichissements sémantiques soient proposés au rédacteur pour validation. Dans certains cas, cela n’est pas souhaité ou pas possible.

Le portail Semantic Platform permet de visualiser les enrichissements réalisés et d’intervenir lorsque notre IA demande une validation humaine (taux de confiance trop bas) ou lorsqu’un enrichissement nécessite une correction. Le portail ne gère pour le moment que la classification automatique.

🧩 Extension Connecteur WordPress – Améliorations

Les améliorations suivantes ont été apportées à l’extension WordPress :

  • possibilité d’interdire la création de nouvelles entités nommées suggérées par l’IA à certains utilisateurs
  • paramétrage des taxonomies WordPress à utiliser

Fonctionnalités en développement

⚙️ API – Suggestion de dossier à créer

Nous travaillons sur une nouvelle fonctionnalité permettant, en analysant la base éditoriale, de proposer des dossiers à créer.

⚙️ API – Reconnaissance d’entités nommées

Actuellement, l’appel à la reconnaissance d’entités nommées renvoie tous les types d’entités et le seuil à partir duquel une entité est détectée par l’IA est commun à toutes. Il sera bientôt possible de choisir les types d’entités à renvoyer et de fixer librement chaque seuil.

⚙️ API – Classification

Nous proposerons bientôt un moteur de classification hiérarchique, capable d’associer un contenu à un niveau intermédiaire du plan de classement (actuellement, l’association n’est faite qu’avec les derniers niveaux).

💻 Portail client – Améliorations

Nous ajouterons bientôt la possibilité de contrôler les autres enrichissements sémantiques (détection d’entités nommées et liens de poursuite de lecture). Le portail permettra aussi bientôt d’importer un lot de documents pour réaliser les enrichissements sémantiques, sans besoin d’avoir à scripter un appel à l’API.

🧩 Extension Connecteur WordPress – Améliorations

L’extension WordPress pourra bientôt automatiquement initialiser les dictionnaires de la solution à partir des taxonomies existantes dans WordPress.

Fonctionnalités en R&D

⚙️ API – Fonctionnalités LLM

Nous travaillons à l’ajout de nouvelles fonctionnalités permises par l’intégration d’un Large Language Model, les recherches en cours portent sur :

  • l’accélération et l’aide au paramétrage des fonctionnalités actuelles
  • des fonctionnalités de génération de texte, en respectant la Charte de Paris, comme nous nous y sommes engagés

Voir nos dernières publications :