Prioriser la Véracité dans le Développement d’IA : L’approche de Continuity

Dans un monde où l’intelligence artificielle (IA) devient une nécessité stratégique pour les entreprises, le développement de solutions d’IA peut sembler réservé aux géants technologiques. Il est pourtant bien possible de créer des solutions innovantes, efficaces et fiables en associant qualité de la donnée et spécialisation des modèles sur des sujets très spécifiques, comme celui de l’assurance IARD.

Antoine Sinton, CSO et cofondateur de Continuity, partage les perspectives et stratégies mises en œuvre par Continuity pour révolutionner le secteur de l’assurance en mettant l’accent et la priorité sur la véracité dans le développement d’IA spécialisées à 100% sur le domaine.

Adapter les modèles aux spécificités de l’assurance

Antoine Sinton : On ne va pas révolutionner les modèles fondationnels, on ne va pas faire un Chat GPT, on ne va pas faire ce que fait Mistral… On se spécialise depuis 2019 sur des modèles in-house construits sur nos données et/ou à partir de modèles pré-entraînés.

L’approche de Continuity consiste, entre autres, à partir de modèles de pré entraînés génériques existants pour les spécialiser et les optimiser pour des cas d’usage spécifiques liés à l’assurance et aux besoins particuliers du secteur en se basant sur les données propriétaires de Continuity.

Cette stratégie, associée à une forte expertise en Data, IA et SaaS, ainsi qu’à cinq ans d’investissement continu en R&D, permet non seulement de réduire les coûts de développement, mais aussi d’assurer une mise en production plus rapide et plus efficace.

Faire de la véracité la priorité

Antoine Sinton : Les gros LLMs, les gros modèles dont tout le monde parle, connaissent un défaut de véracité. On n’est jamais sûrs de ce qu’ils disent.

Les grands modèles de langage comme Chat GPT sont parfois critiqués pour leur manque de véracité et leur coût exorbitant. Ils génèrent du texte qui semble plausible, mais commettent des erreurs factuelles. Quand ils génèrent des réponses, ils ne font pas de distinction entre le vrai et le faux ; ils produisent simplement des séquences de mots qui sont statistiquement probables.

Il y a donc des erreurs, d’où l’importance de vérifier et valider les informations obtenues à partir de ces LLMs, surtout lorsqu’elles sont utilisées dans des contextes importants ou critiques, comme dans l’assurance.

Antoine Sinton : Chat GPT ne comprend pas, tout court. Les notions de vérité ou de fausseté de ce qui est généré lui sont complètement étrangères, au contraire des humains, qui sont capables de contextualiser au-delà du “prompt. Son seul objectif est de produire du texte qui semble cohérent, en utilisant des probabilités basées sur les données sur lesquelles il a été entraîné. Les utilisateurs doivent donc vérifier et valider les informations obtenues à partir de ces modèles génératifs.

Chez Continuity, les modèles d’IA développés sont conçus pour remonter des données réelles. Ces informations générées par l’IA suivent un processus de qualité stricte. Cela garantit une meilleure véracité et répond aux exigences fortes des décideurs du secteur de l’assurance Pro/Entreprise en termes de qualité de la donnée.

Adopter une stratégie « Small and Deep » et miser sur la sécurité

Antoine Sinton : Plutôt que de suivre la tendance des modèles ‘large but shallow’, Continuity adopte donc une stratégie ‘small and deep’.

Continuity privilégie des modèles spécialisés, optimisés pour le secteur de l’assurance professionnelle et entreprise, qu’elle construit elle-même. Ces modèles sont d’une grande fiabilité et sont adaptés aux besoins spécifiques des marchés adressés. Un autre avantage de cette stratégie est la sécurité : étant de plus petite taille et hébergés en interne, ces modèles offrent une protection supérieure pour les données des assureurs.

Antoine Sinton : Nous nous basons sur tout ce que nous avons déjà construit depuis 2019, en utilisant notre infrastructure, nos données, tout ce que nous avons déjà exploité, afin de pouvoir les intégrer dans ces modèles et d’avoir une base ancrée dans la vérité.

Continuity maximise l’utilisation de ses infrastructures et données existantes. Cette approche permet d’ancrer les modèles dans une réalité vérifiable, améliorant ainsi la fiabilité et la pertinence des solutions proposées, tout en garantissant une sécurité renforcée pour les données des assureurs.

Créativité et intelligence stratégique

Antoine Sinton : Finalement, pour pouvoir réussir à faire quelque chose de différent, d’intéressant et d’important, en ayant moins de 500 millions sur le compte en banque, il faut être créatif, smart et 100% dédié au sujet. C’est aussi ce qui nous plait chez Continuity.

La créativité et l’ingéniosité sont au cœur de la stratégie de Continuity. Plutôt que de suivre les tendances dominantes, l’équipe se concentre, depuis sa création, sur des innovations spécifiques à son domaine, comme par exemple :

  • Siretiseur : Récupération du Siren et/ou Siret de l’entreprise en utilisant uniquement le libellé et/ou l’adresse de l’entreprise recherchée.
  • Géocodeur : Capacité à identifier et à associer tous les risques à une adresse donnée (taux de réussite >97%).
  • Filiation des entreprises : Identification des relations capitalistiques ou des affiliations d’une entreprise pour détecter les sites secondaires assurés.
  • BDDs propriétaires : Création de BDDs propriétaires (ICPE, Seveso…) via annotation manuelle, enrichissement par l’IA, et croisement de différentes sources de données.
  • Analyse du risque environnant : Capacité à montrer toutes les alertes en contiguïtés ou voisin du risque souscrit avec l’adresse assurée en fonction du rayon choisi par l’assureur.
  • Analyse des cumuls : Capacité à localiser les accumulations sur un certain type de risque et présenter des cartes des zones d’accumulation.

Antoine Sinton : Il est essentiel de développer des propositions de valeur indépendantes des données externes. L’open data va devenir une commodité dans les 3 à 5 ans. Nous travaillons constamment à identifier et développer des solutions qui ne reposent pas entièrement sur des données externes.

Continuity s’entoure de partenariats solides sur les fournisseurs de data mais travaille également ses propres datasets propriétaires. En se concentrant sur les données internes des assureurs et en intégrant des sources externes faciles à exploiter, Continuity garantit une plus grande fiabilité et une meilleure maîtrise des risques.

Avec un focus sur l’optimisation de modèles existants, l’intégration créative de données internes, et une validation rigoureuse par des experts humains, Continuity réussit à offrir des solutions innovantes et fiables qui transforment concrètement le secteur de l’assurance professionnelle. Une stratégie « small and deep » qui permet à l’entreprise de rester agile, compétitive et à la pointe de l’innovation dans un marché en constante évolution, tout en garantissant la sécurité et la qualité des données traitées.

© Portrait Antoine Sinton / Amélie Mazaré

* Image du header générée à l’aide du prompt « Create a modern flat design graphic depicting a large computer monitor displaying a checklist with a few distinct blue check marks. Include people: one pointing at the monitor and the other taking notes. The scene should be clean and uncluttered, with minimal icons related to data validation like a document and a graph in the background. The color scheme should be mostly blue with some accents of other soft colors to keep the design professional and concise. », par CHAT GPT / DALL-E, 2024