Extraction de données structurées : l'exemple des appels d'offres avec DeepBloo
Résumé
En traitant plus de 20 000 appels d'offres et informations de marché par jour issus de sources très variées, Deepbloo permet à ses clients de trouver des opportunités pertinentes dans divers domaines. Les appels d'offres se présentent en général sous forme textuelle de manière non structurée. Dans le cadre de sa collaboration avec l'Université de Bordeaux, nous avons développé des techniques utilisant de grands modèles de langage pour extraire de ces textes les informations qu'ils contiennent sous un format structuré. Plus généralement, la question de l'extraction de données structurées est un sujet brûlant, sur lequel les LLMs ont permis de faire des progrès significatifs. Dans cette présentation, nous discuterons de l'état de l'art, des applications industrielles et des perspectives.
A propos - CNRS, LaBRI, Bordeaux

Le LaBRI est une unité mixte de recherche affiliée au CNRS, à l'Université de Bordeaux et à Bordeaux INP, spécialisée en informatique.
https://www.labri.fr/
A propos - DeepBloo

Deepbloo propose une solution de business development pour les sociétés de l’industrie énergétique, leur permettant d’accéder aux appels d’offres internationaux et aux informations de marché (sur les acteurs du marché, les signaux faibles et les résultats d’appels d’offres).
Cette solution s’adresse aux équipes de vente et de business development des entreprises du secteur de l’énergie qui cherchent à développer leur chiffre d’affaires ou souhaitent conquérir de nouveaux marchés.
https://www.deepbloo.com/
A propos des orateurs
Nathanaël Fijalkow
Spécialiste Data Science
Nathanaël Fijalkow est chercheur au CNRS, au LaBRI à Bordeaux depuis 2018. Jusqu'en 2022, il était chargé de recherche à l'Alan Turing Institute for Data Science and Artificial Intelligence à Londres. Il a soutenu son doctorat en octobre 2015 et son habilitation à diriger des recherches en février 2022. Il dirige l'équipe Synthesis au LaBRI depuis 2024. Ses recherches sont à l'intersection des méthodes formelles et de l'apprentissage automatique, et il s’intéresse à la synthèse de programmes et à la théorie des jeux.

Martin Rabaud

Directeur technique
Expert en data engineering et intelligence artificielle, Martin Rabaud est Directeur Technique chez Deepbloo. Diplômé d’Epitech, il possède une solide expérience en développement logiciel, data mining et cloud computing.

Rémi Poulenard

Développeur Full-stack et Data ingénieur
Rémi Poulenard, développeur full-stack et data ingénieur, diplômé d’Epitech. Il allie développement web et machine learning pour concevoir des solutions performantes et scalables. De l’optimisation des systèmes d’extraction de données à l’intégration de modèles LLM, il vise à exploiter l’IA et les données pour transformer les défis techniques en opportunités stratégiques.