IA, LLMs - Doctorant·e – Offre de thèse (PhD)

Fonction
Département
Date
01-2026
Reference
Doctorant·e – Offre de thèse (PhD): DS/PP/LLM/012026
Résumé

Rejoignez un projet de thèse ambitieux sur les LLM augmentés par des outils pour l’IA décisionnelle, en collaboration entre EURECOM et Aily Labs.

 

LLM augmentés par des outils pour l’IA décisionnelle sur données d’entreprise

Les entreprises se tournent de plus en plus vers les modèles de langage (LLM) pour soutenir des décisions critiques, fondées sur des données structurées telles que des bases de données ou des graphes de connaissances. Cette thèse de doctorat propose un programme de recherche sur trois ans visant à concevoir et valider le raisonnement assisté par outils (thinking-with-tools), une approche dans laquelle le modèle intègre l’utilisation d’outils en temps réel (par exemple SQL/SPARQL, Python) directement au sein de son raisonnement.

Au-delà des gains en précision, l’objectif est de développer un système d’aide à la décision efficace, capable de reconnaître ses incertitudes, de demander des clarifications et d’escalader vers un humain lorsque le jugement devient déterminant. Par exemple, face à la question : « Si nous réduisons le prix du produit X de 5 % au prochain trimestre, quel chiffre d’affaires pouvons-nous anticiper ? », le système raisonne, extrait les données pertinentes, explicite ses hypothèses et invite un humain à confirmer ou ajuster les paramètres si nécessaire. Cette approche s’inscrit dans les priorités actuelles de recherche sur l’aide à la décision humain-IA et la gouvernance des systèmes d’IA en environnements complexes.

Le projet adoptera une posture ouverte et comparative : le raisonnement augmenté par des outils constitue une piste prometteuse, mais non acquise d’avance. Une composante essentielle de la thèse consistera à démontrer, à partir de données réelles d’entreprise et de scénarios réalistes, dans quels cas cette approche surpasse les pipelines agentiques (LLM orchestrant les outils de manière séquentielle), en termes de qualité des solutions, d’efficacité, de coûts et de compromis associés.

Le ou la doctorant·e concevra le cadre méthodologique, ajustera finement des LLM open source afin de planifier et d’exécuter des outils de manière sûre et efficiente, et développera des politiques arbitrant entre précision, coût et latence. Cela inclut la création d’un environnement de test reproduisant des schémas de données d’entreprise, l’élaboration de traces d’apprentissage combinant raisonnement et appels d’outils, ainsi que le prototypage de cas d’usage réalistes pour Aily Labs (par exemple prévision et analyse client).

Parmi les résultats de recherche attendus figurent notamment : un optimiseur de raisonnement sensible aux coûts, apprenant quand et comment invoquer des outils ; des traces typées et auditables intégrant des mécanismes human-in-the-loop (incertitude, clarification, escalade) ; et des stratégies de routage tenant compte des budgets, adaptables à différents schémas et tâches. L’impact sera évalué à travers des mesures claires des compromis précision/latence/coût, de la robustesse face à l’évolution des schémas de données, ainsi que des enjeux de gouvernance.

Environment.

Dans le cadre de cette thèse CIFRE/industrielle, le ou la doctorant·e sera employé·e par Aily Labs et intégré·e aux équipes produit et data à Barcelone ou Madrid (Espagne), tout en étant inscrit·e à EURECOM sous la direction du Professeur Paolo Papotti.
Durée : 36 mois.
Langue de travail : anglais.

PRÉREQUIS

  • Niveau de formation / Diplôme : Master

  • Domaine / spécialité : Informatique

  • Technologies / langages / systèmes : Solide formation en apprentissage automatique et TAL/NLP, ainsi qu’en bases de données (SQL, SGBD, graphes de connaissances) ; excellente maîtrise de Python et des protocoles expérimentaux. Une expérience en ajustement fin de LLM, text-to-SQL, agents/outils ou apprentissage par renforcement constitue un atout.

  • Autres éléments importants : Les candidatures sont examinées au fil de l’eau. Les entretiens débuteront début janvier 2026.

CANDIDATURE

Le dossier de candidature doit comprendre :

  • Un curriculum vitae détaillé

  • Une lettre de motivation de deux pages présentant également les perspectives de recherche et de formation

Les candidatures doivent être envoyées par courriel à secretariat@eurecom.fr en indiquant la référence : DS/PP/LLM/012026.

More info