Evaluating and Improving the Reasoning Abilities of Language Models

Chadi Helwe

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Evaluation et amélioration des capacités de raisonnement des Modèles de Langage

FR |

EN

Auteur / Autrice :	Chadi Helwe
Direction :	Fabian Suchanek, Chloé Clavel
Type :	Thèse de doctorat
Discipline(s) :	Informatique, données, IA
Date :	Soutenance le 05/07/2024
Etablissement(s) :	Institut polytechnique de Paris
Ecole(s) doctorale(s) :	École doctorale de l'Institut polytechnique de Paris
Partenaire(s) de recherche :	Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....) - Laboratoire de Traitement et Communication de l'Information
	Etablissement opérateur d'inscription : Télécom Paris (Palaiseau, Essonne ; 1878-....)
Jury :	Président / Présidente : Benoît Sagot
	Examinateurs / Examinatrices : Benoît Sagot, Serena Villata, Paolo Rosso, Farah Benamara
	Rapporteurs / Rapporteuses : Serena Villata, Paolo Rosso

Mots clés

FR |

EN

Mots clés contrôlés

Traitement automatique du langage naturel

Langages de programmation

Apprentissage profond

Mots clés libres

Apprentissage en profondeur

Modèles de Langage

Traitement automatique du langage

Apprentissage automatique

IA neuro-symbolique

Résumé

FR |

EN

Cette thèse examine les capacités de raisonnement des Petits Modèles de Langage (SLMs) et Grands Modèles de Langage (LLMs) et expose leurs limites. Elle présente LogiTorch, une bibliothèque Python facilitant l’entraînement de modèles sur diverses tâches de raisonnement. La thèse inclut également TINA, une technique d’augmentation de données qui renforce la robustesse des SLMs face à la négation dans les tâches d’implication textuelle. De plus, la thèse explore les capacités des LLMs avec MAFALDA, un nouveau benchmark pour la classification des sophismes, intégrant une métrique d’évaluation quiconsidère la subjectivité. Les résultats montrent que les humains surpassent les modèles dans cette tâche de raisonnement. Nous proposons plusieurs directions de recherche qui méritent une investigation plus approfondie, telles que l’exploration de l’IA Neurosymbolique et l’amélioration des capacités de raisonnement des LLMs à faibles ressources.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Evaluation et amélioration des capacités de raisonnement des Modèles de Langage

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Evaluation et amélioration des capacités de raisonnement des Modèles de Langage

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses