Détection de textes générés automatiquement

Minh Tien Nguyen

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Détection de textes générés automatiquement

FR |

EN

Auteur / Autrice :	Minh Tien Nguyen
Direction :	Cyril Labbé
Type :	Thèse de doctorat
Discipline(s) :	Mathématiques et Informatique
Date :	Soutenance le 03/04/2018
Etablissement(s) :	Université Grenoble Alpes (ComUE)
Ecole(s) doctorale(s) :	École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'informatique de Grenoble (2007-....)
Jury :	Président / Présidente : Sylvie Calabretto
	Examinateurs / Examinatrices : Catherine Berrut
	Rapporteurs / Rapporteuses : Jacques Savoy, Guillaume Cabanac

Mots clés

FR |

EN

Mots clés contrôlés

Analyse du discours -- Informatique

Traitement automatique du langage naturel

Mots clés libres

Texte généré automatiquement

Informations bibliographiques

Détecter texte généré automatiquement

Traitement du langage naturel

Résumé

FR |

EN

Le texte généré automatiquement a été utilisé dans de nombreuses occasions à des buts différents. Il peut simplement passer des commentaires générés dans une discussion en ligne à une tâche beaucoup plus malveillante, comme manipuler des informations bibliographiques. Ainsi, cette thèse introduit d'abord différentes méthodes pour générer des textes libres ayant trait à un certain sujet et comment ces textes peuvent être utilisés. Par conséquent, nous essayons d'aborder plusieurs questions de recherche. La première question est comment et quelle est la meilleure méthode pour détecter un document entièrement généré.Ensuite, nous irons un peu plus loin et montrer la possibilité de détecter quelques phrases ou un petit paragraphe de texte généré automatiquement en proposant une nouvelle méthode pour calculer la similarité des phrases en utilisant leur structure grammaticale. La dernière question est comment détecter un document généré automatiquement sans aucun échantillon, ceci est utilisé pour illustrer le cas d'un nouveau générateur ou d'un générateur dont il est impossible de collecter des échantillons dessus.Cette thèse étudie également l'aspect industriel du développement. Un aperçu simple d'un flux de travail de publication d'un éditeur de premier plan est présenté. À partir de là, une analyse est effectuée afin de pouvoir intégrer au mieux notre méthode de détection dans le flux de production.En conclusion, cette thèse a fait la lumière sur de multiples questions de recherche importantes concernant la possibilité de détecter des textes générés automatiquement dans différents contextes. En plus de l'aspect de la recherche, des travaux d'ingénierie importants dans un environnement industriel réel sont également réalisés pour démontrer qu'il est important d'avoir une application réelle pour accompagner une recherche hypothétique.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Détection de textes générés automatiquement

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Détection de textes générés automatiquement

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses