Élaboration d'une méthode d'identification et de quantification de spécimens en mélange.

par Quentin Delorme

Thèse de doctorat en Informatique

Sous la direction de Annie Chateau.

Le président du jury était William Ritchie.

Le jury était composé de Annie Chateau, Ronnie Alves, Jean-Stéphane Varré, Claire Lemaitre, Mikaël Salson.

Les rapporteurs étaient Ronnie Alves, Jean-Stéphane Varré.


  • Résumé

    Le blé tendre Triticum aestivum est l’une des céréales les plus cultivées et consommées par l’humain. Cette espèce est caractérisée par son génome de grande taille, hautement répété et par son hexaploïdie qui rend complexe les investigations génomiques cherchant à étudier la diversité de ses variétés. La France est le cinquième pays producteur de blé au monde et premier en Europe, il s’agit donc d’un élément central pour l’industrie agroalimentaire. Cette industrie est soumise à diverses normes sanitaires et de qualité et l’usage d’outils biotechnologiques est indispensable pour le contrôle de matières premières et de produits transformés. Nous nous intéressons à une méthode bioinformatique tirant profit des technologies de séquençage haut débit pour la caractérisation de compositions de mélanges de variétés de blé pour le contrôle qualité de farines. Les approches existantes souffrent de différents biais qui imposent le développement d’une méthode dédiée : nous proposons ici la méthode dite « Profils Signature » (PS) qui implémente des algorithmes originaux de manipulation de k-mers pour l’établissement d’une base de données de spécimens et leur quantification dans des mélanges industriels. Nous cherchons à extraire de données de séquençage haut débit des sous-matrices binaires inversibles et irréductibles à même d’identifier un ensemble de variétés de blé et de procéder à leur quantification. Nous démontrons que les fondements algorithmiques de la méthode PS assurent une redondance des unités de quantification offrant une précision de quantification satisfaisante sur données simulées. L’application de la méthode à des données réelles rencontre des difficultés causées par les caractéristiques du génome de Triticum aestivum, notamment des difficultés relatives aux techniques de séquençage par capture et de séquençage amplicon. Nous proposons une série d’adaptations de la méthode PS pour tenter de résoudre des problématiques de captures et amplifications aspécifiques.

  • Titre traduit

    Development of a method for identification and quantification in pooled samples


  • Résumé

    Bread wheat Triticum aestivum is one of the most widely cultivated and consumed crops. This species is characterized by its large, highly repeated, hexaploid genome which constitutes a challenge for genomic investigations and studies of varietal diversity. France is the fifth wheat producing country in the world and the largest in Europe, so wheat is one of the central topic for food industry. Food industry is subject to various health and quality standards and the use of biotechnological tools like Polymerase Chain Reaction is essential for the quality control of raw materials and processed products. We are interested in a bioinformatic method taking advantage of high throughput sequencing technologies for the characterization of compositions of pooled samples of wheat varieties for quality control of flour. The existing approaches like Barcoding or Metagenomics suffer from various biases which impose the development of a dedicated method: Here we present the method known as “Profils Signature” (PS) which implements original algorithms for k-mers manipulation, aiming the establishment of a database made of invertible and irreducible matrices. We show that the algorithmic foundations of the PS method ensure a redundancy of the quantification units offering a satisfactory precision on simulated dataset. The application of the method to real data is challenging because of the characteristics of the Triticum aestivum genome, in particular difficulties relating to capture sequencing and amplicon sequencing technologies. We propose a series of technical and algorithmic adaptations of the PS method in an attempt to solve the problems of nonspecific captures and amplifications that occur in our dataset.



Le texte intégral de cette thèse sera accessible sur intranet à partir du 01-11-2026

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Universités de Montpellier. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.