Les avancées récentes en séquençage haut débit ont profondément transformé notre compréhension de la biodiversité, en particulier microbienne. Le métabarcoding de l’ADN environnemental (ADNe) a notamment permis de générer d’importantes quantités de données sur la diversité et l’écologie des champignons. Toutefois, l’identification des champignons à l’échelle de l’espèce reste limitée par la faible résolution taxonomique des courtes séquences génétiques traditionnellement utilisées (100-300 paires de bases), telles que les régions ITS1, ITS2 ou SSU. Ces limites peuvent impacter notamment les conclusions sur la distribution des espèces et leur écologie. Pour surmonter ces limites, une approche prometteuse consiste à utiliser des séquences fongiques longues (« métabarcoding long-read »), grâce aux nouvelles technologies de séquençage, comme PacBio, permettant de cibler simultanément plusieurs régions (ITS1, ITS2, SSU) et ouvrant ainsi la voie à une meilleure résolution taxonomique. Cependant, l’analyse bioinformatique de ces longues séquences, en particulier les assignations taxonomiques et fonctionnelles, reste un défi méthodologique à affiner.

Ce projet vise à (i) évaluer le potentiel du métabarcoding fongique en long-read à l’aide de « mock communities » de composition connue, conçues à partir des collections du CRBE, afin de tester les capacités de détection et d’assignation taxonomique du métabarcoding fongique ; (ii) analyser des échantillons de sols prélevés dans certaines des réserves forestières les plus anciennes de France ; et (iii) affiner les assignations taxonomiques et fonctionnelles afin d’en dériver des indicateurs écologiques pertinents. Les échantillons étudiés disposent déjà de données de séquençage Illumina basées sur des marqueurs courts en métabarcoding short-read, offrant ainsi un cadre de comparaison robuste. Par ailleurs, les analyses menées sur ces sols forestiers anciens mettent en évidence une forte diversité fongique, mais également les limites actuelles des assignations taxonomiques et fonctionnelles, ainsi que la faible détection de certains taxons pourtant observés par les approches taxonomiques classiques.

Le stage consistera à (i) optimiser un pipeline bioinformatique dédié à l’analyse de données PacBio, (ii) comparer les résultats obtenus avec ceux issus du métabarcoding short-read et ceux des inventaires taxonomiques de mycologues, en évaluant notamment la couverture de séquençage, la qualité des assignations taxonomiques et leurs effets sur les patrons de diversité fongique, et (iii) améliorer les méthodes d’assignation taxonomique et fonctionnelle ainsi que le calcul d’indicateurs écologiques à partir des données générées.

Encadrant.e.s : Benoît Perez-Lamarque (benoit.perez-lamarque@utoulouse.fr) et Mélanie Roy (melanie.roy@utoulouse.fr)

Lieu du stage : Centre de Recherche sur la Biodiversité et l’Environnement (CRBE), 118 route de Narbonne, 31 000, Toulouse.

Durée : stage de M2 (6 mois)

Compétences attendues :
– Expérience avec R et/ou Python.
– Notions d’écologie générale.
– Compétences en analyse de données.

Modalités de candidature :
Envoyer CV et lettre de motivation à benoit.perez-lamarque@utoulouse.fr et melanie.roy@utoulouse.fr . Les candidatures seront examinées et entretiens réalisés au fil de l’eau.

Le contenu de cette offre est la responsabilité de ses auteurs. Pour toute question relative à cette offre en particulier (date, lieu, mode de candidature, etc.), merci de les contacter directement. Un email de contact est disponible: benoit.perez-lamarque@utoulouse.fr

Pour toute autre question, vous pouvez contacter sfecodiff@sfecologie.org.