Nanopore Adaptive Sampling

Nanopore Adaptive Sampling (NAS)

Le Nanopore Adaptive Sampling (NAS) représente une révolution dans l'approche du séquençage ciblé, permettant l'enrichissement sélectif en temps réel de régions génomiques d'intérêt sans préparation laborieuse d'échantillons ni synthèse de sondes. L'EPGV s'est positionnée comme pionnière dans l'implémentation de cette technologie innovante, notamment à travers ses travaux de référence sur la caractérisation des clusters de gènes de résistance NLR chez le melon, démontrant la capacité unique du NAS à résoudre des régions génomiques hautement complexes et répétitives.

Le NAS exploite la capacité unique des nanopores d'Oxford Nanopore Technologies (ONT) à contrôler le flux directionnel de l'ADN en cours de séquençage par modulation de la polarité du courant appliqué. La technologie combine l'identification en temps réel des bases séquencées avec un alignement dynamique sur un ensemble de séquences de référence fournies par l'utilisateur. Lorsque les premières centaines de bases d'un brin d'ADN correspondent aux régions cibles définies, le séquençage complet est maintenu ; dans le cas contraire, le brin est éjecté du pore, libérant immédiatement la capacité de séquençage pour d'autres molécules d'intérêt.

Cette approche révolutionnaire ne nécessite qu'une préparation standard de librairies, éliminant les étapes d'amplification PCR, de synthèse de sondes ou de conception expérimentale complexe. Le processus d'enrichissement sélectif s'effectue en temps réel durant la run de séquençage, offrant une flexibilité et une efficacité inégalées pour l'étude de régions génomiques spécifiques.

Oxford Nanopore Technology plc.

L'EPGV dispose de l'ensemble de la gamme de séquenceurs Oxford Nanopore (MinION, GridION, et PromethION P24), permettant une adaptation optimale des projets NAS selon leur échelle et leurs contraintes temporelles :

  • MinION : Idéal pour les projets pilotes, la validation de panels ciblés, ou l'analyse de quelques échantillons avec des régions d'intérêt de taille limitée (< 1 Mb cumulé).
  • GridION : Solution intermédiaire pour les projets de caractérisation multi-échantillons avec un débit modéré, permettant le multiplexage de plusieurs accessions sur des panels de gènes d'envergure moyenne.
  • PromethION P24 : Plateforme haute capacité pour les projets d'envergure nécessitant l'analyse simultanée de multiples cultivars ou espèces, ou la caractérisation exhaustive de complexes multigéniques étendus.

Applications et Domaines d'Excellence

L'application phare développée à l'EPGV concerne l'étude des clusters de gènes de résistance NLR (Nucleotide-binding site Leucine-rich Repeat), particulièrement complexes à assembler avec les technologies conventionnelles. Les travaux sur le melon ont démontré la capacité du NAS à reconstituer fidèlement ces régions caractérisées par de nombreuses variations du nombre de copies, des polymorphismes présence-absence, et des éléments répétitifs. L'enrichissement obtenu (facteur 4 en moyenne) permet une caractérisation précise de la diversité allélique des gènes de résistance, information cruciale pour les programmes de sélection visant la transition agroécologique.

Le NAS facilite ainsi l'identification et la caractérisation de nouveaux gènes de résistance dans les collections de ressources génétiques, permettant l'établissement de core-collections optimisées maximisant la diversité des NLR. Cette approche accélère considérablement les phases de criblage phénotypique en ciblant les accessions présentant des profils de résistance les plus prometteurs. Par ailleurs, la caractérisation fine des allèles de résistance permet le développement de marqueurs spécifiques pour chaque variant fonctionnel, facilitant l'introgression précise de résistances dans les lignées d'élite. Enfin, l'assemblage précis des régions complexes permet la validation expérimentale de gènes candidats identifiés par des approches de génétique d'association ou de QTL mapping, accélérant le passage de la découverte à l'application.

Le NAS trouve également une application naturelle dans l'étude ciblée de familles multigéniques ou de voies métaboliques spécifiques. Cette approche est particulièrement pertinente pour :

  • La validation fonctionnelle de gènes candidats identifiés par GWAS
  • L'étude de la diversité allélique dans des collections de ressources génétiques
  • La caractérisation fine de QTL complexes impliquant plusieurs gènes
  • L'analyse de régions génomiques sous pression de sélection

Enfin, l'efficacité du NAS pour révéler des variations structurales complexes en fait un outil privilégié pour les études de génomique comparative entre espèces apparentées ou l'analyse de l'évolution de familles de gènes au sein d'un genre ou d'une famille taxinomique.

 

Avantages

  • Contrairement aux approches de séquençage ciblé traditionnelles (capture par hybridation, amplification PCR longue portée, ou approches Cas9), le NAS ne requiert aucune étape d'enrichissement préalable. La préparation standard de librairies ONT suffit, réduisant considérablement les temps de manipulation et les risques de biais expérimentaux.
  • La définition des régions cibles s'effectue par simple fourniture d'un fichier de coordonnées et d'un génome de référence, permettant une adaptation rapide à de nouveaux projets ou l'ajustement en cours d'expérimentation. Cette flexibilité contraste avec la rigidité des panels de sondes pré-synthétisées.
  • La combinaison des lectures longues ONT avec l'enrichissement sélectif permet de résoudre des structures génomiques inaccessibles aux technologies courtes (assemblages fragmentés, résolution ambiguë de duplications en tandem, caractérisation précise d'inversions ou translocations).
  • L'enrichissement significatif (facteur 4 à 70 selon les métriques) permet de réduire drastiquement les coûts de séquençage par rapport à une approche génome entier, tout en conservant la puissance analytique des lectures longues pour les régions d'intérêt.

Limitations et Considérations Techniques

  • Dépendance au génome de référence : L'efficacité du NAS repose sur la disponibilité d'un génome de référence de haute qualité représentatif de l'espèce étudiée. Pour les espèces présentant une forte diversité structurale, l'utilisation de références multiples ou de pangénomes peut s'avérer nécessaire.
  • Gamme de tailles optimales : L'enrichissement est optimal pour des régions représentant 1-2% du génome total. Pour les espèces à génome de grande taille ou les familles multigéniques très étendues, une stratégie de sous-échantillonnage des régions cibles peut être requise.
  • Gestion des éléments répétitifs : La présence importante d'éléments transposables dans les régions cibles peut nécessiter un masquage préalable pour optimiser la spécificité de l'enrichissement, particulièrement dans les génomes de plantes où ces éléments sont abondants.

 

Une expertise Démontrée : Le Projet NLRome

enrichissement_NAS

Profondeur de séquençage NAS sur trois régions cibles représentatives de tailles différentes. (A) Profondeur de séquençage NAS sur les trois régions cibles comparée au reste du chromosome. Les régions cibles (ROI + tampon de 20 kb) sont représentées entre des barres noires en pointillés, tandis que les ROI sont réduites et représentées entre des barres noires pleines. (B) Profondeur de séquençage NAS sur la ROI de la région 01 du chromosome 1 (≈ 173 kb). (C) Profondeur de séquençage NAS sur la ROI de la région 08 du chromosome 5 (≈ 998 kb). (D) Profondeur de séquençage NAS sur la ROI de la région 12 du chromosome 8 (≈ 1 kb). La région 08 contient le cluster Vat, bien étudié. Pour les régions B, C et D, les barres verticales colorées représentent les régions enrichies, tandis que les barres verticales blanches représentent les éléments répétitifs masqués.

Les résultats du projet NLRome illustrent parfaitement les capacités du NAS et l'expertise développée à l'EPGV. Après une première évaluation dans le projet NLRADAPTSEQ,un enrichissement  efficace et l'assemblage précis des 15 clusters NLR présents dans le génome du melon (représentant environ 1,4% du génome total) a été démontré. L'expérience a révélé un enrichissement moyen de facteur 4 par rapport au séquençage WGS, avec une reconstruction fidèle des structures complexes du cluster Vat (un cluster de gène bien documenté), validée par PCR et comparaison avec des séquences de référence Sanger (Belinchon et al. 2025). Cette validation expérimentale a confirmé la robustesse de la méthode pour trois cultivars génétiquement distants (Anso77, Doublon, et Chang-Bougi), démontrant l'applicabilité du NAS même lorsque la référence diffère significativement des échantillons analysés.
L'approche développée sur le melon constitue un modèle méthodologique transférable à de nombreuses espèces d'intérêt agronomique, ouvrant des perspectives importantes pour l'amélioration des plantes cultivées dans un contexte de transition agroécologique où la diversité génétique des résistances constitue un enjeu majeur.

L'implémentation précoce du NAS à l'EPGV témoigne également de la capacité d'innovation de l'unité et de sa volonté d'offrir des solutions technologiques de pointe à la communauté scientifique. Cette expertise technique positionne l'EPGV comme un partenaire privilégié pour les projets nécessitant une caractérisation fine de régions génomiques complexes.

 

Le NAS complète harmonieusement l'arsenal technologique de l'EPGV, s'insérant entre les approches de génotypage ciblé haut débit (tGBS) et le séquençage de génomes complets. Cette complémentarité permet une stratégie graduée selon les besoins :

  • Génotypage ciblé (tGBS) : Analyse de centaines à milliers de marqueurs SNP sur de larges cohortes
  • NAS : Caractérisation approfondie de régions complexes spécifiques (gènes de résistance, QTL, familles multigéniques)
  • Séquençage génome entier : Assemblage de novo ou re-séquençage complet pour la découverte génomique