Stage M2, Lille

Vidjil – Algorithmes pour la détection de population de clonotypes hétérogènes dans les leucémies


Contexte

Globules blancs et recombinaisons VDJ

Les globules blancs jouent un rôle clé dans l'immunité. Les lymphocytes B et T sont adaptés aux différentes infections, produisant des anticorps et des récepteurs spécifiques à tel ou tel virus ou bactérie. Pour cela, une partie de la séquence d'ADN des globules blancs est transformé par la recombinaison VDJ, recombinaison donnant des milliards de possibilités différentes à partir d'un répertoire de quelques gènes.

Vidjil et Vidjil-algo

Destinés aux laboratoires effectuant du suivi de leucémie ou des recherches en immunologie, la plateforme Vidjil et l'algorithme Vidjil-algo ont été réalisés en open-source par l'équipe de bioinformatique Bonsai (CRIStAL et Inria Lille) et le consortium Inria VidjilNet en collaboration avec l'hôpital de Lille et d'autres hôpitaux français et étrangers. Le but de Vidjil-algo est d'analyser des séquences ADN contenant des recombinaisons V(D)J et de regrouper ces séquences en clonotypes selon leur recombinaison V(D)J. Vidjil-algo utilise une approche originale à base de k-mers afin d'être extrêmement rapide.

Depuis 2015, Vidjil a analysé des dizaines de milliers d'échantillons de patients et est utilisé dans de nombreux pays du monde : France, Royaume-Uni, Suède, Belgique, Allemagne, Lithuanie, République tchèque, Italie, Brésil, Japon, Australie, …

SeqOne

Ce stage se déroulera en collaboration avec l'entreprise montpelliéraine SeqOne, qui finance le stage, mais dans les locaux de l'équipe Bonsai, à l'université de Lille.

SeqOne Genomics est une plateforme SaaS dédiée à l'aide au diagnostic génomique pour les biologistes des laboratoires de biologie médicale, particulièrement dans les domaines des maladies rares et du cancer. Elle couvre l'intégralité du processus d'analyse des données de séquençage, depuis les données brutes jusqu'à l'interprétation clinique. La plateforme intègre des outils bioinformatiques avancés, comme la détection des inversions FLT3-ITD en hématologie et l'intégration des séquences ALU pour l'oncogénétique. SeqOne offre également une intelligence artificielle explicable (xAI) qui assiste les biologistes dans la recherche rapide et précise d'un diagnostic, tout en assurant une traçabilité conforme aux exigences des laboratoires.

SeqOne propose un catalogue d'applications bioinformatiques spécialisées, conçues pour répondre à des besoins médicaux spécifiques. Chaque application inclut des outils de visualisation et des pipelines bioinformatiques optimisés, que ce soit pour l'analyse WES ou WG dans le cadre de diagnostics de maladies rares, ou pour l'analyse de l'ARN en oncologie.


Objectifs

Au cœur de Vidjil-algo se trouve une heuristique efficace s'appuyant sur des algorithmes de comparaison à base de k-mers qui permet de regrouper dans un même clonotype des séquences provenant d'une même population de lymphocytes, sans réaliser d'alignement. Néanmoins, sur certaines populations de lymphocytes, cette heuristique présente ces limites et peut être amenée à regrouper des sous-populations différentes au sein d'un même clonotype.

Ce stage a pour but de proposer et implémenter une heuristique efficace afin de séparer des sous-populations différentes rassemblées au sein d'un même clonotype.

  • comprendre l'heuristique actuelle de Vidjil-algo et ses limites
  • échanger avec des hôpitaux ayant des données pertinentes afin de comprendre les sous-populations d'intérêt dans leurs cas d'application
  • utiliser le prototype déjà existant qui permet d'identifier certaines sous-populations, identifier ses lacunes et proposer des améliorations
  • implémenter l'heuristique au sein de Vidjil-algo (en C++)

Compétences et qualité du code

Compétences souhaitées: développement agile (git/gitlab, tests), Python, C++.
Des connaissances sur les algorithmes à base de k-mers serait un plus.

Le code sera écrit avec grand soin, documenté et testé. En cas de succès du projet, les développements effectués seront validés par les équipes hospitalières avec lesquelles nous travaillons et déployés pour tous nos utilisateurs.



Possibilités de poursuites

SeqOne et l'équipe Bonsai souhaitent proposer une thèse CIFRE en lien avec ce projet. SeqOne a également régulièrement des postes d'ingénierie.