Maîtriser l’application web Vidjil:
Analyser et interagir avec les clones

15 juillet 2016

Le but de cette session pratique est d’apprendre les moyens usuels de visualiser, filtrer, analyser et regrouper les clones de l’application web Vidjil. Ces clones ont pu être calculés avec l’algorithme de Vidjil ou par n’importe quel autre algorithme.

0. Connectez-vous au serveur public (https://app.vidjil.org), soit avec votre compte ou avec le compte de démonstration (demo@vidjil.org / demo), séléectionnez le patient Demo LIL-L3 patient, et cliquez sur le lien en bas à droite “see results : multi”. L’application web Vidjil s’ouvre.

1 Évaluation de la qualité d’un run et de l’analyse

1. Connect to the public server (https://app.vidjil.org), either with your account or the demo account, Chargez les fichiers (Demo LIL-L3)

Le pourcentage de reads analysées peut varier de 0,01 % (voire moins, pour du RNA-Seq de la capture) à 98–99 % (pour des séquençages de très bonne qualité, généralement sur séquenceurs Illumina)

2. Combien de reads ont été analysées dans l’échantillon en cours ?

Nous allons essayer de comprendre pourquoi certains reads n’ont pas été analysées dans notre échantillon. Cela pourrait refléter un problème pendant le protocole de séquençage... ou être normal. Nous cliquons sur le « i » dans la partie en haut à gauche pour accéder à la boîte d’information sur l’échantillon en cours.

3. Quelle est la longueur moyenne des reads sur les IGH ? et sur les TRG ? Les lignes commençant par UNSEG donnent les raisons pour lesquelles certains reads n’ont pas été analysées.

4. Quelles sont les causes majeures expliquant que les reads n’ont pas été analysées ? Regardez aussi la longueur moyenne des reads non analysées. Observez-vous quelque chose de particulier au niveau de la longueur moyenne de ces reads ?

2 Filtre des clones

Par défaut, Vidjil affiche les 50 clones les plus abondants (top 50) pour chaque échantillon ou point de MRD. Avec 5 points de suivi, nous pouvons donc avoir entre 50 et 250 clones observables, tout dépend si le top 50 reste le même pour tous les points ou s’il varie. Ce nombre minimum peut être augmenté en allant dans le menu filter et en poussant vers la droite le curseur.

5.  Observez comment change le pourcentage des petits clones IGH (« smaller clones »). Quelle était la valeur initiale ? Quelle est-elle maintenant ? Les « smaller clones » correspondent aux clones qui n’ont pas été complètement analysés car ils ne sont jamais parmi les plus abondants.

Considérez le premier clone réel de la liste. C’est le plus abondant. Il serait intéressant de pouvoir le taguer pour s’en souvenir plus tard.

6. Cliquez sur l’étoile à côté de ce clone et choisissez une couleur de tag. Observez comment cette couleur s’applique sur les autres visualisations.

Lorsque des clones ont été tagués, il est ensuite possible de les filtrer selon les couleurs choisies.

7. Dans la partie en haut à gauche, cliquez sur le carré gris (à droite de la liste des carrés de couleur). Que se passe-t-il ? Et si vous recliquez encore ?

C’est un moyen de filtrer certains clones. Cela peut être utile si vous voulez vous focaliser sur quelques clones spécifiques. Il est également possible de filtrer ces clones, soit par leur nom, soit par leur séquence d’ADN.

8. Dans le champ de recherche, entrez la séquence GGAGTCGGGG et validez la recherche par la touche Entrée. Combien de séquences ont été retirées ? À noter, la recherche se fait à la fois sur les brins sens et antisens.

9. Vérifiez si cela est vrai en recherchant maintenant la séquence réverse complémentaire : CCCCGACTCC. Trouvez-vous le même résultat que précédemment ?

10. Comment pouvez-vous annuler ce filtre et revoir l’ensemble des clones ?

Une autre façon de taguer un clone spécifique est de le renommer.

11. Double-cliquez sur le nom d’un clone (parmi la liste des clones) et lui choisir un autre nom (comme par exemple « clone principal »). Validez cette action par la touche Entrée.

Après ce renommage, vous pouvez voir que ce clone est déjà sélectionné.

12. Cliquez sur plusieurs clones en maintenant la touche Ctrl enfoncée pour conserver la sélection. A chaque ajout d’un clone, sa séquence apparaît dans l’encart du bas.

13.  Combien de clones ont été sélectionnés ? Combien de reads cela représente-t-il ? (Regarder à droite dans l’encart du bas.)

14. Quand vous voulez vous focaliser sur des clones sélectionnés, vous pouvez cliquer sur le lien (focus) sur la droite de l’encart du bas (à droite du nombre de clones sélectionnés). Cela est pratique lorsque vous souhaitez analyser quelques clones parmi de nombreux autres sans être gêné par ces autres clones.

15. Pour retirer ce focus, cliquez sur la croix située à droite du champ de recherche.

16. Pour tout désélectionner, vous pouvez cliquer sur une zone vide de la grille des clones.

3 Analyse des populations clonales

3.1 Regroupement de clones (« merge ») par l’inspection de leur séquence

La première chose à faire est de voir si certains clones peuvent et doivent être « regroupés » (du fait d’erreurs de PCR ou de séquençage). Cette étape peut être automatisée mais cela n’enlève pas la nécessité d’une vérification de ce regroupement par un œil expert.

Par défaut, dans l’encart de visualisation graphique des clones (« grille »), les clones apparaissent classés selon leurs gènes V et J ou plus généralement selon les gènes 5’ et 3’.

17. Identifiez dans la grille les clones avec la recombinaison IGHV-3-11-IGHJ6 et sélectionnez-les. Vous pouvez utiliser la touche Ctrl, mais aussi les sélectionner en dessinant un rectangle autour des clones souhaités en maintenant le bouton gauche de la souris appuyé.

Les séquences des clones apparaissent désormais dans l’encart du bas (« segmenteur »). Si beaucoup de clones ont été sélectionnés, il est possible de voir toutes les séquences en faisant glisser la souris dans le segmenteur (l’encart s’agrandit). Les séquences dans ce segmenteur peuvent être comparées visuellement mais il est aussi possible de les aligner pour voir plus facilement les similarités.

18. Cliquez sur le bouton align dans la partie en bas à gauche. Les différences sont mises en exergue par un changement de style (gras et couleur brique).

Il en va de l’expertise de l’utilisateur et du cas d’utilisation pour déterminer si le degré de similarité entre les clones du segmenteur est suffisant pour un éventuel regroupement. Si certaines séquences ne semblent pas suffisamment homologues, vous pouvez les retirer du segmenteur en cliquant sur la croix devant la séquence (partie à gauche du segmenteur).

19. Retirez toutes les séquences qui ne sont pas assez proches de la première.

Maintenant toutes les séquences du segmenteur doivent être hautement similaires. Les différences observées ne doivent être dues qu’à des erreurs de séquençage ou de PCR. Ces artefacts (mutations, homopolymères, insertions, délétions) sont dépendants du séquenceur utilisé et de la technique de PCR.

20. Regroupez tous les clones en un seul en cliquant sur le bouton merge puis sur le bouton align.

Toutes les séquences ainsi regroupées apparaissent sous un seul et même clone. Dans la liste des clones, c’est repérable : le clone qui contient les sous-clones apparaît avec un + sur la gauche. Vous pouvez cliquer sur ce + pour avoir la liste des sous-clones qui compose le clone issu du regroupement.

21. Cliquez sur le + et observez les changements dans la grille.

Comme vous avez pu le constater, les sous-clones apparaissent encore sur le graphe. Vous pouvez encore les comparer si vous le voulez (par exemple pour vérifier si le regroupement est correct ou non) et si nécessaire vous pouvez toujours retirer certains sous-clones du regroupement par la croix à gauche de la liste.

22. Juste pour l’exercice, retirez le dernier clone de la liste du segmenteur.

3.2 Autres paramètres et analyses des clones

Pour déterminer les homologies de séquences, nous avons utilisé les gènes V et J. Toutefois, il existe d’autres façons de rechercher les similitudes entre les séquences, parfois plus pertinentes. De même, vous pourriez vouloir afficher d’autres paramètres de visualisation de la population lymphocytaire. Pour l’exemple, nous allons afficher les clones selon les gènes V versus la longueur des N insérés.

23. Dans le menu plot (coin haut gauche de la grille), dans le champ preset, sélectionnez V/N length. Vous pouvez continuer de regrouper les clones en les alignant puis en cliquant sur merge si besoin.

24. Vous pouvez aussi utiliser le preset clone consensus length/GC content qui a tendance à bien séparer les clones distincts.

Notez que vous pouvez modifier directement les axes du graphe, en ouvrant le menu plot et en sélectionnant les axes x et y. Dans la visualisation en histogramme, la taille des rectangle dépend toujours de la taille des clones, et l’axe y règle l’ordre des rectangles pour chaque même x.

25. Dans le menu plot, changez la représentation des clones en bulles par celle en histogramme. Que se passe-t-il en mode histogramme lorsque vous passez la souris sur les bâtons ?

Une autre façon de visualiser les clones est de demander à Vidjil de classer les clones selon leur degré de similitude (distance).

26. Dans le menu plot, sélectionnez maintenant l’option plot by similarity ou plot by similarity and by locus pour afficher les clones d’un locus donné selon leur degré de similitude. Ainsi, les clones présentant une très forte homologie sont à proximité les uns des autres. Il est théoriquement impossible d’avoir ce type de représentation en deux dimensions. Il est donc possible que deux clones non similaires soient très proches ou inversement que deux clones similaires soient très éloignés l’un de l’autre.

27. Appuyez sur les touches 0 à 9 du pavé numérique. Que se passe-t-il ?

Il existe encore une autre façon de vous aider dans l’analyse de vos données. Vous pouvez changer les couleurs à l’aide du menu color by pour mettre en exergue certains paramètres.

28. Choisissez d’abord dans le menu plot de la grille la visualisation plot by similarity and by locus. Puis, dans le menu color by, sélectionnez N. Nos excuses aux daltoniens, puisque les couleurs ne sont pas encore bien différentiables. Les clones qui sont proches sur la grille avec une même couleur sont probablement similaires.

En utilisant ces différentes fonctionnalités, vous devez être capables d’évaluer le degré d’homologie de vos séquences et potentiellement de regrouper des clones si vous le souhaitez.

Cette partie est spécifique aux échantillons analysés avec l’algorithme Vidjil.

Certains clones peuvent être moins fiables que d’autres... Voyons comment les repérer.

29. Dans la liste des clones, recherchez des clones qui ont une alerte orange à droite. Cliquez sur l’alerte. À quoi sont dues ces alertes ?

À l’heure actuelle, il peut y avoi deux raisons :

Vous pouvez voir ces valeurs sont visibles pour chaque clone en cliquant sur le i à droite des séquences dans la liste des clones.

3.3 Analyse des recombinaisons de plusieurs locus

Si vous voulez vous concentrer sur un locus spécifiquement, vous pouvez cliquer sur le nom du locus dans l’encart en haut à gauche. Un clic fera disparaître le locus (en grisé), un second le fera réapparaître (en couleur). Si vous maintenez la touche Shift (généralement au-dessus de la touche Ctrl de gauche) pendant que vous cliquez sur le nom d’un locus, cela cache les autres locus.

30. Cliquez sur IGH tout en appuyant sur la touche Shift. Quel est maintenant le nombre de reads analysées ? Pourquoi a-t-il changé ?

31. A présent, cliquez sur TRG pour les montrer à nouveau.

32. Appuyez sur la touche G, que se passe-t-il ? Appuyez maintenant sur la touche H puis à nouveau sur la G (vous pouvez faire ces alternances de touches autant de fois que vous le souhaitez). Continuons avec le locus TRG.

Vous pouvez aussi changer le locus actuel en cliquant sur le nom d’un autre locus à droite de la grille.

3.4 Suivi temporel des clones sur plusieurs échantillons

Le graphique en haut à droite, le graphique temporel, montre l’évolution des clones les plus abondants (figurant au moins dans le top 10) de chacun des échantillons (ou points) de l’analyse. Notons que par souci de lisibilité seules 50 courbes sont affichées au plus.

33. Passez la souris sur les bulles dans la grille ou au niveau des lignes du graphique temporel. Que se passe-t-il ?

34.  Dans le graphique temporel, cliquez sur le titre d’un échantillon pour le sélectionner. Que se passe-t-il au niveau du nombre de reads analysées ? et sur la taille des clones principaux ?

Quand vous changez d’échantillon, les visualisations se mettent à jour dynamiquement pour faciliter le suivi. À noter, le nombre de reads analysées diffèrent à chaque point. Nous pouvons encore regarder la raison pour laquelle certains reads n’ont pas été segmentées.

Nous allons maintenant regarder comment la distribution des gènes V évolue au cours du temps.

35. Dans la grille, sélectionnez le preset V distribution. Ensuite cliquez sur l’icône play dans l’encart gauche haut (sous le bouton « i »).

Vous pouvez ainsi observer comment la distribution des gènes V évolue au cours du temps (à chaque point). Bien sûr, vous pouvez aussi changer les données (axes) de la grille et suivre l’évolution d’autres paramètres.

Rappelons que par défaut au plus 50 clones sont visualisés sur le graphique temporel, alors que les 50 clones les plus abondants de chaque échantillon sont affichés dans le reste de l’application.

36. Sélectionnez un échantillon, classez la liste par taille (size) et passez la souris sur la liste du top 50 (50 clones les plus abondants). Regardez bien le graphique temporel, que se passe-t-il au bout d’un moment ?

Dans le cas où vous avez plusieurs échantillons, il est possible de les réorganiser.

37. Cliquez sur le titre d’un échantillon et maintenez le bouton de la souris enfoncé pour le faire glisser et le déplacer.

38. Faites la même chose sur un autre échantillon, en le faisant glisser au niveau de l’icône en forme d’épingle. Cela permet de cacher l’échantillon.

Vous pourriez aussi vouloir comparer deux échantillons, par exemple pour vérifier un réplicat, rechercher des contaminations, ou comparer différentes recherches ou situations médicales.

39. Dans le menu color by, choisissez by abundance. Sélectionnez un autre échantillon. Que se passe-t-il ? Certains clones présentent-ils une concentration significativement différente entre les deux échantillons ? Modifiez la couleur en choisissant by tag.

Une autre option pour comparer les échantillons est de se placer directement en représentation log-log.

40. Dans le menu plot, sélectionnez le preset compare two samples. Cliquez successivement sur deux titres dans le graphique temporel pour sélectionner les échantillons à comparer. Existe-t-il encore des clones avec une différence de concentration significative entre les deux échantillons ?

3.5 Les désignations VDJ

Pour certaines études, les désignations VDJ sont très importantes. Dans la liste et dans le segmenteur, ces désignations sont écrites de manière concise afin de gagner de la place.

41. Positionnez le curseur de la souris sur un des clones. La désignation complète de la séquence apparaît dans la barre de status, entre la grille et le segmenteur.

Nous pouvons vérifier cette nomination par deux moyens.

42. Sélectionnez quelques clones.

43Cela nécessite une connexion internet Cliquez sur le triangle à droite du bouton IMGT/V-QUEST dans la partie en bas à gauche. Les séquences des clones sélectionnés sont envoyées à IMGT/V-QUEST.

44. Ensuite, cochez la case 5’V/D/3’J. Dans le segmenteur, les jonctions V(D)J qui ont été définies par IMGT/V-QUEST sont soulignées.

45. Vous pouvez aussi envoyer directement les séquences sur IMGT/V-QUEST ou IgBlast en cliquant sur le bouton portant leur nom respectif.

Il arrive parfois que Vidjil fasse des erreurs dans la désignation VDJ. Dans ce cas, vous êtes fortement invités à nous en faire part et nous essaierons d’améliorer l’alogorithme de désignation. Vous pouvez aussi changer le nom par celle vue sur le site web.

46. Dans la liste des clones, cliquez sur le « i » à droite du clone dont vous voulez changer le nom. Dans la partie Segmentation, cliquez sur le bouton edit. Faites-les modifications souhaitées.

Attention : aucune des modifications effectuées (changement de nom, regroupement de clones, apposition de tags) ne sont sauvegardées automatiquement. Il faut le faire manuellement soit en cliquant sur save patient dans le menu tout en haut à gauche (là où le nom du « patient » est écrit), soit avec le raccourci clavier Ctrl+S. Cependant, pour ce jeu de démonstration, il n’est pas possible de faire de sauvegarde. Vous pourrez en revanche sauvegarder les échantillons qui vous appartiennent !

4 Export de données

47. Pour générer des rapports imprimables, dans le menu import/export, cliquez sur les deux entrées commençant par export report. Quelles sont les différences entre les deux ?

48.  Sélectionnez quelques clones. Ensuite, dans le menu import/export, choissisez export fasta. Que se passe-t-il ?

Aurélie Caillault, Mathieu Giraud, Tatiana Rocher, Mikaël Salson
contact@vidjil.org