#thread #bioinformatique #assemblage
- Le séquençage c'est ce qui permet de lire la séquence ADN, mais on ne peut lire que des petits morceaux et on sais pas ou on lis du coup on est un peut embêté pour comprendre ce qu'on a lue
Quand dans le graphe on arrive dans une répétition on sais pas par ou sortir.
On fais des fragments encore plus petit qu'avec la technique Sanger (45 à 400 bases), on fais une erreur tout les 100 a 1000 bases. Mais c'est beaucoup plus rapide, sa coute beaucoup moins chère. Du coup tout le monde en a fais.
On fais des fragments bcp bcp + long (jusqu'a 60.000 bases), mais sa coute un plus chère mais le vrais pb c'est qu'on fais plus d'erreur entre 15 % et 30 %
Imaginé vous entrain de lire un livre et de ce trompé 15 fois tout les 100 lettres.
C'est ce constat qui a poussé Sergey Koren et Adam MPhillippy a écrire en 2015 un article
En gros ils dissent qu'étant donnée que les répétitions chez les bactéries sont plus petites que les reads de 3 ème génération
Pour résumé "Les gars les biochimistes on résolue le problème, il y a quoi d'autre a faire ?"
Sauf que c'est pas tout a fais vrais il reste des cas ou sa ne marche pas.
"Pourquoi l'assemblage des génomes bactériens avec des reads de 3ème générations n'est pas résolue alors qu'il devrait !"
"C'est pas le vrais sujet il est beaucoup plus tarabiscoté que sa en vrais !" @nmarijon Part En Thèse #uneBonneThèseCiteCesSource
#Thésolie #bioinformatique #vulgarisation
@threadreaderapp unroll please !