Dans ce thread, je vais vous parler un peu de mon parcours et comment j'en suis arrivée à faire de la bio-informatique. Il y a deux types de bio-informaticien : les bio-informaticiens de formation et les bio-informaticiens qui ont appris "sur le tas". Moi, je suis de formation.
J'ai commencé à m'y intéresser en terminale quand il fallait choisir son avenir.
J'aimais bien la biologie, et j'avais commencé à faire un peu d'informatique avec l'option "informatique sciences du numérique" (ISN) qui venait d'être mis en place.
Je me suis dit que j'allais continuer dans ces deux domaines. J'ai donc rejoins l'université de Versailles St Quentin en Yvelines @uvsq pour une licence en Biologie-Informatique.
La licence débute avec les deux spécialités, et au bout du 2ème semestre, il fallait en choisir une des deux. Je n'ai pas voulu choisir, donc je suis partie en double licence biologie et informatique.
Au bout d'un an, j'ai du malheureusement arrêter l'une des deux licences, et j'ai fini mon cursus en licence informatique (je m'étais quand même renseignée avant sur la possibilité de continuer en bio-informatique avec un background informatique).
Ensuite, j'ai choisi de rejoindre le master Bio-informatique à Diderot parce que c'était la seule formation qui me proposait de rejoindre ce cursus en évitant les cours de base d'informatique (le langage C c'est bien, mais au bout d'un moment...).
Je ne vous décrirais pas tous les cours que j'ai suivi, mais j'en ai suivi beaucoup, et c'était très diversifié : de la biologie structurale, du python, de la biologie intégrative, de l'enzymologie, des statistiques, de la bio-informatique structurale et génomique, etc.
On avait accès à la salle de cours le samedi afin d'avancer sur les projets. Ca avait pas mal de succès🥱.
Je me souviens qu'un enseignant avait dit : vous devez tout connaître, mais vous ne devez pas être expert en sortie de master. Et je suis entièrement d'accord avec ça.
Je n'avais jamais travaillé sur les bactéries auparavant, mais je connais les principes d'un assemblage de génome, d'un mapping, d'une phylogénie etc.
D'ailleurs, j'avais (et j'ai toujours) des lacunes en biologie, mais ça ne m'a jamais porté préjudice.
J'ai une chance d'avoir rencontré des biologistes et des bio-informaticiens patient et compréhensif, qui n'ont jamais hésité à m'expliquer des bases et des principes biologiques que j'avais du mal à appréhender.
Un grand merci à eux !
J'ai réalisé deux stages, un en première année de master et un en deuxième année de master.
Lors de mon premier stage en M1, j'ai mis en place un pipeline de prédiction de repliement protéique.
L'objectif est d'obtenir la structure 3D d'une protéine à partir de sa séquence protéique. Pour cela, j'ai utilisé une méthode du laboratoire combinée à @RosettaAtHome et j'ai mis en place tout le pipeline.
La finalité de ce projet était la participation à CASP13 (Critical Assessment of Techniques for Protein Structure Prediction) en 2018 qui est un concours de prédiction de structure protéique international.
En gros, avant de publier une structure de protéine résolue, les chercheurs peuvent proposer la séquence protéique à CASP afin de l'utiliser comme modèle pour les logiciels de prédictions de structure protéique.
Il y a plusieurs catégories, et j'ai participé à la catégorie "serveur". Nous recevons une séquence protéique, et nous avons 3j pour renvoyer la structure 3D de cette protéine.
Avec le pipeline de mon équipe on s'est positionné 1er sur la prédiction d'une protéine !
Je vous met l'image parce que j'en suis très fière 😄
Lors de mon deuxième stage en M2, j'ai travaillé sur un autre sujet : la bio-informatique génomique appliquée à Salmonella Mbandaka et Tyhpimurium. Ma thèse est la continuité de mon stage, donc je ne vais pas m'attarder dessus, ce sera décrit dans un autre thread. 🦠
J'ai fait également un court CDD de 2 mois entre la fin de mon stage de M2 et le début de ma thèse. J'ai étudié la diversité génomique sur une espèce de Salmonelle, Salmonella Dublin, dans deux régions de France.
L'objectif était de comprendre la crise sanitaire qui s'était déroulée il y a quelques années dans ces deux régions avec des données génomiques, et d'aider les acteurs locaux à comprendre leur source de contamination.
J'ai eu des résultats très intéressant, mais qui sont en cours de publication donc je ne peux pas les décrire 🙁Mais sachez que le génome des salmonelles sont remplis d'informations 😉
Ce soir je ferais un thread pour vous présenter mon sujet d'étude : les salmonelles, et plus particulièrement Salmonella Typhimurium et Mbandaka. #StayTuned
• • •
Missing some Tweet in this thread? You can try to
force a refresh
D'autres exemples sur l'utilisation de données WGS en sécurité sanitaire :
Par exemple, les Danois ont découvert qu'ils avaient des persistances géographiques de certains types de génome de S.Dublin. Ils ont donc des souches qui sont sur le sol danois depuis 20 ans et qui continuent de causer des épidémies. C'est fou non ?
En Allemagne, le WGS a permis de séparer 3 clusters du même sorovar assez rare. Les données portaient à penser à une seule source, mais en réalité il y en avait 3.
Aujourd'hui, je vais enfin parler de mon domaine : la bio-informatique génomique en sécurité alimentaire ! Je parlerais (enfin) de ma thèse demain, mais aujourd'hui, je voulais vraiment prendre du temps pour introduire le sujet.
Hier, on a pu voir comment était résolu les enquêtes épidémiologiques. Aujourd'hui, je vais vous montrer qu'est-ce que les données WGS peuvent apporter aux analyses.
Je vous ferais également un petit thread sur les techniques de séquençage un peu plus tard si ça vous intéresse 😉
Petit point serovar : hier je vous ais expliqué ce que c'était un sérovar, mais comment on le détermine ?
l y a plusieurs méthodes afin de déterminer microbiologiquement le sérovar d'une Salmonella. PFGE, PCR...je ne vais pas tous les décrire parce que le thread devient long, mais je vais parler de la méthode de référence utilisé par mon laboratoire d'accueil.
A l'ANSES, on utilise le sérotypage par agglutination. Qu'est-ce que c'est ? En gros, c'est réaction spécifique entre un anticorps présent dans un sérum test et un antigène porté par le microorganisme étudié, comme expliqué dans le schema (crédit : ac-montpellier)
Hello hello,
Aujourd'hui comme annoncé, je vais parler de sécurité sanitaire et de caractérisation des Salmonelles.
Je voulais absolument présenter ça avec un exemple concret, et ça a été difficile de trouver quelque chose de bien décrit et publié officiellement en France.
Je vais donc raconter une investigation de cas groupés de Salmonella datant de 2012. C'est un peu vieux, mais l'investigation a très bien été décrite et je ne risque pas de divulguer des informations sensibles 😅
Pour poser les bases, en France, une toxi-infection alimentaire collective (TIAC) est déclarée lorsqu'il existe au moins 2 cas de maladie avec une symptomatologie similaire, souvent gastro-intestinale. En 2018, 1 630 TIAC ont été déclaré.
Comme promis, voici le thread sur les salmonelles ! Ici, je vais décrire rapidement les salmonelles et les classifications des salmonelles 😉
Alors la Salmonella, c'est quoi ? 🦠
Entérobactérie ✅ Bacilles avec des flagelles péritriches (tout autour de la cellule) ✅Gram négatif ✅ 0,7 à 1,5 μm de diamètre✅Superbe photo coloré d'une Salmonelle en contact avec une cellule✅ (crédit NIAID)
Elle provoque des maladies, comme la fièvre typhoïde chez les salmonelle typhiques, ou la salmonellose chez les salmonelles non-typhiques.
Je vais commencer la journée en vous expliquant un peu ce qu'est la bioinformatique :
Comme @jessica_compbio l'a très bien expliqué, la bioinformatique est une discipline qui se place à l'interface de la biologie et de l'informatique dont l'objectif est de résoudre des problématiques biologiques avec l'utilisation d'outils informatiques .