Question for bioinformaticians! Believe it or not, the first genome of bat virus #RaTG13 had some nucleotides that were supported by zero reads: in other words, the genome didn't match the sequences that were used to assemble it. How is it possible? 1/ #originsofSARSCoV2
Assemblers are computer programs, they do not "invent" nucleotides. So, what happened here? My explanation was that this genome was assembled using other reads, maybe in addition to the ones that were uploaded. 2/
In that case, I expected the authors to upload the missing reads.. Instead they did the opposite: they updated the genome, replacing the nucleotides supported by zero reads with the correct ones. So, the question is: how the heck did they assemble the genome the first time? 3/
Moreover, while they fixed the genome in those positions, at the same time they also added 15 brand new nucleotides at genome start, again with no support in the raw data. #Wuhan Institute of Virology: the place where magic happens! 4/
By the way, if you want to play with the data, you can start from the alignments published by @K_G_Andersen. Please let me know your results, as well as your explanations for these weird issues.. I am curious! virological.org/t/on-the-verac…
• • •
Missing some Tweet in this thread? You can try to
force a refresh
Conspiracist, May 2020: "Look, these sequences in database are dated 2017/2018. So you didn't sequence RaTG13 this year, as you wrote in the paper!" 🔬
Average scientist, May 2020: 😴
Shi Zhengli, July 2020: "Yes, actually we got the sequence in 2018."
2/
Conspiracist, May 2020: "Have a look at these Chinese theses we found on the internet: RaTG13 was found in a #mineshaft were people died of #pneumonia!" 😱
Average scientist, May 2020: 😴
Shi Zhengli, June 2020: "Oh yes we found it there, but.. well, the cause was a fungus"
3/
Ora, è vero che a Wuhan facevano chimere a scopi di ricerca, ma questi due virus sono troppo diversi da SARS2 per essere i suoi antenati diretti. 2/
Il nuovo #coronavirus infatti ha una similarità dell'87% con questi due virus, troppo poco per essere il risultato di una loro ricombinazione (il virus più simile a SARS2 è #RaTG13). 3/
Il modello di @istsupsan che ha guidato le decisioni del governo sulla fase 2 è un modello SIR stocastico strutturato per età. Uno dei punti di partenza è questa tabella, che quantifica i contatti medi degli italiani in base a età e luogo del contatto. 1/
La suddivisione dei lavoratori in base al settore di attività (es. edilizia, manifattura) si basa su dati INAIL. Il modello fa molte assunzioni: ad esempio ipotizza che i contatti nel tempo libero passino dal 10% (dati Google) al 34% in caso di apertura di bar e ristoranti. 2/
Le simulazioni prevedono due modalità di trasmissione della malattia: uno immagina che siamo tutti ugualmente suscettibili all'infezione, l'altro ipotizza che gli anziani siano più suscettibili della fascia 15-64, che a sua volta è più suscettibile dei bambini. 3/