目前,与新冠病毒基因组序列最相似是从菊头蝠分离得到的RaTG13,其与新冠病毒的进化分歧大约发生在50年前。此后,直到疫情暴发前,新冠病毒已经积累了500多个突变。
中国科学院遗传与发育生物学研究所钱文峰研究组提出一种新的溯源策略——通过鉴定新冠病毒这500多个突变的频谱特征推测新冠病毒的历史宿主。作者首先确认了这一策略运用所需要满足的三个前提假设:第一,细胞环境在不同宿主之间存在差异,会在其携带的病毒基因组上产生宿主特异性的突变;第二,病毒基因组的新生突变主要是由宿主细胞内环境造成的;第三,病毒在进化中积累的突变特征主要是由新生突变决定的。
作者们在建立了该策略的理论基础后,构建了非典病毒、中东呼吸综合征病毒、新冠病毒以及与其相关的16种冠状病毒的进化树。这些病毒是前人从人、蝙蝠、骆驼、果子狸、穿山甲和刺猬等不同物种中分离得到并测序的。作者们鉴定了病毒进化历史上不同时期积累的突变,发现来源于不同宿主的病毒带有不同的突变特征。宿主物种的差异越小,病毒的突变特征越相似。这一结果进一步确认了根据突变特征推测历史宿主这一计算生物学策略的可行性。
为了推测新冠病毒的进化历史,作者们对新冠病毒在这段时间产生的突变特征开展了主成分分析,发现新冠病毒在疫情暴发前积累的突变特征与野生蝙蝠(尤其是菊头蝠)细胞环境高度相符,这为新冠病毒的自然起源提供了公开透明和实证性的数据支持。
上述研究结果于2021年8月30日在线发表于The Innovation杂志(DOI:10.1016/j.xinn.2021.100159)。博士研究生单科家与魏昌硕为该论文共同第一作者,郇庆副研究员与钱文峰研究员为共同通讯作者。该研究得到了国家自然科学基金委的资助。