您现在的位置: 首页 > 营销资讯营销资讯
浪潮专家解读:HPC如何协助解析新型冠状病毒基因组
发布时间:2020-03-10作者:青鸾传媒来源:全网营销点击:
一场新型冠状病毒肺炎疫情,牵动举国上下。在广大的医务人员奋战一线的同时,一大批“科技力量”也加入了抗击疫情的最前线。
在未知病毒以“不明原因肺炎”进入公众视野时,科研人员已经开始尝试破译病毒的基因数据。病毒基因组,是病毒的生命密码。借助于分子生物技术,病原学专家通过对病毒标本进行测定,这样的破译,最早在 2020 年 1 月 2 日就已完成。随后,中科院武汉病毒所、中国疾控中心病毒所、上海市公共卫生临床中心分别于 1 月 2 日、 1 月 3 日、 1 月 5 日凌晨,获得病毒全基因组序列。
那么,病毒基因究竟是如何被一步步解析的?这其中高性能计算(HPC)平台又起到什么样的作用?来看看浪潮生命科学行业方案专家的解读。
Q:能否举例子介绍一下新冠病毒基因是如何被测定和解析的?
目前,在获取病毒基因组序列方面,广泛应用高通量测序技术来完成,这种方式是将核酸序列打断成短片段进行测序,通过分析软件将测得的短序列进行拼接组装。对于新发病毒,在序列组装过程中会面临更多难点,因为在测序深度、测序准确性、重复序列比例等方面没有可供参考的经验值,这就需要将海量的短序列还原出原始的基因组序列。在序列拼装中还可能会出现测序错误,拼接的准确性和完整性不高,拼接难度更高。所以,解析新冠病毒序列,需要在建库、高通量测序、序列组装、变异进化分析等多个流程加以管理。
新冠病毒序列组装解决方案示意
比如在建库环节中,对核酸含量高的样本进行rRNA去除再建库,提高有效数据占比;对核酸含量低的样本,直接进行RNA建库,减少核酸损失,提升建库成功率,并加大测序深度。在测序环节采用更高效专注的测序仪,最后,通过病原鉴定系统对新冠病毒序列进行数据分析并采用IDBA方法完成拼接。这样可以满足宏转录组测序病毒序列组装对数据量的要求,保证序列信息的完整性。
我们来还原一下某疾控中心收到的 1 例新冠病毒肺炎疑似样本,解析新型冠状病毒感染病例呼吸道标本宏转录组测序及病毒序列组装的流程:
病毒全基因组序列获取流程