当年,华大在发表水稻基因组文章时,还受到吴瑞先生亲自专业指导,在此特别感谢!
生命是一种语言:测序技术的诞生
1953年,随着DNA双螺旋结构的解密,人类开始惊叹于生命密码的神奇。这么简单的分子结构,是如何实现如此复杂生命系统的维系和传递呢?后来科学家们轰然领悟:原来生命密码是一门语言,一门有着高级语法、语义和应用环境的语言!于是,解读这门语言的技术也就随之诞生了。
1964年,美国康奈尔大学的生物化学教授罗伯特∙霍利(Robert Holley)发明了最早的测序技术。他用不同的RNA酶对酵母Ala-tRNA进行酶切,根据反应后产物中的重叠序列间接推导完整序列,最终分析出酵母Ala-tRNA的77个核苷酸序列,Ala-tRNA也因此成为生命科学史上第一条被“解读”的核苷酸序列。这种测序技术叫做前直读法,虽然以现在目光看来,该技术流程繁琐,难以重复,而且无法给双链DNA测序,但此法开创了测序技术的先河。
之后的十余年间,生命科学领域的3个重要技术日趋成熟——分子克隆、凝胶电泳和放射自显影技术。分子克隆技术是将目的DNA片段装入载体(比如质粒),然后把载体转入宿主细胞(比如大肠杆菌)中,通过细胞的扩增、繁殖来获得大量相同的DNA片段。而凝胶电泳和放射自显影技术的联合使用,极大地提高了DNA片段的检测长度、数量敏感度和精准度。基于这三大神技,直接在凝胶上按顺序直观读取DNA序列的测序技术,也就是直读法,便应运而生。
DNA测序技术的奠基人,当属美国康奈尔大学的华人生物学家吴瑞。吴瑞于1970年首创DNA测序方法,又于1971年将引物延伸法(primer extension)用于DNA测序,为日后的Sanger测序法提供了技术基础。此外,吴瑞还是中美生物化学与分子生物学联合招生项目(China–United States Biochemistry and Molecular Biology Examination and Application Program, CUSBEA)的奠基者。在改革开放之初,不少美国大学因为不了解中国学生的素质,对招收中国留学生心存顾虑,吴瑞运用自己在美国学术界的影响力促成了这个项目,使优秀的中国学生能在美国接受先进教育和培训,为中国生命科学领域培养了大批人才。
1975年,英国大神级生物化学家弗雷德里克∙桑格(Frederick Sanger),在吴瑞测序方法的基础上发明了生命科学领域划时代的测序技术——双脱氧终止法(Dideoxy termination method),又称Sanger测序法。两年之后,他利用此技术成功测序出ΦX174噬菌体的基因组序列——这是人类解读的第一个完整的生物体基因组全序列。
桑格被认为是大神级人物,实在是名至实归。他分别在1958年和1980年获得诺贝尔化学奖,是史上第四位两度获得诺贝尔奖,以及唯一一位两次获得化学奖的人。他在37岁的时候就完整测定了胰岛素的氨基酸序列,证明蛋白质具有明确构造,并于三年后首次获得诺贝尔化学奖。而他第二次获得诺贝尔奖,正是因为发明了Sanger法,发明化学降解测序法的沃特∙吉尔伯特(Walter Gilbert)与桑格分享了当年的诺贝尔化学奖,然而化学降解测序法如今已不再使用。桑格因此被称为“基因组学之父”,如今英国剑桥大学的桑格研究所正是以他的名字命名。
与直读法相比,Sanger法明显极具优势:试剂无毒,操作容易,结果准确而稳定。因为这些优点,Sanger法很快风靡全球生命科学实验室,科学家们也开始对破解上帝留给人类的基因“天书”蠢蠢欲动。可以说,1990年正式启动的“人类基因组计划”能顺利开展,Sanger法是关键。如果没有Sanger法,基因组学这个学科就不会这么快发展起来
测序技术自动化
Sanger法的发明带动了基因组学的发展。而之前的三大神技,因为其繁琐的实验操作,影响了测序的效率。因此当时各大生物公司的研究重点,就是改进这些技术,使它们自动化和高效化。直到1986年,也就是Sanger法发明11年后,美国的ABI公司(Applied Biosystems Inc.)拔得头筹,它利用当年发明的四色荧光标记法,改进了电泳技术,并用扫描仪替换了放射性物质的使用,发明了全球第一台商品化的平板电泳全自动测序仪ABI 370A。
此后,ABI公司不断努力,又用毛细管电泳技术替代了原有的平板电泳技术。因为平板电泳技术的测序数量有限,而且制作电泳胶与加样不能自动化,而毛细管电泳技术可以实现制胶和加样的自动化,减少了试剂的损耗,提升了分析的速度,测序数量也更大。
1998年,ABI公司终于推出了ABI Prism 3700毛细管测序仪,它的上样、数据收集、质控、初步分析都实现了自动化,是第一台真正的全自动测序仪。此后推出的升级版ABI 3730机型,更是为人类基因组计划立下了赫赫战功,至今仍然是Sanger法测序仪的主力机型,这一型号测序仪的测序结果被称为“黄金标准”。至此,ABI公司在Sanger法测序时代的霸主地位再也无可撼动。
在ABI公司的王霸之路上,也出现过不少有力竞争对手。例如,美国的LI-COR公司和Molecular Dynamics公司等,但这些对手后来都因种种原因衰落,退出了历史潮流。正所谓“滚滚长江东逝水,浪花淘尽英雄”。而这样的故事,在接下来的测序仪发展历程中,还在不断地上演。
高通量测序技术问世:三雄争霸
2003年,随着人类基因组计划的完成,遗传学研究正式进入了基因组学时代。测序向着更大样本量、更多数据量、更多物种的方向迅速发展。而这些发展方向,最终都是为了改善2个最重要的指标:成本和通量(测序效率)。
第一个人类的基因组,从1990年到2003年,花费38亿美金才完成。就算在2003年之后,用Sanger法测序一个人的基因组,成本也高达5000多万美元。为了降低测序成本,美国国立卫生研究院于2003年发起了“5年内实现10万美元=1个基因组”和“10年实现1000美元=1个基因组”的两步走战略计划,以鼓励开发新的测序技术。
为了提高效率,节省成本,曾参加人类基因组计划的美国科学家克雷格·文特尔(Craig Venter)早在上世纪九十年代就开始用“鸟枪法”进行基因测序,具体做法是把要测序的基因组切成随机碎片,同时对这些碎片进行测序,再将所得的测序结果拼合起来。这种方法就好比让很多人同时乱枪射击森林里的鸟群,在很短的时间内,就可以将林子中的大部分鸟打中。鸟枪法能够成功的核心,是因为IT技术的突飞猛进、特别是超级计算机的广泛应用,使得通过信息技术还原基因组的本来面目成为可能,进而诞生了“BT(生物技术)+IT”的新交叉学科——生物信息学。
在鸟枪法的原理基础上,科学家发明了高通量测序技术,提高单位时间内产生的数据量。2005年第一台商用高通量测序仪454横空出世,由美国的454 Life Sciences公司于2005年开发,后被罗氏收购。2006年英国剑桥的Solexa公司推出基于SBS技术的高通量测序仪,后被Illumina公司收购。Sanger法时代的霸主ABI晚了半个身位,于2007也推出了自己的SoLiD高通量测序仪。
在最初的5~6年间,这三家公司不断地推出新品,刷新各自测序仪通量、读长和成本的记录。这样的竞争一直持续到2010年左右,454 Life Sciences公司和ABI公司的测序仪因为自身的各种不尽人意之处,难逃停产的命运。
这一阶段赢在最后的是Illumina公司。该公司率先进军大型基因组研究中心,抢占了先机。此后它又推出了高通量的HiSeq系列测序仪,通量远超另外2家公司。“三雄争霸”的年代终于结束,Illumina公司成为高通量时代当之无愧的霸主。
(尹哥和Illumina公司的王牌武器:HiSeq系列测序仪)
向人人基因组进军:三国争霸
自从2010年推出HiSeq2000系列测序仪,Illumina便开始在提高通量的道路上高歌猛进,并在2017年使人类基因组测序成本降低到了1000美元,率先实现了“一千美元测序一个人类基因组”的设想。
然而,科技领域从来就不缺挑战者。首先,曾经的失败者454 Life Sciences公司和ABI公司,以一种特殊的形式“联盟”了。454 Life Sciences的创始人乔纳森·罗森伯格(Jonathan Rothberg)创办了新的科技公司Ion Torrent,并于2010年成功推出了当时世上体积最小、检测成本最低的测序仪PGM。同年,Ion Torrent被Life Technologies公司收购。而这家Life Technologies公司,正是由ABI公司与Invitrogen公司合并而成!之后,罗森伯格的团队开发出Proton测序仪,声称一天就能完成人类基因组测序,成本仅为1000美元。可惜技术发展并不尽如人意,在多次跳票后,Proton测序仪如今已经基本退出科研市场,Life公司也随后被Thermo Fisher公司收购。
直到此时,所有的测序仪争霸战还只是发生在美国。2013年后,中国和英国也开始相继加入这个生命技术竞争顶级俱乐部,开始了“三国争霸”的时代。
(尹哥和Ion Torrent公司生产的Proton测序仪)
这还得从美国的Complete Genomics(CG)公司说起。CG公司是个提供测序服务的生物公司,他们测序结果的准确率是业内公认最高的,测序所用的都是自产的测序仪,但他们生产的测序仪概不外售。2013年,中国的华大收购了CG公司,消化其核心技术,并研发出具有自主知识产权的小型测序仪。2015年,华大推出第一代BGISEQ-500测序仪,将人类基因组测序成本降到600美元,这是人类基因组测序价格首次下降到1000美元以内。2018年,华大又推出了T7测序仪,这款仪器一天就能完成60个人类基因组测序,是当今全世界公开发售的通量最高的测序仪。华大测序仪的迅速崛起,让世上又多了一家在技术上可以与Illumina一决高下的机构。
(华大智造生产的BGISEQ-500测序仪)
(华大智造生产的DNBSEQ E测序仪)
(尹哥和华大智造生产的T7测序仪)
测序成本的下降,使更大规模的测序成为可能。一些国家已觉察到了基因大数据的价值,特别是近两年,纷纷推出了若干个国家级别的大人群基因组测序计划。
2018年5月,美国国立卫生研究院(NIH)启动了名为“我们所有人”(All of Us)的人类基因组研究超大队列研究计划。该计划预计在10年的时间完成100万人的基因组测序。而主要使用的技术,就来自美国的两家测序仪公司——Illumina和PacBio。
英国将基因组学比作引领工业革命的蒸汽机,正开展世界最大样本量的“英国五百万人基因组项目”,2018年10月第一期已完成5万人的全基因组,预计2025年完成500万人全基因组测序,同时将基因检测纳入医保。
2019年8月,21个欧盟国家共同签署协议,2022年欧盟要联合起来完成百万人基因组项目的测序,同时要在欧盟成员国内部跨境共享数据。
法国、丹麦、芬兰、新加坡、俄罗斯、阿联酋等国家也纷纷开始启动和开展各自的国别基因组计划,不甘人后
单分子测序的崛起
随着高通量测序的成本不断下探,科学家们对生命本质的探索也在不断深入。其表现之一,就是对更长的基因序列的追求——追求测序技术上长读长技术的突破。
人的基因组是由46条(23对)染色体组成的,而基于“鸟枪法”的短读长拼接方法,始终会有一些区域没有很好的被完整组装。最好的办法,就是直接把整条染色体一次性从头测到尾!现在的技术虽然还没有到如此完美,但也有了本质的突破。美国PacBio公司是单分子测序领域的佼佼者之一。从2010年推出第一台RS单分子测序仪开始,PacBio已经相继推出4款主要机型。但由于该测序仪工艺过于复杂,造成了成本过高和准确率过低的问题。Illumina公司意识到PacBio测序仪的潜力,于2018年底斥12亿美元拟收购这家公司,而在2019年10月,英国监管机构则提议阻止这场收购,原因是“保持该国以及全球测序市场的竞争”。
这就要提一句来自英国的ONT(Oxford Nanopore Technologies)公司了。该公司生产的也是读长超长(比PacBio测序仪读长更长)、通量超大的单分子测序仪,产品最小可以做到U盘大小,特别适合在特殊环境下进行快速测序。同时,该系列测序仪的测序成本也特别低。它们唯一的缺陷就是准确率不够理想,而测序成本相比于短读长技术也比较高。
而中国的华大,则研发了单管长片段读取技术(single tube long fragment reads,stLFR)。它通过巧妙设计,给来自相同DNA分子的短读长测序片段都标记上相同的分子标签(co-barcode),从而把短读长连成了长读长。这种方法在实现了长读长的同时,还保留了高通量测序的低成本、高准确度的优势。
另外一个重要的方向就是单细胞测序。
生命,从单细胞的草履虫到自封“万物之灵”的人类,都是由细胞组成的。拥有相同基因组的细胞,通过不同的基因表达,造就了不同类型的细胞。同时,每个细胞又在正确的时间、正确的位置,与其它细胞共同协作,从而鬼斧神工地构成了有机生命体。要了解生命活动的本质,就需要将测序的“分辨率”提高到“单细胞”的水平。现在大部分的测序,测的是某一块组织或者血液中成千上万细胞共同表达的结果,分辨率很低,而所有研究者都喜欢高分辨率的结果。
在单细胞测序技术发展的短短10年时间,已经涌现出众多的技术。总体趋势正在从单个或者少量细胞的研究,向整个组织中所有细胞类型的研究发展。有些技术甚至已经开始探索真正的“空间单细胞测序”——对单个细胞进行基因测序的同时,还记录了细胞在原组织中的位置信息。如果这个技术最终普及,将能观察到最小像素级别的生命活动!
21世纪注定是生命科学的世纪。超级测序仪争霸战,正是解读生命密码过程中的核心竞争焦点。回顾短短30年历史,它跟其它技术领域的竞争类似,都是被技术浪潮所驱动。长江后浪推前浪,谁都不知道现在的巨头还会称霸多久,也不知道下一个横空出世的后起之秀会是哪位,但它们都将被载入史册,在测序技术的发展史上画上浓墨重彩的一笔!
(以上摘自《生命密码2》)
下面尹哥将盘点全球测序公司,带大家体验测序仪的“争霸战”。
公司:Dover Motion (Danaher)
网站:https://dovermotion.com/
简介:1963年成立。2002年被Danaher收购。
核心技术:Polonator测序仪
是否属于单分子测序技术:否
公司产品:Polonator测序仪
网站:https://www.licor.com/
简介:1971年成立。
核心技术:自动化DNA测序系统
是否属于单分子测序技术: 否
公司产品:Global IR2
网站:https://www.thermofisher.com/
简介:Applied Biosystems 公司于1981年成立,2008年与Invitrogen公司合并改名为Life Technologies公司,2013年被ThermoFisher收购。
核心技术:基于光学模块的连接法测序技术
是否属于单分子测序技术:否
公司产品:5500 W、5500xl W、PRISM 3730测序仪、ABI 370A、AIF/LICOR、373、377、ABI 310、ABI 3700、RISA-384、ABI 3130/ 3130xL/3730xL/3500DX 等
描述:寡聚物连接检测测序( Sequencing by Oligo Ligation Detection, SOLiD)通过荧光标记的8碱基单链DNA探针与模板配对连接,发出不同的荧光信号,从而读取目标序列的碱基排列顺序。
网站:https://www.illumina.com
简介:1998年成立,公司规模≤10000人,美国。
核心技术:基于光学模块的边合成边测序技术
是否属于单分子测序技术:否
公司产品:HiSeq系列、MiniSeq系列、NextSeq系列、NovaSeq系列、iSeq 100等测序平台
描述:Illumina公司于2007年收购了基因测序公司Solexa,进军基因测序市场,目前占据全球基因测序仪80%以上的市场份额。Illumina使用的是基于4-color/2-color光学模块的边合成边测序的测序技术。
公司:Lasergen (Agilent)
网站:https://www.agilent.com
简介:Lasergen公司于2002年成立,2018年被Agilent公司收购。
核心技术:基于光学模块的合成法测序技术
是否属于单分子测序技术:否
公司产品:暂无推出
描述:采用光化学切割技术( Lightning Terminators),基于光学模块的合成法测序技术。