第一章
信息革命对生物学研究的影响

在我看来,21世纪最具颠覆性的创新将发生在生物与科技的交叉领域。就像我们迎来数字时代一样,另一个崭新的时代刚刚开始。

——史蒂夫·乔布斯

沃尔特·艾萨克森的《史蒂夫·乔布斯传》

信息革命强大的变革力量深刻影响了所有行业,长远改变了全球经济、政治与社会格局。在各个科学领域中,物理学、天文学与大气科学最早获益,自20世纪60年代起便直接受益于大型计算机和超级计算机的发展。半导体电子、个人电脑与互联网的发展进一步加速了信息革命,促成了最令人瞩目的科技进步。这些具有历史意义的创新成果成了生物科学、生物技术与制药行业的催化剂,为这些行业带来了惊人的创新技术能力。

生物领域的科学进步高度依赖于新技术和新设备的发展,依赖于分辨率、精度、数据采集与产生能力的不断提升。在表1—1中,我们以10年为单位,总结了影响生物领域的里程碑式技术创新事件。

表1—1 里程碑式技术创新事件(以10年为单位)

在20世纪的大部分时间里,生物学研究都借助物理学设备来观测细胞与大分子结构,并测量原子尺度的尺寸。在前数字时代,科学家用纸张或磁鼓、磁带、X光片、照片等物理介质记录实验观测和实验数据。接着,基于微处理器的计算实现了从模拟数据到数字数据的转换,随之而来的是半导体电路上的随机存取存储器。这些技术带来的数字化数据流和千万亿字节级数据存储对现代科学至关重要,它们不仅帮助研究人员跟上了信息洪流的步伐,还带来了网络科学和研究数据广泛共享的可能性,而后者正是科学进步的基本特征。

进入21世纪,信息革命对生物学的影响有增无减。指数级提升的算力衍生出辅助数据获取、分析与可视化的复杂软件,并实现了大规模高速数据通信。许多诞生于这个时代的新学科都受益于高分辨率计算技术与工具的产生。其中,最为重要的成果包括:DNA合成与测序设备为基因组学和计算生物学奠定了技术基础,功能性磁共振成像催生了计算神经生物学,冷冻电子显微镜、核磁共振和超分辨率显微镜带来了结构生物学,几种计算密集型光谱技术(例如基质辅助激光解吸电离飞行时间质谱法、表面等离激元共振和高性能计算)打开了计算药物发现领域的大门。同样,20世纪物理学突破与计算技术的应用诞生了一系列成像技术,它们促进了医学领域的发展。

信息革命让生物学实现了从“数据匮乏”到“数据丰富”的转变,并带来了出人意料却又极其重大的影响:它引发了一场范式变革,让生物学成了定量科学。生物科学和生物医学研究已从数据科学、数学和工程工具中受益,它们共同推动了“大科学”的实现。这包括人类基因组、蛋白质组和微生物组项目[1][2][3];美国脑计划和欧盟脑计划[4][5];其他国际项目,例如癌症基因组图谱与国际癌症基因组联盟[6][7];政府支持的人口健康与精准医疗项目,例如美国百万人全基因组数据库计划,英国生物银行与十万亚洲人基因组测序项目GenomeAsia 100K。[8][9][10]信息革命创造了定量方法,定量方法实现了“大数据”的管理与分析,并最终推动了“组学”技术,尤其是基因组学、表观基因组学、蛋白质组学和代谢物组学的发展。

在这一章中,我们将探讨信息革命对生物学研究的影响。计算对工业的巨大影响也被称为第三次工业革命,所以本书还将深入剖析第四次工业革命[11]——物联网的高度互联传感器、机器学习与人工智能、生物技术、数字制造等技术正在共同创造未来。在接下来的几十年里,这些引发第四次工业革命的技术将带来计算生物学。与银行业、制造业、零售业和汽车行业已经经历的经济转型类似的是,拥抱即将到来的创新热潮将为制药业带来巨大的回报。