今年上了一门专业必修课《生物学概论》,是院里面好几位老师分别来上的,我只记得何奕騉老师和张爱兵老师的上课内容了

何奕騉老师讲了他们团队发的一篇Cell的故事经历,非常具有传奇色彩,何老师上课也挺幽默的

Adaptive evolution of the enigmatic Takakia now facing climate change in Tibet00736-5)

张爱兵老师讲的是基因条形码,在最后的最后,他说了句很有意思的话,他认为之后生物学的发展不可能只停留在实验室,这个世界上有这么多的生物实验,不可能每一个都去做一次,然后得出实验,他认为,一个科学实验一定要量化,这一定是未来生物学的发展方向

到这里,我其实想起了在物理学的发展史中,力学(尤其是经典力学)不仅是最早发展起来的分支,更在理论体系、数学建模和可验证性方面达到了极高的成熟度,力学中最基础的物理量:质量、速度、加速度、力、动量、能量,构成了后续几乎所有物理学分支的核心构件

例如,电动力学中也有“动量守恒”“能量守恒”,热力学中有“功”“能量”的概念,这些都起源于力学,力学是最早通过严格的数学语言对自然现象进行系统建模的学科

力学的建模过程清晰明确——定义变量 → 建立方程 → 求解 → 预测结果,与现代自然科学方法论完全一致

力学之所以成为物理学的典范,是因为它奠定了自然科学“用数学形式描述自然规律”的基本方法,是整个现代物理思维的源头

我们经常不难看到网上各种生物从业者的吐槽:

你今天用某种细胞培养液做实验,明天再做,哪怕条件“看起来”一样,结果可能完全不同

实验生物学中一个很根本的问题:可重复性差变量过多结果难以量化与预测

背后有成千上万的微观变量——温度、pH、试剂批次、操作手法、细胞状态……很多你根本无法完全控制,这在物理、化学中几乎是不能接受的,但在生物学中却是常态

生物学中的变量多,而且大多不可用,因为生物体本身就是一个混沌体系,不可能像物理模型一样理想化,你想研究一个基因的敲除对细胞代谢的影响,可能不仅影响代谢,连表观遗传、细胞周期、甚至细胞间通讯也会发生变化

同时生物学过多依赖于经验模型,比如说血浆、抗体等等,用哪种,用哪家公司的,很多时候都靠口口相传或者推荐,没有像牛顿定律那样的“底层方程”可用于预测——这是生物学尚未完全“理论化”的表现

lifescience.sinh.ac.cn

我觉得目前生信其实更像是一个大数据专业,目前测序的成本越来越低,每天都在尝试大量的测序数据,科研人员面对的是数据堆成山的局面,你不分析,它就在服务器里躺着;你乱分析,那就是“伪发现”;只有能构建模型、找到机制、甚至预测疾病的那种分析,才是真的在“消耗数据”

就像互联网公司需要工程师处理用户数据、行为日志一样,生信是在处理实验室产出的“生命数据”。区别是:这些数据复杂得多、不确定性高,分析流程也常常不统一,但本质一样:都是从数据中提取有用信息

大数据专业的终点不是统计,是建模——比如用大模型预测用户行为。而生信的终点,也不该只停在差异分析,而是要建模,比如:

  • 给定患者多组学数据,预测对某种药的反应;
  • 给定一个基因突变,预测它如何影响通路调控;
  • 甚至,像AlphaFold那样,用深度学习直接预测蛋白结构

这其实涉及到生物的产业化发展,其实现在也有,比如说有些生物公司为个人提供服务,给你寄过来一个咽拭子,刮一刮口腔,采集点上皮细胞,寄过去,然后最终返回给你一个结果

是的,我觉得未来生物学的发展,一定是要结合计算机/数学的,在我高中读书的时候,班主任经常说“生物是理科中的文科”,但其实我觉得,并不是这样的,我们在高中学的更多的是一些经验性的东西,或者说,生物学常识,这就和学物理中的常量或者物理量是一样的,但是不幸的是,生物学这些概念性,或者描述性的东西太多了

“生物是理科中的文科”这句话,在很多高中老师那里像是个“共识”,但本质上是教育阶段限制下的误解。高中生物确实偏向记忆与常识,因为要照顾大部分学生的接受能力,也因为生物学背后的真正复杂性,根本不是一张卷子能考出来的

高中学的是“生物学常识”,这就像物理里的“记住重力加速度是 9.8”,但你根本没看到背后是牛顿定律、场论和微积分。生物也一样——

我们学了:

  • 遗传定律,但没学群体遗传学的 Hardy-Weinberg 模型;
  • 学了细胞周期,但没有动力学建模;
  • 知道 DNA 表达成蛋白,但没学调控网络和转录因子的系统调控模型。

这些东西,其实都可以被数学化,也正在被数学化,生物学未来要有前景,是一定要数学化的,一定要量化的,要不然甚至算不上一门正儿八经的科学

这其实就是系统生物学的方向:

系统生物学

它要做的事就是:把一个看似混乱、变量多到吓人的生物体系,抽象出结构、规律和预测模型

力学奠定了自然科学的范式,而生物也必须走这条路,就像当年孟德尔发现遗传定律一样只不过它的“复杂度门槛”更高,必须等到:

  • 技术成熟(测序够便宜)
  • 算力提升(GPU、集群)
  • 方法丰富(统计/深度学习/因果推断)

你会发现,未来学生物的门槛可能会变高而不是变低,因为光会实验已经不够了,还要懂统计、会Python、能跑脚本,甚至要读懂算法原理

而目前,生信是最符合我对生物学前景看法的学科

最后修改:2025 年 07 月 01 日
如果觉得我的文章对你有用,请随意赞赏