Will self-driving ‘robot labs’ replace biologists? Paper sparks debate
自驱动的机器人会取代生物学家吗?
在去年的暑假我去做了开源之夏的实习,然后不知道的朋友可能觉得我做的就是 Agent 的开发,但其实我做的工作其实和 Agent 的关系并不是很大,当时的很多工作叫 Workflow 可能更合理,就是在特定的位置调用一些工具,然后做上下文注入或者是做 RAG,当时我的工作很简单,就是把当时一些主流的平台,比如说 Dify,Coze,FastGPT 这些平台给聚合在一起,通过一个统一的网关进行管理,管理调用,日志等等
所以我一直认为,这段经历叫作 Agent 开发并不合理,应该叫作基础设施维护,Agent 和大模型都跑在云上,就和人住在房子里一样,自然需要人去打扫卫生,开窗等等,在我读大学的三年中,其中两年半都在做类似的训练或者是工作
去年5月份的时候,当时我和吉吉在开发一个应用的后端,当时还在用 Claude Sonnet 3.5 好像是,当时 GitHub Copilot 给了 Pro 用户不少的额度,平时拿来做代码补全或者是 Ask 模式绰绰有余,当时 Agent 模式写代码并没有现在这么成熟,更多的时候是旁边有一个窗口,然后你和它对话,它给你代码,然后又复制粘贴进去,我当时印象很深的是,我们在后端用了一个 Redis 作为缓存,但是我当时没有设计好,我觉得缓存的效率即便是命中了似乎效果也不是很好,然后吉吉当时也没有给出很好的解决方案,我就和 Copilot 对话,我说你要给我解决!然后它就给我解决了!而且确实速度比我实现的要快得多!
另外一个有趣的经历是我参与到一个 MCP 的开发中,去年的11月,当时我就有点感觉到,我在做的一些工作,写脚本也好,写MCP也罢,其实都是在给大模型造工具,到后来我们都不手写代码了,都开始用 Claude Code 或者是 Cursor 来写工具了,更抽象的是在A/提出 SKills 这个概念的时候,里面内置了一个 skills-creater 这个 Skills,也就是说你可以用一个 SKills 去写另外一个 Skills,这种就有点像编程语言里面的自举了,或者可以理解为,左脚踩右脚上天,Agent 开始自进化了
今年三月份的时候,Minimax 推出了自己的 M2.7 模型,虽然我非常不喜欢他们,也不喜欢他们的模型,但是在宣传文案里面的一段话吸引了我的注意:
M2.7 initiates a cycle of model self-evolution: during development, we let the model update its own memory, build dozens of complex skills for RL experiments, and improve its own learning process based on experiment results.
每一次迭代都会产生一个稍好的模型,然后为下一轮产生质量稍高的训练信号,这就是“递归”的部分—一个循环的输出成为下一个循环的输入,我觉得模型层面的自进化和应用层还是不太一样的,应用层的 Agent 更像是一个越来越会使用工具的工人,模型层的自进化则更像是这个工人开始参与设计工厂本身
也是非常巧的,我在小红书上刷到了 Minimax 的工程师在聊关于 harness engineering 设计的问题,里面提到的一个概念,叫作「蒸馏自己」,什么叫作蒸馏自己呢?也就是你在做 harness 的过程,就是在不断解构你自己是如何去解决一个问题的过程,举一个小例子,比如说我要做一个能帮我打车的 Agent,这个过程应该是,我先知道我当前和想去的地方,然后打开打车软件,然后我就可以开始找车了,看一下报价,选一下类型,等师傅来,对于 Agent 来说也是这样,第一步需要先确定地点,然后调用 API,请求
这学期我看了非常多关于 Agent 相关的文章,主要是一些做 AI4S 的东西,比如说什么 PlantGPT 啦,什么 Vibe Coding For 组学啦,但其实对我来说,我觉得这些东西都是比较难变现的,也就是我觉得 AI 泡泡肯定会来的,但是什么时候来,强度会怎么样,不好说
而且对我来说,最矛盾的是,我觉得大家最终肯定都会被 AI 淘汰的,做具身和机器人的那么多,现在码农焦虑也只是因为 Coding 这个领域有电脑就行,软件工程师是第一批工作成果与物理世界完全解耦的群体,我们的工作输入是字符,输出也是字符,这恰恰是大模型最擅长吞噬的领域,等具身成本降低,机器人学相对更成熟,很多岗位都会被替代
在今年1月的时候,我有一个非常 crazy 的想法,大模型最本质的也就是去预测 next token,那它到底能不能理解我们现实生活中的生物学和物理学原理呢?所以当时我想做的其实是设计一个比较好的 harness,然后来让大模型来从种子开始来帮我养成一株拟南芥,我们把所有工具,包括开灯、浇水、通风等等都封装成一株工具,然后让大模型在这个 harness 来进行调用,当时是受到这个项目的启发

但是我们这个项目烂尾了,我觉得烂尾的主要原因有这几个,第一是我自己眼高手低,低估了整个系统的难度,要做软硬件结合并不是一件容易的事情;第二我觉得要让 AI 去写一个 MVP 很容易,但是长期的维护其实是很难的;第三就是 AI 时代开发的心智压力其实是要比传统时代高得多的,以前可能一天写一个接口,你可以慢慢想着后续架构要怎么实现,但是现在可能 AI 5分钟把接口给你写完了,你就得马上投入到下面的思考,决策的时间被极致压缩了
所以综上,在深入感受和了解到这个行业的一些发展后,我觉得可能去做一些更加「务实」的工作,这种务实有可能因为成本问题,未来很长时间 AI 和具身都没办法轻易取代的,我想去做湿实验,我想去学湿实验的各种操作和技能,我觉得未来更多的这种具身的工作是等待人来实现的,目前的干湿交叉更多的是湿实验工作者通过实验拿到数据,然后由干实验工作者来进行处理,得到某些统计学上的结论;或者是反过来,干实验工作者通过计算机和算法排除了90%的样本,然后剩下10%的样本交给人工来验证
26年3月 Nature 有一篇文章叫作「Towards end to end automation of AI research」,他们做了计算机领域里面的端到端的研究,让 Agent 在计算机上跑各样各样的测试和模型训练,并且进行评估,我之前的一个愿望是能不能在生物学领域去实现这个,Agent 自主完成干实验,然后又自主去完成湿实验,这样在不断尝试和试错的情况下,可以做到24小时不间断地科研,也许可以极大程度加速药物的研发和生物学的进步
可以预见的是,在不远的未来,一些非常常见的湿实验管线会被机器人所取代,但是一些可能成本高的、或者是比较小众的实验还是会有人类所主导,其实华大早就开始做了,成本问题而已
我要跑路了