Will self-driving ‘robot labs’ replace biologists? Paper sparks debate • JuniorTree

在去年的暑假我去做了开源之夏的实习，然后不知道的朋友可能觉得我做的就是 Agent 的开发，但其实我做的工作其实和 Agent 的关系并不是很大，当时的很多工作叫 Workflow 可能更合理，就是在特定的位置调用一些工具，然后做上下文注入或者是做 RAG，当时我的工作很简单，就是把当时一些主流的平台，比如说 Dify，Coze，FastGPT 这些平台给聚合在一起，通过一个统一的网关进行管理，管理调用，日志等等

所以我一直认为，这段经历叫作 Agent 开发并不合理，应该叫作基础设施维护，Agent 和大模型都跑在云上，就和人住在房子里一样，自然需要人去打扫卫生，开窗等等，在我读大学的三年中，其中两年半都在做类似的训练或者是工作

去年5月份的时候，当时我和吉吉在开发一个应用的后端，当时还在用 Claude Sonnet 3.5 好像是，当时 GitHub Copilot 给了 Pro 用户不少的额度，平时拿来做代码补全或者是 Ask 模式绰绰有余，当时 Agent 模式写代码并没有现在这么成熟，更多的时候是旁边有一个窗口，然后你和它对话，它给你代码，然后又复制粘贴进去，我当时印象很深的是，我们在后端用了一个 Redis 作为缓存，但是我当时没有设计好，我觉得缓存的效率即便是命中了似乎效果也不是很好，然后吉吉当时也没有给出很好的解决方案，我就和 Copilot 对话，我说你要给我解决！然后它就给我解决了！而且确实速度比我实现的要快得多！

另外一个有趣的经历是我参与到一个 MCP 的开发中，去年的11月，当时我就有点感觉到，我在做的一些工作，写脚本也好，写MCP也罢，其实都是在给大模型造工具，到后来我们都不手写代码了，都开始用 Claude Code 或者是 Cursor 来写工具了，更抽象的是在A/提出 SKills 这个概念的时候，里面内置了一个 skills-creater 这个 Skills，也就是说你可以用一个 SKills 去写另外一个 Skills，这种就有点像编程语言里面的自举了，或者可以理解为，左脚踩右脚上天，Agent 开始自进化了

今年三月份的时候，Minimax 推出了自己的 M2.7 模型，虽然我非常不喜欢他们，也不喜欢他们的模型，但是在宣传文案里面的一段话吸引了我的注意：

M2.7 initiates a cycle of model self-evolution: during development, we let the model update its own memory, build dozens of complex skills for RL experiments, and improve its own learning process based on experiment results.

每一次迭代都会产生一个稍好的模型，然后为下一轮产生质量稍高的训练信号，这就是“递归”的部分—一个循环的输出成为下一个循环的输入，我觉得模型层面的自进化和应用层还是不太一样的，应用层的 Agent 更像是一个越来越会使用工具的工人，模型层的自进化则更像是这个工人开始参与设计工厂本身

也是非常巧的，我在小红书上刷到了 Minimax 的工程师在聊关于 harness engineering 设计的问题，里面提到的一个概念，叫作「蒸馏自己」，什么叫作蒸馏自己呢？也就是你在做 harness 的过程，就是在不断解构你自己是如何去解决一个问题的过程，举一个小例子，比如说我要做一个能帮我打车的 Agent，这个过程应该是，我先知道我当前和想去的地方，然后打开打车软件，然后我就可以开始找车了，看一下报价，选一下类型，等师傅来，对于 Agent 来说也是这样，第一步需要先确定地点，然后调用 API，请求

这学期我看了非常多关于 Agent 相关的文章，主要是一些做 AI4S 的东西，比如说什么 PlantGPT 啦，什么 Vibe Coding For 组学啦，但其实对我来说，我觉得这些东西都是比较难变现的，也就是我觉得 AI 泡泡肯定会来的，但是什么时候来，强度会怎么样，不好说

而且对我来说，最矛盾的是，我觉得大家最终肯定都会被 AI 淘汰的，做具身和机器人的那么多，现在码农焦虑也只是因为 Coding 这个领域有电脑就行，软件工程师是第一批工作成果与物理世界完全解耦的群体，我们的工作输入是字符，输出也是字符，这恰恰是大模型最擅长吞噬的领域，等具身成本降低，机器人学相对更成熟，很多岗位都会被替代

在今年1月的时候，我有一个非常 crazy 的想法，大模型最本质的也就是去预测 next token，那它到底能不能理解我们现实生活中的生物学和物理学原理呢？所以当时我想做的其实是设计一个比较好的 harness，然后来让大模型来从种子开始来帮我养成一株拟南芥，我们把所有工具，包括开灯、浇水、通风等等都封装成一株工具，然后让大模型在这个 harness 来进行调用，当时是受到这个项目的启发

但是我们这个项目烂尾了，我觉得烂尾的主要原因有这几个，第一是我自己眼高手低，低估了整个系统的难度，要做软硬件结合并不是一件容易的事情；第二我觉得要让 AI 去写一个 MVP 很容易，但是长期的维护其实是很难的；第三就是 AI 时代开发的心智压力其实是要比传统时代高得多的，以前可能一天写一个接口，你可以慢慢想着后续架构要怎么实现，但是现在可能 AI 5分钟把接口给你写完了，你就得马上投入到下面的思考，决策的时间被极致压缩了

所以综上，在深入感受和了解到这个行业的一些发展后，我觉得可能去做一些更加「务实」的工作，这种务实有可能因为成本问题，未来很长时间 AI 和具身都没办法轻易取代的，我想去做湿实验，我想去学湿实验的各种操作和技能，我觉得未来更多的这种具身的工作是等待人来实现的，目前的干湿交叉更多的是湿实验工作者通过实验拿到数据，然后由干实验工作者来进行处理，得到某些统计学上的结论；或者是反过来，干实验工作者通过计算机和算法排除了90%的样本，然后剩下10%的样本交给人工来验证

26年3月 Nature 有一篇文章叫作「Towards end to end automation of AI research」，他们做了计算机领域里面的端到端的研究，让 Agent 在计算机上跑各样各样的测试和模型训练，并且进行评估，我之前的一个愿望是能不能在生物学领域去实现这个，Agent 自主完成干实验，然后又自主去完成湿实验，这样在不断尝试和试错的情况下，可以做到24小时不间断地科研，也许可以极大程度加速药物的研发和生物学的进步

可以预见的是，在不远的未来，一些非常常见的湿实验管线会被机器人所取代，但是一些可能成本高的、或者是比较小众的实验还是会有人类所主导，其实华大早就开始做了，成本问题而已

我要跑路了