Deploy-Master
共同第二作者。一个面向 AI for Science 的大规模科学工具自动部署系统。
Overview#
Deploy-Master 是一个面向 AI for Science 的大规模科学工具自动部署系统。
它的目标是把散落在 GitHub 和开源生态中的科学软件,转化为可运行、可验证、可复用、可被 Agent 调用的工具能力。
论文中,Deploy-Master 在一天内自动完成了从工具发现、构建规格推断、容器化部署到执行验证的全流程,最终成功部署 50,000+ 个 Agent-ready 科学工具,并发布到 SciencePedia 平台。
Why it matters#
科学计算领域有大量开源工具,但很多工具并不容易真正跑起来。README 可能过时,依赖可能缺失,构建脚本可能不完整,环境假设可能隐藏在作者机器里。
在小规模时,这些问题可以靠人工修。但当规模扩大到几万工具时,它就不再只是写 Dockerfile 的问题,而是规格不确定性管理问题。
我很喜欢这个项目的一点是:它不相信“文档说能跑”,而是以执行验证作为最终事实。
System idea#
Deploy-Master 可以拆成两个核心 Agent:
- Search Agent:发现、过滤和分类科学工具;
- Build Agent:分析仓库、推断构建规格、生成容器环境并执行验证。
其中双模型评估与辩论机制是一个关键设计。单模型很容易过度相信文档,而双模型机制让一个模型生成构建规格,另一个模型审查、质疑和修正,从而提升构建鲁棒性。
My role#
我在深势科技实习期间作为共同第二作者参与该工作。我的参与主要围绕大规模工具发现、构建规格推断、执行调度、失败分析和平台集成等环节。
这个项目对我后续理解 Agent 系统有很大影响。它让我意识到:当规模足够大时,系统问题会发生性质变化。很多看似工程细节的问题,会变成信息不确定性、资源调度和执行验证问题。
What I learned#
Deploy-Master 影响了我现在看 Coding Agent 的方式。
一个 Agent 要在真实环境里工作,不能只依赖语言模型“猜”。环境、工具、构建过程、验证器和失败日志,都是 Agent 能否真正完成任务的关键部分。