Deploy-Master • Justin Huang

共同第二作者。一个面向 AI for Science 的大规模科学工具自动部署系统。

preprint 2026 arXiv preprint co-second author

#ai-for-science#agent#software-engineering#deployment#mcp#scientific-tools

Overview#

Deploy-Master 是一个面向 AI for Science 的大规模科学工具自动部署系统。

它的目标是把散落在 GitHub 和开源生态中的科学软件，转化为可运行、可验证、可复用、可被 Agent 调用的工具能力。

论文中，Deploy-Master 在一天内自动完成了从工具发现、构建规格推断、容器化部署到执行验证的全流程，最终成功部署 50,000+ 个 Agent-ready 科学工具，并发布到 SciencePedia 平台。

科学计算领域有大量开源工具，但很多工具并不容易真正跑起来。README 可能过时，依赖可能缺失，构建脚本可能不完整，环境假设可能隐藏在作者机器里。

在小规模时，这些问题可以靠人工修。但当规模扩大到几万工具时，它就不再只是写 Dockerfile 的问题，而是规格不确定性管理问题。

我很喜欢这个项目的一点是：它不相信“文档说能跑”，而是以执行验证作为最终事实。

Deploy-Master 可以拆成两个核心 Agent：

其中双模型评估与辩论机制是一个关键设计。单模型很容易过度相信文档，而双模型机制让一个模型生成构建规格，另一个模型审查、质疑和修正，从而提升构建鲁棒性。

我在深势科技实习期间作为共同第二作者参与该工作。我的参与主要围绕大规模工具发现、构建规格推断、执行调度、失败分析和平台集成等环节。

这个项目对我后续理解 Agent 系统有很大影响。它让我意识到：当规模足够大时，系统问题会发生性质变化。很多看似工程细节的问题，会变成信息不确定性、资源调度和执行验证问题。

Deploy-Master 影响了我现在看 Coding Agent 的方式。

一个 Agent 要在真实环境里工作，不能只依赖语言模型“猜”。环境、工具、构建过程、验证器和失败日志，都是 Agent 能否真正完成任务的关键部分。