用个人网站重新整理自己
这次重做个人网站,不是为了换一套更会包装自己的说法,而是把过去的 Agent Infra 经验和现在的 Coding Agent 研究主线放到同一个叙事里。
这次重做个人网站,我不想把它改成一个很像 academic homepage 的东西。
我现在还没有到需要把每一段经历都摆成论文主页的阶段。这个站点更像一个技术博客、项目页和资料收藏库:我会在这里写自己做过的系统、读过的论文、踩过的坑,以及一些还没完全想清楚的问题。
更重要的是,我想把自己的主线说清楚一点。
过去一段时间里,我做过不少 Agent 与 AI Infra 产品化相关的事情:Agent Runtime、MCP Tool、沙箱执行、OpenAPI Gateway、鉴权计费、限流、日志追踪、Prompt 评测、Memory Service。它们听起来像一串技术名词,但真正让我有体感的是:一个 Agent 一旦从 demo 进入真实产品,就不再只是“调一次模型”和“接几个工具”。
它会变成一个工程系统。
任务状态要被管理,工具协议要能被模型稳定消费,执行环境要隔离,失败要能追踪,账单要能对上,Prompt 改动要能回归测试,记忆也不能只是把聊天记录塞进向量库。
这些经验现在开始影响我看研究问题的方式。比如 Coding Agent 的后训练、长程任务数据合成、sandbox 环境构造、Verifier 设计、SFT/RL 数据质量、credit assignment,这些问题看起来更偏算法和训练,但底层仍然离不开工程系统。
什么样的数据能训练长程 Coding Agent?什么样的环境和 Verifier 才能支撑可靠的 RL?模型在长程任务中失败时,到底应该怪模型、数据、工具、环境,还是任务本身的定义?
这些问题都不是一句“多跑几轮”能解决的。
所以这个网站第一版会保持简单:
- Blog 放我自己的原创文章、研究笔记和工程复盘;
- Curated 放我筛过的外部资料;
- Projects 放我做过的项目和论文工作;
- About 讲我是谁,以及为什么关心这些问题;
- Contact 放联系方式。
旧的 Notes/Archive 内容不属于我,所以第一版直接删掉。对我来说,现在更重要的是先把公开写作统一到 Blog 里,而不是过早把“文章”“笔记”“研究”分成很多入口。
我希望这里的文字尽量真实、克制、有肌肉、有思考。不是“全面介绍某某最佳实践”,也不是 AI 味很重的宣传稿。更好的写法应该是:我当时为什么困惑,这个问题在真实工程里为什么会发生,我一开始怎么理解错了,后来怎么 debug,哪些设计是 trade-off,哪些东西现在还没完全想清楚。
一句话说,这个网站要展示的不是一个“经历很多的学生”,而是一个逐渐形成主线的人:
过去,我在真实 Agent 产品里做过 runtime、tool、gateway、memory、observability 和 prompt evaluation。
现在,我把这些系统经验带入 Coding Agent、LLM 后训练、长程任务数据合成和可执行评测。
长期,我希望做出既能写成 paper、也能落成产品的 AI-native 系统。