<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/scripts/pretty-feed-v3.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:h="http://www.w3.org/TR/html4/"><channel><title>Justin Huang</title><description>Coding Agents · AI Infra · AI-native Builder</description><link>https://justinhuang.top</link><item><title>用个人网站重新整理自己</title><link>https://justinhuang.top/blog/20260605---personal-site-relaunch/post</link><guid isPermaLink="true">https://justinhuang.top/blog/20260605---personal-site-relaunch/post</guid><description>这次重做个人网站，不是为了换一套更会包装自己的说法，而是把过去的 Agent Infra 经验和现在的 Coding Agent 研究主线放到同一个叙事里。</description><pubDate>Fri, 05 Jun 2026 00:00:00 GMT</pubDate><content:encoded>&lt;p&gt;这次重做个人网站，我不想把它改成一个很像 academic homepage 的东西。&lt;/p&gt;
&lt;p&gt;我现在还没有到需要把每一段经历都摆成论文主页的阶段。这个站点更像一个技术博客、项目页和资料收藏库：我会在这里写自己做过的系统、读过的论文、踩过的坑，以及一些还没完全想清楚的问题。&lt;/p&gt;
&lt;p&gt;更重要的是，我想把自己的主线说清楚一点。&lt;/p&gt;
&lt;p&gt;过去一段时间里，我做过不少 Agent 与 AI Infra 产品化相关的事情：Agent Runtime、MCP Tool、沙箱执行、OpenAPI Gateway、鉴权计费、限流、日志追踪、Prompt 评测、Memory Service。它们听起来像一串技术名词，但真正让我有体感的是：一个 Agent 一旦从 demo 进入真实产品，就不再只是“调一次模型”和“接几个工具”。&lt;/p&gt;
&lt;p&gt;它会变成一个工程系统。&lt;/p&gt;
&lt;p&gt;任务状态要被管理，工具协议要能被模型稳定消费，执行环境要隔离，失败要能追踪，账单要能对上，Prompt 改动要能回归测试，记忆也不能只是把聊天记录塞进向量库。&lt;/p&gt;
&lt;p&gt;这些经验现在开始影响我看研究问题的方式。比如 Coding Agent 的后训练、长程任务数据合成、sandbox 环境构造、Verifier 设计、SFT/RL 数据质量、credit assignment，这些问题看起来更偏算法和训练，但底层仍然离不开工程系统。&lt;/p&gt;
&lt;p&gt;什么样的数据能训练长程 Coding Agent？什么样的环境和 Verifier 才能支撑可靠的 RL？模型在长程任务中失败时，到底应该怪模型、数据、工具、环境，还是任务本身的定义？&lt;/p&gt;
&lt;p&gt;这些问题都不是一句“多跑几轮”能解决的。&lt;/p&gt;
&lt;p&gt;所以这个网站第一版会保持简单：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Blog 放我自己的原创文章、研究笔记和工程复盘；&lt;/li&gt;
&lt;li&gt;Curated 放我筛过的外部资料；&lt;/li&gt;
&lt;li&gt;Projects 放我做过的项目和论文工作；&lt;/li&gt;
&lt;li&gt;About 讲我是谁，以及为什么关心这些问题；&lt;/li&gt;
&lt;li&gt;Contact 放联系方式。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;旧的 Notes/Archive 内容不属于我，所以第一版直接删掉。对我来说，现在更重要的是先把公开写作统一到 Blog 里，而不是过早把“文章”“笔记”“研究”分成很多入口。&lt;/p&gt;
&lt;p&gt;我希望这里的文字尽量真实、克制、有肌肉、有思考。不是“全面介绍某某最佳实践”，也不是 AI 味很重的宣传稿。更好的写法应该是：我当时为什么困惑，这个问题在真实工程里为什么会发生，我一开始怎么理解错了，后来怎么 debug，哪些设计是 trade-off，哪些东西现在还没完全想清楚。&lt;/p&gt;
&lt;p&gt;一句话说，这个网站要展示的不是一个“经历很多的学生”，而是一个逐渐形成主线的人：&lt;/p&gt;
&lt;p&gt;过去，我在真实 Agent 产品里做过 runtime、tool、gateway、memory、observability 和 prompt evaluation。&lt;/p&gt;
&lt;p&gt;现在，我把这些系统经验带入 Coding Agent、LLM 后训练、长程任务数据合成和可执行评测。&lt;/p&gt;
&lt;p&gt;长期，我希望做出既能写成 paper、也能落成产品的 AI-native 系统。&lt;/p&gt;</content:encoded><h:img src="undefined"/><enclosure url="undefined"/></item></channel></rss>