文章

造物栈为什么要分工：ChatGPT 做军师，Codex 写代码，newtype-os 打磨内容

ChatGPT 做军师，Codex 写代码，newtype-os 打磨内容——这不是理论推演，而是一次真实项目推进后得出来的结论。

发布：2026/06/07 更新：2026/06/07 作者：造物栈

造物栈为什么要分工：ChatGPT 做军师，Codex 写代码，newtype-os 打磨内容

前段时间，造物栈推进到第一篇文章和标签页功能时，出现了一个之前没预料到的问题。

内容打磨、代码修改、项目判断——这三件事混在一起之后，效率没有变高，反而变乱了。

具体表现很直接：第一篇文章在打磨过程中，风格反复摇摆。ChatGPT 直接大段改写正文，文章变硬了，读起来不像同一个人写的。description 一度写成了内部项目说明，读者看起来会很不自然。后来我也意识到，用 PowerShell 大段替换正文，本质上是把表达问题当成工程问题处理。结果并不理想。还有一次，文章备份被放进了 src/content/posts，Astro 差点把旧备份当成正式内容读取。

这些问题的共性不是某个人做错了什么，而是工具没有放到合适的位置。

这篇文章不是工具评测，也不是教你选哪个 AI 更好。它是一次真实项目推进后形成的分工规则记录。

不是所有任务都适合同一个 AI

回头看，问题的根源很简单：我们试图用一个工具做所有事。

内容、代码、判断，是三类性质完全不同的任务。内容追求表达准确、语气自然，有人的温度。代码追求逻辑正确、可执行、不报错。判断追求经验、优先级和边界感。

这三件事的处理方式不一样，验收标准不一样，需要的工具也不一样。混在一起的结果是：文章像说明书，内容修改被脚本化，项目推进缺少清晰的方向判断。

所以不是 AI 不行，而是分配方式有问题。找到每个工具适合做的事，比找”最强”的工具更重要。

ChatGPT 适合做军师，不是写手也不是程序员

在造物栈的协作体系里，ChatGPT 被放在了项目军师的位置。

这意味着它更擅长：方向判断、任务拆解、边界设置、验收标准制定、工具选择、风险提醒。什么时候继续推进、停下来检查、交给 Codex、交给 newtype-os——这些判断类的工作更适合 ChatGPT。

它不适合做的事也很清楚：不负责全部代码，不负责最终文章质量，更不能替代用户的判断。

把 ChatGPT 放在军师位置后，最明显的变化是：任务书更清楚了，边界更明确了，验收标准不再模棱两可。它不再大段改文章正文，而是在更高层面把控方向和风险。

Codex 适合做工程执行，但需要清晰的边界

Codex 在造物栈里负责工程执行。

具体来说：改文件、写代码、创建页面、修改路由、运行 build、跑状态检查。这些任务有一个共同特点——有明确的对错标准：代码能跑通就是能跑通，build 不报错就是不报错。

之前把标签页功能交给 Codex 后，执行确实更稳定。任务书给了，边界划清楚了，验收标准说清楚了，Codex 产出质量很高，build 和状态检查都一次通过。

但这里面有一个前提：Codex 需要清楚的任务书、边界和验收标准。目标不清楚的时候，不能让 Codex 自由发挥。这就像给一个工程师下达需求——越模糊，结果越不可控。

newtype-os 适合打磨内容，因为文章质量不是工程问题

newtype-os 在造物栈里的角色是内容质量打磨。

这个定位是后来才明确的。之前我们尝试过用 ChatGPT 直接改文章，也用 PowerShell 做过大段替换，效果都不好。原因在于：文章质量不是工程问题，不能靠脚本替换解决。

newtype-os 擅长做的事包括：去 AI 腔、压缩表达、调整语气、找重复、优化标题和摘要——让文章更像人说话。它不做代码修改，不做工程判断，只聚焦在表达层面。

把内容质量明确交给 newtype-os 之后，文章打磨不再是”谁有空谁改”的状态，而是有了专门的工具和流程。

用户必须保留最终判断

这个原则贯穿造物栈所有协作规则。

AI 可以放大能力，但不能替代判断。工具只是放大器，不是方向盘。方向盘必须在人手里。

项目值不值得做，文章像不像自己，风格对不对，优先级怎么排——这些最终由用户决定。ChatGPT 可以给建议，Codex 可以执行代码，newtype-os 可以优化表达，但按下确认键的那个人，始终是用户自己。

这件事看起来是常识，但在实际推进中很容易被忽略。当一个 AI 工具太顺手的时候，人会不自觉地减少思考，默认接受 AI 的输出。造物栈的规则明确了这一点：AI 是协作方，不是决策方。

这次分工留下的规则

经过这一轮磨合，造物栈形成了几条明确的分工规则：

内容类任务优先 newtype-os——去 AI 腔、调整语气、优化表达
代码类任务优先 Codex——改文件、写代码、运行 build
ChatGPT 做任务书、边界、验收和工具判断——不直接改正文，不代替用户做决定
用户做最终判断——不把确认权交给任何 AI 工具
文章备份不能放进 content/posts——这是一个具体的教训，备份和正式内容必须物理隔离

这些规则不是凭空想出来的，每一条背后都有一个”这样做不行”的真实经历。它们可能不适用于所有项目，但对造物栈来说，这套分工是一个已经被验证过的协作基础。

分工也是一种生产资料

最后想说的是：造物栈不只是沉淀文章和代码，也在沉淀流程、规则和协作方式。

一套清晰的分工规则，本身就是生产资料。以后做新专栏、新功能、新项目，不需要从头摸索每个工具该干什么，直接套用已经验证过的分工体系就行。这套规则可以反复使用，而且会随着项目推进不断迭代。

不是所有项目都需要这套分工。但如果你也在用多个 AI 工具做项目，遇到”工具混在一起反而乱了”的情况，不妨试试把它们放到各自适合的位置。不是所有工具都适合内容，不是所有工具都适合代码，也不是所有工具都适合做判断。

放在正确位置，比堆叠更多工具更重要。