
机器之心剪辑部
上周,Claude Code 发布了一个新能力:动态职责流。
该功能允许 Claude 根据具体任务即时编写定制化扩充框架,互助多个子 Agent 并行职责,措置大领域、高并行、扞拒性任务中的系统性失效问题。
近日,Anthropic 工程师 Thariq 发了篇长文,分享了他当先的职责流解说和心得。
咱们对此进行了全文整理译述。
在真切时代细节之前,Thariq 先提供了一些示例辅导,来让咱们领路职责流的后劲:
「这个测试可能每 50 次起初失败一次。建树一个职责流,类似起初测试,酿成假定,并在职责树中对其进行扞拒性考据 / 方向:不竭尝试,直到有一个假定见效。」
「使用职责流,追想我最近的 50 次会话,挖掘我反复犯的不实,并将这些类似性问题生成 CLAUDE.md 轨则。」
「用职责流翻查往常六个月 Slack 的 #incidents 频说念,找出反复出现、但还莫得东说念主提交工单的根蒂原因。」
「拿我的交易经营,起初一个职责流,让不同的 Agent 从投资者、客户和竞争敌手的角度进行拆解。」
「这里有一个包含 80 份简历的文献夹,用职责流对其进行名次,选出后端岗亭的最好候选,并对前十名进行复核。使用 AskUserQuestion 用具进行口试评分。」
「我需要给这个 CLI 用具取名。使用职责流生成多个选项,并进行淘汰赛选出前三个最好有运筹帷幄。」
「使用职责流,将咱们的 User 模子重定名为 Account。」
「审查我的博客著述草稿,使用职责流考据每一项时代声明是否合乎代码库,确保不发布不实信息。」
动态职责流如何职责
动态职责流扩充一个包含特殊函数的 JavaScript 文献,这些函数匡助生成和互助子 Agent。

同期,动态职责流还包括圭臬 JavaScript 功能,如 JSON、Math 和 Array,用于处理数据。
动态职责流不错决定一个 Agent 使用的模子类型,以及子 Agent 是否在孤立的职责树中起初,从而让 Claude 采用所需的智能水和缓荫庇方式。
要是职责流中断,例如被用户操作或末端退出,规复会话时,职责流不错从中断点赓续扩充。
为何使用动态职责流
当咱们使用默许 Claude Code 框架扩充当务时,它需要在合并个蜿蜒文窗口中同期进行经营和扩充。对于好多编程任务,这终点灵验,但在万古辰起初、大领域并行或高度结构化的扞拒任务中,随契机出现问题。
原因在于,Claude 在单个蜿蜒文窗口中处理复杂任务时辰越长,就越容易出现以下几类失败模式:
智能体懒惰(Agentic laziness):Claude 在处理复杂多才略任务时可能提前罢手,声称任务完成,例如只处理 50 条安全审查中的 20 条。
自我偏好偏差(Self-preferential bias):Claude 倾向于偏向我方的结果或发现,尤其在需要考据或评估时。
方向漂移(Goal drift):在多轮操作中,任务方向渐渐偏离,零碎是在压缩总结之后,细节如旯旮案例或「辞让作念 X」的拘谨可能丢失。
创建职责流不错通过为不同方向分拨孤立蜿蜒文窗口的 Claude 实例来幸免这些问题,每个实例专注、荫庇任务方向。
动态与静态职责流的区别
你可能之前使用 Claude Agent SDK 或 claude -p 创建过静态职责流,以互助多个 Claude Code 实例。
静态职责流需兼顾总计顶点情况,因此好坏更通用。而使用 Claude Opus 4.8 的动态职责流,Claude 面前大概生成针对你的特定用例定制的智能框架。

动态职责流的常用模式
你不错奏凯让 Claude 生成动态职责流,或者使用触发词「ultracode」确保 Claude Code 创建职责流。
领路动态职责流的常用模式,有助于判断何时使用以及如何通过辅导携带 Claude:

分类并扩充(Classify-and-act):使用分类器 Agent 决定任务类型,然后根据任务路由到不同 Agent 或算作,也可在终末使用分类器判断输出。
分发并汇总(Fan-out-and-synthesize):将任务拆分红多个小才略,每个才略由一个 Agent 处理,然后汇总结果。零碎适合无数小才略或每步需要孤立蜿蜒文的情况。汇总才略会恭候总计分发 Agent 完成,然后将结构化输出合并。
扞拒性考据(Adversarial verification):每个子 Agent 的输出都由另一个 Agent 对照评判圭臬进行扞拒性考据。
生成并筛选(Generate-and-filter):生成多个思法,然后根据评判圭臬筛选,去重,只复返高质料且考据过的思法。
竞赛(Tournament):让多个 Agent 以不同方式扩充疏导任务,再通过评判 Agent 两两比较结果,选出最优。
轮回直到完成(Loop until done):对于职责量未知的任务,轮回生成 Agent,直到称心罢手条件(无新发现或日记中无更多不实),而非固定轮次。
用例

迁徙与重构
Bun 从 Zig 重写到 Rust,即是用 workflows 完成的。
枢纽是把任务拆成一系列不错冉冉处理的小单位,比如调用点、失败测试、模块等。每一个建树都在孤立的 worktree 里派出一个子 Agent 去完成;之后再让另一个 Agent 作念扞拒式审查,阐述没问题后再合并。
要是但愿尽可能并行,又不思把本机资源打满,不错明确告诉 Agent 不要起初资源破钞很高的号召。
深度商榷
咱们在 Claude Code 里发布了一个深度商榷 skill(/deep-research),它使用的即是动态 workflows。
具体来说,它会并行伸开网页搜索,捏取贵寓开端,对其中的说法作念扞拒式考据,终末整合成一份带援用的商榷呈报。
不外,这类商榷并不单限于网页搜索。比如,你也不错让 Claude 从 Slack 的蜿蜒文里整理一份状况呈报,或者让它真切浏览代码库,商榷某个功能到底是如何结束的。
深度考据

另一方面,要是你有一份呈报,并但愿一一核查其中援用的每一项事实述说偏激开端,你不错构建一套职责流:先由一个智能体负责识别出总计的事实述说,随后派生出一个子智能体,开元棋牌平台app2026最新版下载对每一项述说进行把稳的核查。此外,你还不错引入一个考据智能体,故意对负责溯源的子智能体进行复核,以确保其所援用的开端具备高质料。
排序

你可能会有一批要求,思按某种定性的圭臬来排序,而这个圭臬又是 Claude Code 比较擅长判断的。比如,把撑持工单按 bug 严重进度排序。
但要是你思在一个 prompt 里一次性处理 1000 多行,质料很容易下落,何况蜿蜒文也放不下。更好的作念法是跑一场「锦标赛」:搭建一条由两两比较 Agent 构成的活水线。比拟奏凯打完满分,两两比较好坏更可靠。
也不错先并行分桶排序,再把结果合并。每一次比较都交给一个孤立 Agent 完成,笃定性的轮回负责留意通盘比赛括号,着实留在蜿蜒文里的,惟有刻下正在扩充的律例。
牵记与轨则降服

要是你发现存一组轨则,即便写进 CLAUDE.md,Claude 仍然不时漏掉或扩充不好,则不错故意作念一个职责流:把这些轨则列出来,让考据 Agent 逐条查验。每条文定对应一个考据 Agent。
同期,再创建一个带有怀疑者视角的子 Agent,故意复核这些轨则是否合理、是否真实对都方向,这么不错减少过多误报。
反过来也成立:你不错从最近的会话和代码审查见识里,挖出那些你反复革新的问题;再让多个 Agent 并行归类整理;然后对每条候选轨则作念扞拒式考据,比如追问:这条文定那时真实能幸免一个真实不实吗?终末,把通过考据的轨则再索要回 CLAUDE.md。
根因探访
调试最灵验的纪律,好坏是先建议几个互相孤立的假定,再一一考据。但要是只依赖一个蜿蜒文窗口,Claude 很容易堕入某种「自我偏好」:越看越信服我方当先的判断。
职责流不错从结构上幸免这少许。它不错让多个 Agent 基于相互荫庇的把柄区分建议假定。比如,一个 Agent 只看日记,一个只看文献,一个只看数据。随后,每个假定再交给一组考据者和反驳者来慎重。
这种纪律并不单适用于代码。销售场景也不错用,比如分析 3 月销售额为什么下滑;数据工程也不错用,比如排查某条数据管说念为什么失败。任何需要作念复盘、找根因的问题,都不错用类似的职责流来处理。
Triaging at scale
大领域工单分拣

每个团队都濒临着撑持工单部队、Bug 呈报或其他积压任务,这些任务相同无法仅凭东说念主工完全处理。分流职责流(Triage workflow)大概对每一个待服务项进行分类,与已跟踪的要求进行去重比对,并采用相应的算作。这些算作可能包括尝试奏凯建树问题,或者将其升级转交给东说念主工用户处理。
在分流职责流中,「荫庇」(Quarantine)是一种终点实用的模式。其中枢作念法是:辞让那些负责读取非受信全球推行的智能体扩充高权限操作;相背,这些高权限操作将交由故意负责基于信息采用算作的智能体来扩充。将分流职责流与 /loop 指示聚会使用,即可让 Claude 持续不竭地自动扩充此类任务。
探索与试吃判断
在探索针对某一措置有运筹帷幄的不同结束旅途时,职责流显得尤为有用 —— 零碎是当任务触及主不雅「试吃」判断(如瞎想或定名职责)且需要依据一套既定圭臬(Rubric)进行评估时。
不妨尝试让 Claude 探索并生成一系列潜在的措置有运筹帷幄,随后指派一个「评审智能体」,并为其提供一套明确的评估圭臬,用以界定何为「优质」的措置有运筹帷幄。当该评审智能体判定某有运筹帷幄已完全合乎既定圭臬时,该任务即宣告完成。此外,还不错依据这套评估圭臬,通过「锦标赛」式的比拼机制对各样措置有运筹帷幄进行排序或最终筛选。
评估
你不错针对特定任务起初轻量级的评估过程:起先在孤立的「职责树」(Worktree)中繁衍出一组智能体来扩充当务;随后再繁衍出一组「对比智能体」,依据既定的评估圭臬对前述智能体生成的具体输出结果进行比对与评分。例如而言,你不错利用这一机制,依据特定的评估圭臬,对你所创建的某项 Skill 进行评估,并在此基础上加以迭代优化。
模子与智能路由
你不错创建一个故意针对你的任务进行调优的「分类智能体」,由其负责决接应调用哪一个基础模子来扩充当务。当你的任务触及无数的用具调用时,这一机制尤为实用 —— 通过在负责扩充当务前进行事前分析与调研,该分类智能体大概精确识别出最适合刻下任务的基础模子。
例如来说,针对「解释认证模块(Auth module)的职责旨趣」这一任务,其最好的基础模子采用并非一成不变,而是取决于该认证模块内包含的文献数目以及通盘代码库的合座结构形态。此时,分类智能体便可承担起这项事前分析的职责,并依据对任务预期复杂度的判断,将任务智能路由至 Sonnet 或 Opus 等不同的基础模子进行处理。
何时不宜使用动态职责流
「职责流」是一项相对较新的功能。尽管在好多应用场景下,它能带来渔人之利的显耀成效,但并非每一项任务都必须依赖职责流;若奢华职责流,反而可能导致破钞远超预期的 Token 资源。
最好的实践战术是发扬创意,以一种前所未有的方式无邪利用职责流,从而充分挖掘 Claude Code 的潜能。对于惯例的编程任务,不妨先自问一句:这项任务真实有必要干预异常的瞎想资源来起初职责流吗?例如,大多数传统的编码任务并不需要由五名审阅者构成的评审小组。
构建动态职责流的技巧
辅导词瞎想
针对动态职责流,若接受咱们上文胪陈的特定技巧来编写把稳的辅导词,相同能取得最好成果。
职责流并非仅适用于大型任务。你也不错通过辅导词指示,让模子扩充一种「快速职责流」。比如你不错快速构建一个针对特定假定进行「扞拒性审查」的职责流。
聚会使用 /goal 与 /loop 指示。
当你需要扩充可类似的职责流(例如任务分流、贵寓调研或信息核实)时,建议搭配使用 /loop 指示以结束周期性扩充,并聚会 /goal 指示来设定明确的任务完成硬性运筹帷幄。
Token 使用预算
你不错为动态职责流设定明确的 Token 使用预算,以此纵容单项任务所破钞的 Token 数目。你不错在辅导词中奏凯指定预算额度,例如输入:「use 10k tokens」(使用 10k Token),系统便会自动设定相应的上限。
保存与分享动态职责流
你不错通过在职责流菜单中按下「s」键来保存刻下的职责流。你不错将这些职责流文献存档至~/.claude/workflows 目次下,也不错将其打包为「手段」(Skill)的模式进行分发与分享。

若要通过手段(Skill)来分享这些文献,请将你的 JavaScript 职责流文献放入该手段对应的文献夹中,并在 SKILL.MD 文献中援用它们。为了得回更大的无邪性,你可能但愿辅导 Claude 将该手段中的职责流视为「模板」,而非必须一字一板扩充的剧本。

职责流是一种有助于延迟 Claude Code 的全新方式。各人应该将其视为一个开拔点 —— 对于如何充分发扬其遵守开元棋牌平台app2026最新版下载,仍有好多值得探索之处。期待听到你的发现。