把调用工具、跑业务时反复踩的坑写成规则 —— 让 AI 不再每次重新犯错。
把垂直领域的专业判断、标准操作流程沉淀下来,AI 按既定路径走。
业务需求 → 技术脚本之间的指令偏差,靠 Skill 的明确契约抹平。
一个是 Anthropic 的 Skill 标准,一个是「为 AI 设计」的 研究视角。
SKILL.md 头部那几十字;一旦说「改下这张表」,才逐层把正文、formulas.md、recalc.py 取进来。能力可以很大,context 始终很小。训练有截止日期。截止之后的库版本、API 变更、新规则,模型一概不知。
企业内部口径、业务流程、专有方法论从未进入训练语料 —— 模型根本没见过。
训练数据里混着大量错误写法,模型学了也会照犯 —— 这是训练的「副作用」。
WidthType.PERCENTAGE 设表格宽度,模型照学 —— 实际导出宽度全错。不知道什么算「好」、输入输出该长什么样 —— 没有契约,结果就飘。
同一个任务有多条技术路径,模型不知道哪条是团队认可的最佳实践。
没有「正确长这样」的范本,模型只能凭概率猜,每次输出形态都不一致。
| 六大缺陷 | Skill 的解法 | |
|---|---|---|
| ① 知识时效性断层 | → | references/ 随时更新 —— 知识与模型解耦,改文档不用改模型。
库升级到 v3,只改 references/api.md,AI 立刻按新版写。 |
| ② 私有知识不可获取 | → | SKILL.md 编码私有流程、方法论、业务标准 —— 把没见过的写进来。
把「单方成本=不含税÷可售面积」直接写进 SKILL.md,AI 不再猜。 |
| ③ 会踩坑 | → | 用确定性规则明确「永远这样、永远别那样」—— 排除训练数据的干扰。 docx Skill 写死「Always DXA, never PERCENTAGE」,覆盖错误倾向。 |
| ④ 缺质量标准 | → | 精确定义输入输出规范与验收口径 —— 给模型一份契约。 规定报告必须六段式、每段结论前置 —— 每次产出结构一致。 |
| ⑤ 不知用什么工具 | → | scripts/ 把最佳技术路径编码成脚本 —— 不留选择空间。
查数固定调 query.py,AI 不用纠结写 SQL 还是调 API。 |
| ⑥ 缺样例参考 | → | 正文 / references 内置范本 —— 相当于一份「永久 Few-shot」。 references 里放一份标准评分表样例,AI 每次照着出。 |
这些规则不增加任何「能力」—— 它们存在的唯一目的,就是抵消训练数据里的错误倾向。
这些话人类开发者根本不需要 —— 人不会犯 WidthType 这种错。它只对 AI 有意义。
Skill 把一位资深成本经理的脑子,沉淀成了文件 —— 换谁来问,AI 都按同一套专业方法答。
description 写清触发条件与触发词;正文列 5 个端点、参数、调用流程,强调「API 模式 = 能查什么由端点固化」。scripts/query.py 纯标准库胶水脚本:health / tables / contracts / orders / rooms 五个子命令,用 urllib 发 GET。query.py tables 自测脚本,再用自然语言「查一下…」验证 Skill 能被自动触发。query.py 把「子命令 + 参数」映射成「API 端点 + query string」—— 调用方式被钉死。对应 P10-①