第四章 · Aha moment
01 / 08
P35 · 第四章开篇

Aha moment:三块能力组合的化学反应

相比原来"Agent + Tool 的 RAG 循环",Skill 这套架构带来了三块能力的组合质变 —— 它们叠在一起,才是真正的转折点。
01
💻
给 AI 配文件系统
上下文不再受窗口限制 —— 等于给 Agent 配了一台能读写的电脑。
02
🔗
Skill 的串联
垂直 Skill + 通用 Skill 串起来,把产物变成可交付的工作结果。
03
🗣️
AUI
把 AI 当作"用户"来设计交互 —— 多了一层人机双向协作。
文件系统+ Skill 串联+ AUI= 给 AI 一台可操作的电脑 · AI Agent OS
P36 · 第一块能力

给 AI 配文件系统 = 给 Agent 配了一台电脑

文件系统让上下文变得"无限" —— AgentOS 的本质,就是 Agent 具备了操作文件目录的能力
workspace/ ├─ data/ # 大资料 → 整理成索引 │ ├─ index.json │ └─ raw-*.csv ├─ 报告-销售达成.md # 临时产物 ├─ 报告-销售达成.html # 可对话修订 └─ notes/ # 小资料汇总整合
Agent 模式涌现的规划外惊喜
  • 问数后可一键生成报告
  • 指标清洗支持对话式调整
  • 控制价审核报告支持对话式增删修订
  • 关键:过程不直接入库 —— 产生临时 JSON / HTML / MD 文件,都能像在 Claude Code 里一样,通过对话 / Skill / 脚本反复调整。
    Agent 把上下文做成了文件系统 —— 大资料整理成索引,小资料汇总整合,自己管理自己的资料。
    P37 · 第二块能力

    Skill 串联:让产物变成可交付的工作结果

    做到 90% 和做到 100% 之间有巨大差别 —— 只有 100% 跑通,才算完全自动化、真正帮用户把活干完。
    举例 · 售楼场景:AI 做完一份"销售达成分析报告"之后……
    垂直 SKILL
    售楼问数
    CLI + 本体取数
    垂直 SKILL
    报告 Skill
    成文 + 可视化
    通用 SKILL
    企微文档
    同步保存归档
    通用 SKILL
    邮件
    发给相关干系人

    A垂直 Skill 出产物

    问数 / 报告 —— 解决某个业务领域内的专业问题,产出报告这类"半成品"。

    B通用 Skill 接真实工作

    企微文档 / 飞书 / 邮件 —— 把产物延展到用户真实办公场景,完成"最后一公里"。

    垂直 Skill 的产物,靠通用 Skill 串联 —— 让我们 Agent 的产物变成可交付的工作结果。
    P38 · 第三块能力

    AUI:把 AI 当作"用户"来设计交互

    关键命题 —— 要为 AI 设计它的交互方式,并教会 AI 怎么跟用户交互
    以前 · UED

    设计用户怎么操作系统

    页面流:用户点击 A → 跳转 B → 填表 C → 提交 D。界面是产品经理和设计师提前画好的,用户在固定路径里操作。

    AUI 时代

    设计用户与 AI 如何共同完成任务

    任务协作流:用户提目标 → AI 拆步骤 / 拉信息 / 组织界面 → 用户确认关键点 → AI 执行 → 展示证据 → 用户验收。

    ① 用户 → AI:表达、控制、确认、纠错、信任 ② AI → 用户:呈现、引导、解释、证据、边界
    AUI 不是少一个界面,而是多了一层双向交互
    P39 · AUI 举例 ① · 一个完整对话过程

    同一段对话,看清两个视角

    用户 → AI 视角(表达 / 控制 / 确认 / 纠错) AI → 用户视角(呈现 / 引导 / 解释 / 证据 / 边界)
    用户
    表达意图
    帮我出一份本季度的销售达成报告。
    AI
    引导 · 弹确认
    生成前先确认两个口径 —— Q1 项目范围:A 全部 / B 光谷天地 / C 手动指定;Q2 时间:A 全年 / B Q1 / C 截至最新月。
    用户
    确认范围
    Q1 选 A 全部项目,Q2 选 B 2026 Q1。
    AI
    拆步骤 · 呈现
    已取数完成。整体达成率 36.1%,对比时间进度 33% —— 小幅领先。给你一张项目对比表格
    用户
    纠错
    光谷天地的口径不对,要排除小订。
    AI
    解释 · 证据 · 边界
    已重算并展示取数 DSL作为证据。报告含敏感金额,需你确认后再同步企微文档。
    哪些是"用户用 AI"的设计(提问 / 补上下文 / 确认范围 / 纠错),哪些是"AI 跟用户交互"的设计(什么时候给一句话、给表格、弹确认、亮证据、让人介入)—— AUI 要同时把两侧都设计好
    P40 · AUI 举例 ② · 录入场景

    如果 90% 字段能自动识别 —— 还需要表单吗?

    AUI 把表单交互重构成对话确认 —— 不是少一个界面,是换一种协作方式。

    以前 · 一张 10 字段表单

    项目名称 *____
    业态类型 *____
    签约金额 *____
    签约日期 *____
    客户来源____
    付款方式____
    … 另有 4 个字段____

    侧边栏也放 10 个字段,用户逐个手填。

    AUI · 对话 + 少量点选

    90% 字段 —— 信息收集 / 感知 / 记忆自动识别并主动确认
    ? 仅剩 2–3 个字段需用户确认

    用户基本只在 A/B/C 选项里做选择:

    (a) 不确定的项目 (b) 不确定的实施范围 (c) 多义口径二选一
    表单不是必须的 —— 对话 + 少量点选,一样可以承载录入。
    P41 · 实战 C 第一部分 现场实战

    现场做一份 MD 版"销售目标达成"报告

    基于第三章手搓的 CLI 问数 Skill 取数 —— 现场手搓 sales-report 报告 Skill,先出 Markdown 版。
    1
    定 Skill 骨架
    在 sales-query 之上做一层"报告编排" —— 取数复用实战 B,不重复造轮子。
    2
    写 SKILL.md,把"先问后做"写成强制 ⭐
    Step 1 标"强制":生成前必须用 Ask Question 确认①项目范围②分析时间。
    3
    现场用 Ask Question 确认口径
    Agent 不抢答 —— 弹两道选择题,现场选 Q1=A 全部 Q2=A 全年
    4
    生成六段式 MD 报告
    整体概览 → 分项目 → 分业态 → 分时间 → 风险研判 → 口径说明。
    产物 · 样例-销售达成分析报告.md
    # 销售达成分析报告(2026 全年 · 全部项目)
    > 数据来源 · 分析维度 · 口径 · Ask Question 确认结果
    
    一、整体达成概览
       达成率 36.1% vs 时间进度 33% —— 小幅领先
    
    二、按项目的达成差异    三、按业态的达成差异
    四、按时间周期的达成差异  五、销售进度风险研判
    六、口径与数据局限说明
       # 如实标注:本场用蓝本数据
    已能产出结构化报告,但纯文字、整体洞察的可视化较弱 —— 下一页解决。
    P42 · 实战 C 第二部分 + 第四章小结 现场实战

    升级成 ECharts 报告 Skill = 给 AI 一台可操作的电脑

    现场 · 做一个结合 ECharts 的报告 Skill
    # MD → HTML,CDN 引入 ECharts,单文件自包含
    python3 scripts/build_html_report.py \
      --data sample_data.json \
      --out  销售达成分析报告.html
    📊
    整体达成
    📈
    项目达成率
    🥧
    业态金额
    🍩
    业态套数
    📉
    月度趋势
  • 生成前用 Ask Question 确认分析范围 / 时间
  • 沉淀成可复用的"销售目标达成"报告框架 —— 换数据 JSON 就出下个月报告
  • 无网兜底:--echarts-local 内联 ECharts,离线可看
  • 第四章小结
    💻 文件系统 · 无限上下文 🔗 Skill 串联 · 可交付结果 🗣️ AUI · 人机双向协作
    三块组合 = 给 AI 一台可操作的电脑 —— AI Agent OS
    通过垂直 Skill通用 SkillAUI,以自然语言对话为主的交互,帮用户完成一个可交付的业务结果