摩打食堂 · Jocelyn 知识库

从"能用"到"好用"的重做规划 v2

基于钉钉的员工 AI 问答助手 · 第二版架构 + 深度规划模块

好用度 = 检索质量 × 回答质量 × 反馈闭环

1先看现状:做得好、将就、会踩坑

当前系统已上线能用,但三类问题决定了它"3 个月后是不是还好用"。

✓ 做得好(保留)
  • SKILL.md 只管反问+缺位,答案全走 answer.py(分层清晰)
  • Opus 的 [缺位] 自检(宁可不答不误导)
  • 粤语/日料术语同义词表
  • 重复追问 3 次自动通知管理员
  • usage.log 每次调用记成本
  • 扫描 PDF 自动 OCR 兜底
⚠ 将就着用(有隐患)
  • 定长 700 字切片 — 会把条款砍半
  • BM25 归一化系数硬编码 5.0 — 库一变就失效
  • OCR 需要手动装 Tesseract — 静默跳过
  • 日志/追问记录无轮转 — 长期会膨胀
  • 同义词硬编码在代码里 — 非技术人员改不了
✗ 会踩坑(必修)
  • 没有向量搜索 — 只会关键词匹配,同义词漏搜必然
  • Jocelyn userId 硬编码 — 换账号系统就死
  • backup.py 路径错 — 全量备份漏 docs
  • 手册 4 处命令写错 — 应急排障会误导
  • 没有评估集 — 改了参数不知道有没有退步
  • 钉盘 API 权限未开通 — 备份 / 同步 / 员工下载链接全阻塞

2新系统的核心理念

一个好用的知识库 bot 由三个因子相乘决定。缺任一项,质量都会被那一项拉下来。

🔍 检索质量
能不能从 86 份文档里
找到正确那一段?
×
💬 回答质量
找到之后能不能
说得清、说得暖?
×
🔄 反馈闭环
答错了能不能
越用越准?

现系统 ≈ 检索一般 × 回答不错 × 闭环很弱 →
所以短期能用,长期会慢慢"变笨"

3五层架构总览

每层职责单一。红标签 = 必改,绿标签 = 保留不动,金标签 = 最大升级点。

① 接入层 · 钉钉保留+扩展

Stream 模式(不变)· 多管理员配置化(不再硬编码 Jocelyn)· 角色感知预留(员工/店长/HR/超管架构留口,前期仅 Jocelyn)

↓ 问题 / 文件 / 指令 / 申请
② 检索层 · 找对文档重点重构

BM25 + 向量 + 重排(替代纯 BM25)· 按条款/章节语义切片(替代 700 字硬切)· 小模型 query 改写(替代手写同义词)· 按部门/地区预过滤 · 高频答案缓存

↓ top-5 最相关段落
③ 生成层 · 写好答案优化

4 档路由:Haiku(简单事实)/ Sonnet(流程类)/ Opus + [缺位] 自检(敏感)/ 缺位通知(低置信)· 情感三档(紧急/麻烦事/普通)保留 · 敏感问题走审批流(不直接答) · 隐私硬性过滤

↓ 答案回到钉钉
④ 反馈层 · 越用越准 ⭐灵魂

员工一键 👍👎(不打字)· Jocelyn 自然语言纠错("第二步应该是 Y"→ 自动生成 override 规则)· 缺位三分类(文档缺失 / 检索失败 / 问题歧义)· 每周自动学习

↓ 数据沉淀
⑤ 运营层 · Jocelyn 看得见新增

周报(问答量/命中率/👎 热点/缺位分类)· 月度文档健康度(时效性巡检 / 从没命中 / 矛盾项)· 评估集每日自动回归 · 每周全量备份 · 成本上限 + 降级

4员工提问的完整旅程

以"厨房伙伴:我能请年假吗"为例,走一遍新系统的链路。

1
接入
识别角色
厨房伙伴
2
改写
"年假"→
"年休假 假期申请"
3
检索
BM25+向量
→ top-20 → 重排 top-5
4
生成
置信 0.82
→ Sonnet 写答案
5
反馈
员工 👍
→ 记录质量

5反馈闭环:让系统越用越准

这是现系统最弱、重做后最有价值的部分。

👎 员工点"没用"
或问题答不上
📋 自动分类
文档缺失 / 检索失败 / 问题歧义
🧑‍💼 Jocelyn
自然语言纠错 or 补文档
↳ 生成 override 规则 / 扩充同义词 / 触发重新 ingest
下次同类问题立即命中

和现系统的对比

环节现系统新系统
员工反馈一键 👍👎
Jocelyn 纠错无(只能改源文档重 ingest)钉钉里说一句自然语言
缺位清单纯列表三分类 + 下周行动建议
学习机制不自动学👎 + override + 重复追问 每周复盘

6员工交互样板

五个典型场景,展示员工侧的实际对话体验。

场景 A · 常规问题
厨房伙伴年假几天?
厨房伙伴年假按工龄算 👇 • 入职满 1 年:5 天 [1] • 满 10 年:10 天 [1] • 满 20 年:15 天 [1] 📎 来源 [1] 年休假管理规定 v20260301.docx(📁 钉盘打开) 💡 你可能还想问 • 试用期有年假吗? • 年假可以一次休完吗? • 没休完会清零吗? 👍 有用 👎 没用
场景 B · 需要反问
我的社保怎么算?
社保规则按城市差异很大,先问一下: 你在哪个城市的门店?
深圳
好,深圳门店伙伴的社保是这样的 👇 (继续走检索 + 回答流程)
场景 C · 紧急情况
厨房小弟烫伤了,很严重怎么办?
伙伴受伤了,先说最关键的几步—— 1. 立即冷水冲烫伤部位 15–20 分钟 [1] 2. 不要涂牙膏/酱油 [1] 3. 起水泡或皮肤变白立刻送医院 [1] 4. 24 小时内由店长向人事部工伤申报 [2] 希望伙伴没事,赶紧送医 🙏 📎 来源 [1] 伤害应急处理手册.pdf [2] 工伤申报流程 2025.docx 👍 有用 👎 没用
场景 D · 知识库没有
我老婆怀孕了能申请陪产带薪假吗?新规定有吗?
这个我暂时没有最新资料~ 已通知 Jocelyn 跟进,会尽快补充。 同时建议你: • 直接问人事部(分机 XXX) • 或回复我「转人工」帮你发消息给 Jocelyn
场景 E · 敏感问题(走审批)
总管和店长的年终奖怎么算?
这个问题涉及管理层薪酬,需要 Jocelyn 确认后才能回答~ ✅ 我已经替你提交了审批单 ⏱ 通常 1–2 个工作日内回复 📨 批准后会自动把答案发给你
好,谢谢
(1 小时后,Jocelyn 批准) 小摩:关于你之前问的"总管店长年终奖"—— Jocelyn 已批准回复: 管理层年终奖按年度考核得分 × 基数发放,具体数字请联系人事部了解。[1] 📎 来源 [1] 管理层薪酬制度 v2025.docx(📁 钉盘打开)
场景 F · 员工申请文件
想要员工手册的完整 PDF
好的,我需要 Jocelyn 批准才能给你 👇 📋 申请单已提交 • 申请人:王伟(厨房伙伴) • 文件:员工手册 v2025.pdf • 用途:个人查阅 ⏱ 等批准通知~
(Jocelyn 批准后) ✅ 你的文件申请已批准! 📥 点击下载: 员工手册 v2025.pdf(钉盘链接,24 小时有效) 下载记录已存档。

7Jocelyn 交互样板

管理员侧是这套系统的"驾驶位",关键场景示例。

场景 1 · 发文件入库(含冲突检测)
[发送 2026年年休假新规.docx]
✅ 新文件已入库 📁 LLM 建议分类:1.人事制度 / 年休假 📄 2026年年休假新规.docx(23 块) ☁ 已同步钉盘 ⚠️ 与「年休假管理规定 v2025.docx」主题冲突 要保留哪一份? ① 新文件 ② 旧文件 ③ 都保留
场景 2 · 自然语言纠错
对【我受伤了怎么办】的回答,第二步应该是"先送医院再报店长",不是反过来
✅ 已记录纠错 问题:我受伤了怎么办 修正:第二步 → "先送医院,再联系店长报备" ⏱ 即刻对所有员工生效 ℹ️ 过去 7 天有 3 位员工收到过旧答案 要主动推送更正吗?
场景 3 · 敏感问题审批
🔔 新审批单 员工:王伟(厨房伙伴) 问题:总管和店长的年终奖怎么算? 📝 系统 draft 答案: 管理层年终奖按年度考核得分 × 基数发放,具体数字请联系人事部了解。 你可以: ① 批准原 draft ② 改写后批准(直接回复改好的答案) ③ 驳回(不回答员工)
① 批准
✅ 已发答案给王伟 + 附「管理层薪酬制度 v2025.docx」钉盘链接
场景 4 · 周一早上 9:00 周报
📊 摩打知识库周报(4.15–4.21) 💬 问答:247 次(↑18%) 🎯 命中率:82%(目标 ≥ 85%) 💰 成本:¥43.2 👎 负反馈:4 条 📭 缺位:17 条新增 📋 8 条缺文档 | 6 条检索失败 | 3 条歧义 🔁 重复追问:王伟 5 次问商业险理赔 📥 文件申请:12 次(全部已批) ⚠️ 敏感审批:3 次(2 批 / 1 驳) 🎯 建议下周 1. 补 4 份缺位文档(覆盖 12 个追问) 2. 加同义词:「社保断缴/代缴」 3. 审核 3 份过期文档(产假规定) [查看详细报告]

8深度规划模块(你加的需求)

六项核心深度功能 + 四项运营增强 + 两项架构预留。按流程图方式展开。

需求 1 全量 QA 清单倒推 + 质量评分(冷启动)

系统上线前跑一次:扫描全部 86 份文档 → 倒推所有可能问答 → 逐条打分 → 输出结论文档(Excel + Markdown),Jocelyn 分批审阅。

流程
86 份文档
LLM 按条款生成 QA500–1500 条
反向用检索验证能否找到支撑?
质量打分准确/完整/清晰/时效
结论文档
Excel + MD
Jocelyn 审阅节奏
分批
每周 100 条
按问题重要性 × 预计员工提问频率降序,12–15 周审完全库
每条可做动作
👍 / ✏️ 改 / ❌ 删
👍 入正式 QA 库;✏️ 改答案/分数;❌ 不要该问答
关键价值:这是系统的"基线"。有了这份清单,新检索系统上线时可以量化对比"命中率提升多少",不是盲飞。
需求 2 文档重构归类 + 钉盘同步

LLM 基于文档内容设计全新的两层分类树(不看旧分类),自动归档到本地 + 同步钉盘。

流程
读全部文档摘要
LLM 设计新分类树大类 / 小类
分配每份到节点
Jocelyn 批准
本地移动 + 钉盘同步
可以重构:灰度测试期,当前是部分复印件,重构不冲击员工习惯,新分类更合理更可扩展。
需求 3 缺失问题 + 答案主动推理

三源融合推出知识库"应该覆盖但还没覆盖"的中高频问题,按重要性排序,给 Jocelyn 补文档的优先级清单。

三源融合
源 A · 真实日志
query_log 里的缺位
员工实际问过但命中低的——最务实
源 B · HR 六大模块
框架全覆盖
招聘/培训/绩效/薪酬/劳动关系/员工关系 逐项扫盲点
源 C · 同行业参考
餐饮连锁常见 HR 问答
LLM 按餐饮典型场景推理(员工大部分是一线伙伴)
输出
中高频缺失清单
100–200 条,按业务重要性排序,每条附"建议补什么文档"
Chuck 批注:算力开到最大慢慢推理,不急。最终产出一份中高频清单即可。
需求 4 管理员钉钉丢文件 · 全链路

Jocelyn 随手钉钉发文件 → 系统自动完成扫描 / 归类 / 入库 / 更新 QA 清单 / 钉盘同步 / 冲突处理。一条流水线。

主流程
钉钉收文件
.doc → .docx
自动转
LLM 判定分类
入库 ingest
增量更新 QA 清单
钉盘同步
冲突分支
检测主题相似文件
冲突?
Jocelyn 二选一
另一份删(本地 + 钉盘)
冲突检测维度:文件名相似度 + 内容主题相似度(LLM 判定)。相同 hash 直接跳过。
需求 5 员工文件申请 + 敏感问题审批流

两种触发:(A)员工主动索要文件;(B)问题涉敏,系统不直接答。两条都走 Jocelyn 审批。

路径 A · 文件申请
员工要"年假规定原件"
生成下载申请单
Jocelyn 批准
钉盘链接
24h 限时
路径 B · 敏感问题(问答也要批)
员工问"总管薪酬"
系统识别敏感
申请单 + draft 答案
Jocelyn 批/改/拒
批准后答案+附件发员工
敏感识别方式
规则层
关键词黑名单
"总管薪资"/"店长年终奖"/"个人隐私"等固定词
LLM 层
语义判敏
涉及管理层薪酬、个人隐私、劳动纠纷、特殊情况的 LLM 自动标敏
记录与汇总
每条记录
申请人 / 时间 / 批准人 / 内容 / 文件
全量落库,可查可追溯
定期汇总
月度给 Jocelyn
谁申请最多 / 哪类问题敏感度最高 / 批准率 / 异常行为告警
需求 6 每周全量备份 → 钉盘

代码 / 电脑配置 / Claude 记忆 / 知识库文件 / 数据库,全部打包加密,自动上传钉盘,给 Jocelyn 发下载链接。

备份内容
代码
scripts / openclaw_skills
全部 .py / .md / .json
配置
openclaw.json / config.json
含 API key → AES-256 加密再打包
记忆
Claude memory 全部 md
只 Jocelyn 侧的,不混其他
知识库
docs + _meta + kb.db
全量文件 + 索引 + 日志
滚动保留策略
每周日 03:00 备份
最近 4 份周备
+
每月 1 份长期月备永久保留
钉盘链接发 Jocelyn
灾难恢复:电脑损坏 / 误删 / 被攻击 时,从钉盘拉一份最近备份即可完整还原。一年约 100GB 钉盘空间。

运营增强 4 项

增强 A
📆 文档时效性巡检
每月 1 号扫一次,标出 12 个月未更新 / 即将过期(含 v2024 等字样)的文档,提醒 Jocelyn 审核。HR 文档过期是隐形雷
增强 C
🔍 对话审计模式
Jocelyn 对 bot 说"搜员工 X 最近对话"→ 返回完整历史。用于劳动纠纷追溯 / 错答排查 / 合规
增强 D
📢 错答主动推送更正
Jocelyn 纠错后,系统查过去 7 天收过旧答的员工名单,询问是否主动推送更正消息
增强 E
🎓 新员工 onboarding
入职日 bot 主动私聊自我介绍 + 推 3–5 个新人高频问题,解决"装了但没人用"的冷启动

架构预留(前期不做,代码留口)

预留
👥 多角色分权
店长 / HR 同事 / 超管 分级权限。config 字段 + userId 表预留;当前仅 Jocelyn 一人超管
预留
🏢 多部门知识库
HR / 财务 / 采购 / 厨房 SOP / 店务。数据库表加 dept 字段;当前仅 HR

9技术可行性审计 · 能不能在钉钉 + OpenClaw 实现

逐项核对了 Motada 现有代码 + 钉钉开放平台能力 + OpenClaw 2026.4.14 机制。结论:整体可行,但有 1 个硬前置 + 3 类外部依赖,必须先让 Jocelyn 知道。

🚧 前置条件(不做就全停)

前置 1
钉钉开放平台 · 云盘读写权限
Jocelyn 登录 open-dev.dingtalk.com → 该应用 → 权限管理 → 添加钉盘权限(约 5 分钟)。没这一步,需求 2/4/5/6 + 增强 A 全部做不了。
前置 2
Windows 11 本机 · 7×24 开机
现系统跑在 Chuck 朋友的 Windows 11 Pro 本机(公网 IP 91.193.19.182),不是云服务器。机器关机 / 系统更新重启 都会中断。建议配不断电 + 自动启动计划任务。
前置 3
海外 API 网络可达
Anthropic / Voyage / Cohere API 需能访问。当前 ANTHROPIC_API_KEY 已验证可用;向量 + 重排会新增 voyage-3-lite + cohere rerank 两个海外 API,需确认网络环境稳定。

✅ 现有代码已具备的能力(保留复用)

已有
钉钉文件接收
receive_file.py 已完工:管理员发文件 → OpenClaw 自动下载 → .doc 转 .docx → ingest。用的是官方 robot/messageFiles API,稳。
已有
Stream 模式接入
OpenClaw 2026.4.14 已通过 WebSocket 接入,不需要 HTTPS / 公网。审批卡片、主动推送、新员工 onboarding 都走这个通道。
已有
三档路由 + [缺位] 自检
answer.py 的 Sonnet / Opus 分层 + 自检已在跑。升级版只需加 Haiku 档和缓存层,核心逻辑不动。
已有
重复问题检测 + usage.log
search.py check_repeat_question 已实现;usage.log 每次调用记 token + 成本。评估集 + 自动回归可直接在上面叠。
已有
OCR + 多格式解析
ingest.py 已支持 .pdf/.docx/.pptx/.xlsx + pytesseract 扫描 PDF 兜底。新需求里的"全量 QA 倒推"可以直接读已切片的 kb.db。
已有
每日 / 每周 cron
daily_ingest 03:00、weekly_report 周一 09:00、weekly_backup 周日 03:00 已跑通。新增时效性巡检 / 错答推送 / onboarding 直接加计划任务。

🆕 需要新开发的能力(重点工作量)

能力工作量所依赖风险
钉盘上传 / 下载链接 / 分享过期钉钉云盘 OpenAPI(需前置 1)首次实现;大文件分片
混合检索(向量 + rerank)sqlite-vec + voyage-3-lite + cohere reranksqlite-vec Windows 兼容性要先测
结构化 chunking(按条款切)regex + Haiku 标注条款边界识别覆盖率
ActionCard 审批流(员工文件 + 敏感问答)钉钉 IM ActionCard API + sqlite 状态机审批超时处理逻辑
override 表 + 自然语言纠错sqlite + Jocelyn 交互 skill纠错指令解析准确度
全量 QA 倒推 + 评分Opus / Sonnet 批量生成冷启动一次性成本 $50–150
缺失问题三源融合推理query_log + Opus成本约 $20–50 一次
答案缓存层(语义)向量库 + TTL要等向量检索先落地
多管理员配置化 + 缺位清单三分类config.json 改字段
文档重构归类 + 冲突检测Sonnet 分类 + hash + 主题相似度批量操作需分批 + 回滚
文档时效性巡检正则 + mtime"过期"定义要和 Jocelyn 对齐
错答主动推送更正query_log 反查推送频率不要打扰员工
对话审计模式query_log 查询 skill合规数据保留期
新员工 onboarding 主动模式钉钉通讯录变更事件订阅事件订阅需额外权限
语音提问阿里云 NLS ASR(海外阻塞时用)语音识别准确度 + 粤语

💰 成本诚实估算

冷启动
一次性 ≈ $80–200
全量 QA 倒推(86 文档生成 ~1000 条 QA)+ 缺失问题推理。Chuck 说"算力开到最大"→ 用 Opus 即上限;用 Sonnet 可降到 $30–60。
日常问答
$15–30 / 月
基于现状 usage.log。加向量 + rerank 后检索成本 × 1.5,但 Haiku 分流 + 缓存能把简单问题降 80%,综合持平或略降。
向量 + 重排
$3–8 / 月
voyage-3-lite ~$0.02/1M tokens,86 文档全库 embedding 一次约 $0.3;日常查询 embedding + cohere rerank 约 $3–8。
存储
$0(钉盘空间内)
每周备份实测规模:kb.db + docs + 记忆 + 代码 ≈ 500MB–2GB,一年约 30–80GB。企业版钉盘通常 1TB 起步,够用。

🔌 外部依赖清单(要申请 / 要装)

类别依赖项状态说明
钉钉开放平台钉盘读写权限待 Jocelyn 开通硬前置,5 分钟操作
钉钉开放平台通讯录变更事件订阅待开通仅 onboarding 需要(P2 才用)
API · AnthropicClaude Haiku / Sonnet / Opus已配ANTHROPIC_API_KEY 已在系统环境变量
API · 向量voyage-3-lite embedding待申请注册 voyageai.com 拿 key
API · 重排cohere rerank-multilingual待申请注册 cohere.com 拿 key
本地 · Python 库sqlite-vec待装 + 测 WindowsWindows 兼容性要实测,失败就 fallback qdrant-local
本地 · OCRTesseract-OCR部分装现系统部分情况静默跳过,要补齐
本地 · Word COMMicrosoft Word(.doc→.docx)已用admin-commands 已在跑
本地 · PDFpoppler (pdf2image)已装ingest.py 在用
底线判断:所有 P0 功能都能在 OpenClaw + 钉钉现有架构上实现,没有触及框架能力边界。最大不确定点是"钉盘 API 实际稳定性"和"sqlite-vec 在 Windows 上跑得动没"——这两个做第二波前先各花半天验证即可。

10功能清单 · 优先级总览

P0 = 必做;P1 = 强烈建议;P2 = 有余力再做;架构预留 = 前期不做但代码留口。

优先功能现状
P0混合检索(BM25 + 向量 + 重排)纯 BM25
P0结构化 chunking定长 700 字
P0查询改写(小模型)替代同义词表手写 30 条
P0多管理员配置化硬编码
P0答案缓存
P0钉盘来源链接待实现
P0Jocelyn 自然语言纠错 → override 表
P0员工 👍👎 一键反馈
P0缺位清单三分类纯列表
P0评估集 + 自动回归
P0🆕 全量 QA 清单倒推 + 评分(冷启动)
P0🆕 缺失问题主动推理清单
P0🆕 每周全量备份到钉盘有 backup.py 但有 bug
P0🆕 文件接收全链路 + 冲突检测基础版已有
P0🆕 员工文件申请 + 敏感问题审批流
P1角色/部门/地区预过滤
P14 档路由(加 Haiku 分流)3 档
P1周报 + 月度文档健康度仅周报
P1成本上限 + 自动降级
P1🆕 文档重构归类 + 钉盘同步
P1🆕 文档时效性巡检
P1🆕 错答主动推送更正
P1🆕 对话审计模式
P2🆕 新员工 onboarding 主动模式
P2语音提问(钉钉语音转文字)
架构预留多角色分权
架构预留多部门知识库(财务/采购/厨房/店务)

11实施路线图 · 第 0 波前置 + 三波升级

别一次重做全部。第 0 波是两天准备动作(大部分 Jocelyn 自己点几下即可),之后分三波升级,每波都有独立产出,风险递减价值递增。

第 0 波 · 约 2 天
前置准备(不做就动不了)
  • Jocelyn 做:登录钉钉开放平台 → 该应用 → 开通钉盘读写权限(5 分钟)
  • Chuck/开发做:申请 voyage-3-lite + cohere rerank API key
  • Chuck/开发做:Windows 上实测 sqlite-vec 能否跑通(失败就换 qdrant)
  • Chuck/开发做:钉盘上传 + 下载链接 demo 验证(5 个文件小规模打通)
第一波 · 约 1 周

Quick Wins(零风险高回报)

  • 多管理员配置化
  • 钉盘来源链接
  • 员工 👍👎 一键反馈
  • 缺位清单三分类 + 周报改版
  • 修已知 bug(backup.py / 手册命令)
  • 员工文件申请(基础版)
✨ 员工和 Jocelyn 立即感到改善,不动核心,几乎零回归风险。
第二波 · 约 3–4 周

检索升级 + 冷启动

  • 加向量检索(voyage-3-lite)+ 重排
  • 结构化 chunking(按条款切)
  • 查询改写(小模型替代同义词)
  • override 表 + 自然语言纠错
  • 评估集 + 每日回归
  • 4 档路由(加 Haiku)+ 成本上限
  • 🆕 全量 QA 清单倒推 + 评分
  • 🆕 缺失问题主动推理清单
  • 🆕 文档重构归类(LLM 设计新分类)
🚀 检索质量从"一般"升到"行业标准";冷启动清单给 Jocelyn 1–3 个月的行动方向。
第三波 · 约 3 周

运营闭环 + 文件全链路

  • 文件接收全链路 + 冲突检测
  • 敏感问题审批流 + 员工文件审批
  • 每周全量备份(代码/配置/记忆/KB)
  • 文档时效性巡检
  • 错答主动推送更正
  • 对话审计模式
  • 新员工 onboarding 主动模式
  • 架构预留:多角色 / 多部门接口
🛡 系统完整运营闭环 + 合规 + 灾备。Jocelyn 几乎不需要技术介入。

12Jocelyn 会关心的问题

会不会中断现在员工用的服务?

不会。第 0 波纯前置配置,主流程不碰。第一波只叠加反馈按钮和配置化。第二、三波在测试环境验证过再切,旧系统留作 fallback。

成本会变多吗?

要分两块看:
冷启动一次性 $80–200(全量 QA 倒推 + 缺失推理,上限是算力开满跑 Opus;用 Sonnet 可降到 $30–60)。
日常运营持平或略降。加向量后每次检索成本 × 1.5,但 Haiku 分流 + 答案缓存能把简单问题降 80%,新增 voyage + cohere 约 $3–8/月,整体月成本 $20–40。
每周全量备份只占钉盘空间,不产生 API 成本。

为什么钉盘权限非开不可?

6 个功能依赖它:备份上传、文档同步、员工文件下载链接、冲突文件删除、重构后归档、时效性巡检标注。没这个权限 6 项全做不了,只能做问答质量升级这一半。所以列为硬前置,5 分钟操作。

全量 QA 清单推出来 500–1500 条,我审得过来吗?

按业务重要性 × 预估员工提问频率降序,每周审 100 条,3 个月左右审完;不重要的尾部可以批量 👍 通过。Jocelyn 不是每条都要动脑子改,大部分是"看一眼 OK 通过"。

文档重构归类会不会把我习惯的分类全打乱?

会,这正是目的。目前是灰度期,重构一次立个更合理的基线。LLM 给的新分类是基于文档内容本身推理的,不是瞎分。Jocelyn 有最终批准权,不满意可以反复调。批准前旧分类不动,批准后一次性迁移 + 钉盘同步。

敏感问题审批会不会太慢?

取决于 Jocelyn 处理速度。可以设置"无人响应 24 小时自动给员工回复:已转人工,预计 X 工作日内答复",避免员工无限等。审批是通过钉钉 ActionCard(聊天里带按钮的卡片),不用走钉钉审批应用——Jocelyn 点一下就处理完。

海外 API 要是哪天访问不了怎么办?

分两种情况:
Anthropic Claude:当前 ANTHROPIC_API_KEY 可用。若被封,可切 Azure / AWS Bedrock 上的 Claude(代码 2 行改)。
Voyage + Cohere:本身就是可选增强,阻塞时降级回纯 BM25(现状水平),不会挂。
整体系统具备"降级而不挂"的能力。

机器 / 电脑出故障了怎么恢复?

每周全量备份到钉盘(加密)包含了:代码 + 配置 + Claude 记忆 + 知识库文件 + 数据库。新电脑装好 Python + OpenClaw,从钉盘拉最近一份备份解压覆盖,一小时内就能跑。灾备的关键是——钉盘权限必须先开

我要自己学技术吗?

不用。新系统的核心是"自然语言就能教 bot"——纠错、审批、补文档、看周报、提需求都在钉钉里完成,不碰代码。

万一我不满意怎么办?

每一步都可回滚。第一波改动都能单独开关;第二、三波上线前会保留旧系统作为 fallback,一条命令切回去。