【揭密协议 之二】结合 Schema、Prompt 与 Validation:降低 AI 幻觉与错误回写
Schema 不能让 AI 完全消除幻觉,但能大幅降低错误进入系统的机率。 AI Ready 应把 prompt、数据 schema、输出 schema、字段白名单、验证失败处理与人工审核串成一套流程。
重点摘要
- Schema 不能让 AI 完全消除幻觉,但能大幅降低错误进入系统的机率。
- AI Ready 应把 prompt、数据 schema、输出 schema、字段白名单、验证失败处理与人工审核串成一套流程。
- AI 提示词工程师与系统整合规划师。 需要让模型输出可回写 JSON 的后端工程师。 正在处理商品、订单、客服数据自动化的电商技术团队。
直接答案:Schema 不能让 AI 完全消除幻觉,但能大幅降低错误进入系统的机率。 AI Ready 应把 prompt、数据 schema、输出 schema、字段白名单、验证失败处理与人工审核串成一套流程。
这篇文章适合谁?#
AI 提示词工程师与系统整合规划师。
需要让模型输出可回写 JSON 的后端工程师。
正在处理商品、订单、客服数据自动化的电商技术团队。
为什么单靠 Prompt 不够?#
Prompt 可以告诉模型「请回传 JSON」或「不要编造商品资讯」,但模型仍可能:
回传不存在的字段。
把价格、库存或材质改错。
产生无法解析的 JSON。
在客服回覆中做出未授权承诺。
把建议内容写成正式决策。
因此 AI Ready 需要把 prompt 后面接上 validation。模型输出不是流程终点,而是待验证数据。
Schema Context:让模型理解可用字段#
在送出任务前,系统应提供必要 schema context:
{
"resource": "product",
"writable_fields": {
"draft_short_description": "string, max 280 chars",
"draft_long_description": "string, max 3000 chars",
"meta_title": "string, max 70 chars",
"meta_description": "string, max 155 chars"
},
"read_only_fields": ["sku", "price", "stock_quantity", "certifications"],
"required_output_fields": ["draft_short_description", "meta_description"]
}
这让模型知道哪些字段可以写、哪些只能参考。
Output Schema:让系统能验证#
{
"type": "object",
"required": ["draft_short_description", "meta_description"],
"additionalProperties": false,
"properties": {
"draft_short_description": {
"type": "string",
"maxLength": 280
},
"meta_description": {
"type": "string",
"maxLength": 155
},
"faq": {
"type": "array",
"maxItems": 5
}
}
}
`
additionalProperties: false` 很重要,因为它可以拒绝模型自行新增字段。
验证失败时该怎么办?#
不要自动硬修所有错误。建议分级处理:
JSON 无法解析:要求模型重试一次,仍失败则人工处理。
字段长度超过:可要求模型缩短。
出现禁止字段:拒绝输出并记录事件。
商品事实不一致:进人工审核。
高风险承诺:拦截并标记风险。
Prompt 设计范例#
你是電商商品內容助理。
只能根據 data.attributes 與 data.product_name 產生內容。
不得新增價格、保固、認證、醫療效果或庫存資訊。
輸出必須符合 output_schema。
如果数据不足,請在 notes 欄位列出需要人工補充的資訊。
Prompt 的目标不是让模型「自由发挥」,而是让它在系统边界内完成特定任务。
人工审核仍不可省略#
即使 schema 验证通过,也不代表内容一定正确。 Schema 只能验证格式,不能完全验证商业事实。以下内容建议人工审核:
高流量商品页。
法规敏感品类。
价格、折扣、退款。
医疗、食品、安全相关描述。
多语高价值市场。
FAQ#
Schema 能完全消除 AI 幻觉吗?#
不能。 Schema 可以限制格式与字段,降低错误进入系统的机率,但仍需要数据验证、事实检查与人工审核。
Prompt Engineering 还重要吗?#
重要,但它应与 schema、validation、权限与审核一起使用。只靠 prompt 管控系统风险是不够的。
什么情况可以自动回写?#
只有低风险、可回滚、字段受限且验证通过的内容适合自动回写,例如内部草稿或图片 ALT 候选。正式页面仍建议审核。
参考资料#
- JSON Schema,https://json-schema.org/
- Google Search Central: structured data introduction,https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data
Content Map
Series: AI Ready 协议深潜
Pillar: AI Ready 技术架构
常见问题
这篇文章适合谁?
AI 提示词工程师与系统整合规划师。 需要让模型输出可回写 JSON 的后端工程师。 正在处理商品、订单、客服数据自动化的电商技术团队。
为什么单靠 Prompt 不够?
Prompt 可以告诉模型「请回传 JSON」或「不要编造商品资讯」,但模型仍可能: 回传不存在的字段。 把价格、库存或材质改错。 产生无法解析的 JSON。 在客服回覆中做出未授权承诺。 把建议内容写成正式决策。 因此 AI Ready 需要把 prompt 后面接上 validation。模型输出不是流程终点,而是待验证数据。
验证失败时该怎么办?
不要自动硬修所有错误。建议分级处理: JSON 无法解析:要求模型重试一次,仍失败则人工处理。 字段长度超过:可要求模型缩短。 出现禁止字段:拒绝输出并记录事件。 商品事实不一致:进人工审核。 高风险承诺:拦截并标记风险。
Next Step
延伸阅读与下一步
从相关分类、产品页与 Docs 中继续完成主题研究与实施评估。