GSIT
深入解析

【揭密协议 之二】结合 Schema、Prompt 与 Validation:降低 AI 幻觉与错误回写

发布时间 最后更新 作者 GSIT 編輯部

Schema 不能让 AI 完全消除幻觉,但能大幅降低错误进入系统的机率。 AI Ready 应把 prompt、数据 schema、输出 schema、字段白名单、验证失败处理与人工审核串成一套流程。

作者

AI 电商系统整合与内容治理团队

GSIT 编辑部专注于 AI Ready 电商架构、跨平台整合、SEO/AEO 内容治理、数据保护与自动化工作流,协助企业以可审核、可审计的方式引入 AI。

重点摘要

  • Schema 不能让 AI 完全消除幻觉,但能大幅降低错误进入系统的机率。
  • AI Ready 应把 prompt、数据 schema、输出 schema、字段白名单、验证失败处理与人工审核串成一套流程。
  • AI 提示词工程师与系统整合规划师。 需要让模型输出可回写 JSON 的后端工程师。 正在处理商品、订单、客服数据自动化的电商技术团队。

直接答案:Schema 不能让 AI 完全消除幻觉,但能大幅降低错误进入系统的机率。 AI Ready 应把 prompt、数据 schema、输出 schema、字段白名单、验证失败处理与人工审核串成一套流程。

这篇文章适合谁?#

  • AI 提示词工程师与系统整合规划师。

  • 需要让模型输出可回写 JSON 的后端工程师。

  • 正在处理商品、订单、客服数据自动化的电商技术团队。

为什么单靠 Prompt 不够?#

Prompt 可以告诉模型「请回传 JSON」或「不要编造商品资讯」,但模型仍可能:

  • 回传不存在的字段。

  • 把价格、库存或材质改错。

  • 产生无法解析的 JSON。

  • 在客服回覆中做出未授权承诺。

  • 把建议内容写成正式决策。

因此 AI Ready 需要把 prompt 后面接上 validation。模型输出不是流程终点,而是待验证数据。

Schema Context:让模型理解可用字段#

在送出任务前,系统应提供必要 schema context:

{
  "resource": "product",
  "writable_fields": {
    "draft_short_description": "string, max 280 chars",
    "draft_long_description": "string, max 3000 chars",
    "meta_title": "string, max 70 chars",
    "meta_description": "string, max 155 chars"
  },
  "read_only_fields": ["sku", "price", "stock_quantity", "certifications"],
  "required_output_fields": ["draft_short_description", "meta_description"]
}

这让模型知道哪些字段可以写、哪些只能参考。

Output Schema:让系统能验证#

{
  "type": "object",
  "required": ["draft_short_description", "meta_description"],
  "additionalProperties": false,
  "properties": {
    "draft_short_description": {
      "type": "string",
      "maxLength": 280
    },
    "meta_description": {
      "type": "string",
      "maxLength": 155
    },
    "faq": {
      "type": "array",
      "maxItems": 5
    }
  }
}
`

additionalProperties: false` 很重要,因为它可以拒绝模型自行新增字段。

验证失败时该怎么办?#

不要自动硬修所有错误。建议分级处理:

  • JSON 无法解析:要求模型重试一次,仍失败则人工处理。

  • 字段长度超过:可要求模型缩短。

  • 出现禁止字段:拒绝输出并记录事件。

  • 商品事实不一致:进人工审核。

  • 高风险承诺:拦截并标记风险。

Prompt 设计范例#

你是電商商品內容助理。
只能根據 data.attributes 與 data.product_name 產生內容。
不得新增價格、保固、認證、醫療效果或庫存資訊。
輸出必須符合 output_schema。
如果数据不足,請在 notes 欄位列出需要人工補充的資訊。

Prompt 的目标不是让模型「自由发挥」,而是让它在系统边界内完成特定任务。

人工审核仍不可省略#

即使 schema 验证通过,也不代表内容一定正确。 Schema 只能验证格式,不能完全验证商业事实。以下内容建议人工审核:

  • 高流量商品页。

  • 法规敏感品类。

  • 价格、折扣、退款。

  • 医疗、食品、安全相关描述。

  • 多语高价值市场。

FAQ#

Schema 能完全消除 AI 幻觉吗?#

不能。 Schema 可以限制格式与字段,降低错误进入系统的机率,但仍需要数据验证、事实检查与人工审核。

Prompt Engineering 还重要吗?#

重要,但它应与 schema、validation、权限与审核一起使用。只靠 prompt 管控系统风险是不够的。

什么情况可以自动回写?#

只有低风险、可回滚、字段受限且验证通过的内容适合自动回写,例如内部草稿或图片 ALT 候选。正式页面仍建议审核。

参考资料#

Content Map

Series: AI Ready 协议深潜

Pillar: AI Ready 技术架构

常见问题

这篇文章适合谁?

AI 提示词工程师与系统整合规划师。 需要让模型输出可回写 JSON 的后端工程师。 正在处理商品、订单、客服数据自动化的电商技术团队。

为什么单靠 Prompt 不够?

Prompt 可以告诉模型「请回传 JSON」或「不要编造商品资讯」,但模型仍可能: 回传不存在的字段。 把价格、库存或材质改错。 产生无法解析的 JSON。 在客服回覆中做出未授权承诺。 把建议内容写成正式决策。 因此 AI Ready 需要把 prompt 后面接上 validation。模型输出不是流程终点,而是待验证数据。

验证失败时该怎么办?

不要自动硬修所有错误。建议分级处理: JSON 无法解析:要求模型重试一次,仍失败则人工处理。 字段长度超过:可要求模型缩短。 出现禁止字段:拒绝输出并记录事件。 商品事实不一致:进人工审核。 高风险承诺:拦截并标记风险。

Next Step

延伸阅读与下一步

从相关分类、产品页与 Docs 中继续完成主题研究与实施评估。