提示词工程的可维护实践
提示词不是一次性文本,而是应用逻辑的一部分。只要它影响线上结果,就应该被版本化、评测和审查。
结构化管理
把提示词拆成角色、任务、约束、输入格式、输出格式和示例。这样做可以降低修改风险,也方便定位是哪一段指令导致行为变化。
text
角色:你是企业知识库问答助手。
任务:基于给定资料回答用户问题。
约束:不能编造资料中不存在的信息。
输出:先给结论,再列出依据来源。版本与回滚
每次改动提示词都应该留下版本号、改动原因和评测结果。线上出现异常时,可以快速回滚到上一个稳定版本。
测试样例
提示词测试不需要一开始就很复杂。可以先维护三类样例:
- 高频正常问题。
- 边界问题,例如资料缺失、表达含糊、权限不足。
- 历史失败问题。
输出约束
当应用需要稳定消费模型结果时,优先使用 JSON schema 或结构化输出能力,而不是只在自然语言里描述“请输出 JSON”。
小结
好的提示词工程不是堆更多指令,而是让提示词变得可读、可测、可追踪。工程体系越完整,模型升级和业务变化时越不容易失控。
