• 意图识别等快速场景,使用推理模型需要关闭推理能力
  • 历史对话位于整个提示词末尾,上旧下新,最后一句是用户当前query