2026年4月19日

提示词基础

1. **清晰明确**:任务描述不含歧义,目标明确

知识库大模型提示词与上下文promptingllm

提示词基础

1. 提示词设计原则

核心原则

  1. 清晰明确:任务描述不含歧义,目标明确
  2. 结构化:使用分隔符、标签、编号组织内容
  3. 示例驱动:通过示例展示期望的输出格式和行为
  4. 迭代优化:根据输出反馈持续改进提示词

提示词基本结构

[角色设定]   ← 定义模型的角色和行为边界
[背景信息]   ← 提供必要的上下文
[任务描述]   ← 明确说明要做什么
[格式要求]   ← 指定输出格式
[示例]       ← 展示期望的输入-输出模式
[约束条件]   ← 限制条件与注意事项

QUESTION 面试高频:好的提示词应该包含哪些要素? 一个完整的提示词应包含:角色设定、任务描述、上下文信息、输出格式要求、示例(Few-shot)、约束条件。要素的取舍取决于任务复杂度。

2. 提示技术分类

按示例数量分类

类别 方法 说明 适用场景
Zero-shot 直接描述任务 无示例 简单通用任务
One-shot 提供一个示例 基本引导 格式要求明确的任务
Few-shot 提供多个示例 模式学习 复杂任务、特定格式
Few-shot CoT 提供带推理链的示例 推理引导 数学、逻辑推理

按推理策略分类

策略 方法 核心
直接回答 Standard Prompting 模型直接生成答案
逐步推理 Chain-of-Thought 分步推理后给出答案
自我验证 Self-Consistency 多次采样+投票
分解任务 Least-to-Most 将复杂问题分解为子问题

3. Few-Shot 提示学习

基本原理

Few-shot prompting 通过在上下文中提供少量示例,让模型"即时学习"任务模式,无需参数更新。

QUESTION 面试高频:Few-shot 提示的效果受哪些因素影响?

  • 示例数量:3-8 个通常效果最佳,过多会稀释注意力
  • 示例格式:统一的输入-输出格式有助于模型理解
  • 示例相关性:与目标任务越相似效果越好
  • 示例顺序:靠近查询的示例影响更大(recency bias)
  • 示例标签质量:错误标签会误导模型
  • 标签分布:正负样本应相对均衡

Few-shot 示例选择策略

静态选择    → 手动筛选最优示例(成本高但质量好)
随机选择    → 从候选池随机抽取(简单但效果不稳定)
相似度选择  → 用 Embedding 做 KNN 检索(自动且效果好)
聚类选择    → 从聚类中心选代表(覆盖多样性)

Few-shot vs Fine-tuning

维度 Few-shot Fine-tuning
参数更新
数据需求 3-10 个示例 数千到数万条
计算成本 极低
灵活性 高(随时更换) 低(需重新训练)
性能上限 受上下文窗口限制 理论更高
适用场景 快速原型、轻量任务 生产部署、复杂任务

4. 温度与采样策略

核心参数

参数 作用 推荐值
temperature 控制输出随机性 0(确定性)/ 0.7(创意)
top_p 核采样,限制候选 Token 概率质量 0.9
top_k 限制候选 Token 数量 40-50
max_tokens 控制最大输出长度 按需设置
frequency_penalty 惩罚高频 Token 0-1
presence_penalty 惩罚已出现的 Token 0-1

Temperature 的影响

P(xi)=exp(zi/T)jexp(zj/T)P(x_i) = \frac{\exp(z_i / T)}{\sum_j \exp(z_j / T)}

  • T → 0:趋向贪心解码(argmax),输出确定
  • T = 1:原始分布,正常采样
  • T → ∞:均匀分布,随机采样
场景推荐:
- 代码生成:T=0(确定性输出)
- 文本摘要:T=0.3(略确定性)
- 对话系统:T=0.7(适度创造性)
- 创意写作:T=1.0+(高创造性)
- CoT 推理:T=0(单路径)/ T>0(Self-Consistency)

5. 提示词设计模式

5.1 角色设定模式

你是一位资深的 Python 开发工程师,擅长编写高性能、可维护的代码。
请帮我完成以下任务:...

5.2 输入-输出格式模式

将以下文本翻译为英文。
输入:{text}
输出:

5.3 思维链模式

请逐步分析以下问题,展示完整的推理过程:
{question}
让我们一步步思考。

5.4 约束条件模式

请完成以下任务,同时遵守以下约束:
1. 回答不超过 200 字
2. 使用 Markdown 格式
3. 包含至少一个代码示例

6. 常见陷阱与最佳实践

常见陷阱

陷阱 说明 解决方案
指令模糊 "帮我写点东西" 明确目标、格式、长度
负面指令失效 "不要输出 JSON" 改用正面指令 "输出纯文本"
过长提示 塞入过多无关信息 精简到核心信息
格式不一致 示例与要求格式不匹配 统一格式模板
忽略输出 不验证输出是否符合预期 添加格式校验逻辑

最佳实践

  1. 版本管理:对提示词做版本控制,追踪效果变化
  2. A/B 测试:对比不同提示词的效果差异
  3. 变量抽取:将可变部分参数化,便于模板复用
  4. 边界测试:测试极端输入下的表现
  5. 迭代优化:基于输出反馈持续改进

相关笔记思维链与推理策略系统提示词上下文工程结构化输出