一、什么是 DeepSeek
1. DeepSeek 简介
-
DeepSeek 是一家专注于通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。
-
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版
2. 应用场景
-
智能对话: DeepSee可以用于聊天机器人、客服系统等领域,实现人机交互;
-
文本生成: DeepSeek可以用于文本创作,摘要改写、结构化生成日程安排、菜谱等内容,大大提高了文本创作的工作效率;
-
语义理解: DeepSeek可以用识别用户意图,分析用户情感;也可以识别自然语言中的实体、关系、事件等信息对文章内容进行分类;还能阅读文章协作分析事件关联性,为我们提供一些逻辑问题的解答;
-
计算推理: DeepSeek可以进行数学计算、逻辑推理等操作,辅助科研人员进行研究工作;
-
代码生成补全: DeepSeek可以根据用户的输入,自动补充代码,优化代码,以及为代码生成API文档提高编程效率。
-
图表绘制: DeepSeek可以根据用户的输入绘制SVG矢量图、Mermaid图表、React图表。
二、如何使用 DeepSeek
🏖️ 当人人都能使用AI时,你如何才能变得更出彩?……让 AI 带有自己的Tag ——
(一)先了解各种大模型的能力
1. 什么是推理模型?
-
推理模型 是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力
-
推理模型 擅长数学推导、逻辑分析、代码生成、复杂问题拆解**,但不适用于**发散性任务(如诗歌创作)
-
推理模型 专精于逻辑密度高的任务,并非全面更强,仅在其训练目标领域显著优于通用模型
-
比较热门的推理模型例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出
2. 什么是通用模型?
-
通用模型 是指适用于大多数任务,侧重于语言生成、上下文理解和自然语言处理的模型。这类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。
-
通用模型擅长文本生成、创意写作、多轮对话、开放性问答**,但不适用于**需要严格逻辑链的任务(如数学证明)
-
通用模型则擅长多样性高的任务,通用场景更灵活,但专项任务需依赖提示语补偿能力
-
比较热门的通用模型例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译等任务。
3. 对比推理模型提示词与通用模型提示语策略的差异
-
推理模型 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑;无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。
-
通用模型 需显式引导推理步骤(如通过CoT提示),否则可能跳过关键逻辑。依赖提示语补偿能力短板(如要求分步思考、提供示例)。
关键点:CoT链式思维的出现也将大模型分为了这两类:“概率预测(快速反应)”模型 和 “链式推理(慢速思考)”模型
1. 什么是 “概率预测(快速反应)”模型?
-
概率预测模型是基于概率预测,通过大量数据训练来快速预测可能的答案。 适合快速反馈,处理即时任务,响应速度快,算力成本低。
-
概率预测模型的特点:
-
快速响应:能够在短时间内生成回答,适合需要即时反馈的场景。
-
基于概率:通过大量数据训练,快速预测可能的答案。
-
简洁指令:提示语简洁,只需明确任务目标和需求。
-
-
概率预测模型的应用场景:
-
客户服务:实时回答用户问题,提供快速反馈。
-
社交媒体:快速生成内容,如推文、帖子。
-
在线聊天:与用户进行即时互动,提供即时支持。
-
2. 什么是 “链式推理(慢速思考)”模型?
-
链式推理模型是基于链式思维(Chain-of-Thought)逐步推理问题的每个步骤来得到答案。 通过推理解决复杂问题,慢速思考,算力成本高。
-
链式模型的特点:
-
逐步推理:通过逐步分析问题,生成详细的回答。
-
复杂任务:擅长处理需要深度思考和逻辑推理的任务。
-
详细指导:需要显式引导推理步骤,可能依赖提示语补偿能力短板
-
-
链式模型模型的应用场景:
-
学术研究:撰写学术论文、研究报告。
-
复杂问题解决:如数学证明、逻辑分析。
-
创意写作:生成具有深度和创意的内容。
-
(二) 如何设计 DeepSeek 模型的提示词
1. 设计提示词的关键原则如下
-
选择模型: 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用模型)。
-
设计提示词
-
推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。
-
通用模型:结构化、补偿性引导(“缺什么补什么”)。
-
-
依据模型的反馈修改提示词
-
不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线
-
不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果
-
2. 如何向AI表达需求:不同类型的需求及其表达方式
-
确定任务目标: 明确任务的核心目标,避免冗余指令,聚焦于任务的关键点。策略如下
-
指令驱动: 直接给出明确步骤或 格式要求;简单任务、需快速执行。
提示词案例: 侧重与代码生成
1. **代码生成** 提示词案例:用Python编写快速排序函数,输出需包含注释.这类提示词的优势与风险:✅ 结果精准高效❌ 限制模型自主优化空间1. **针对推理模型:**“用Python实现快速排序”需避免的提示策略:分步指导(如“先写递归函数”)1. **针对通用模型:**“先解释快速排序原理,再写出代 码并测试示例”需避免的提示策略:模糊需求(如“写个排序代码”)
-
需求导向: 描述问题背景与目标, 由模型规划解决路径;复杂问题、需模型自主 推理
提示词案例: 侧重于逻辑分析,向AI抛出问题,询问方案
1. **设计方案:** 我需要优化用户登录流程,请分析当前瓶颈并提出3种方案。 **这类提示词的优势与风险:**✅激发模型深层推理❌需清晰定义需求边界1. 针对**推理模型** 提示词:“分析‘电车难题’中的功利主义 与道德主义冲突”思路:添加主观引导(如“你认为哪种对?”)1. 针对**通用模型** 提示词:“先解释电车难题的定义,再对比 两种伦理观的差异”思路:一次性提问复杂逻辑
-
混合模式: 结合需求描述与关键约束条件;注重平衡灵活性与可控性。
提示词案例:创意写作, 鼓励发散性,设定角色/风格。
1. 设计一个杭州三日游计划,要求包含西湖和灵隐寺,且预算控制在2000元内。 **这类提示词的优势与风险:**✅兼顾目标与细节❌需避免过度约束1. **推理模型:**“以海明威的风格写一个冒险故事”思路:过度约束逻辑(如“按时间顺序列出”)1. **通用模型:**“写一个包含‘量子’和‘沙漠’ 的短篇小说,不超过200字”思路:开放式指令(如“自由创作”)
-
启发式提问: 通过提问引导模型主 动思考(如“为什 么”“如何”);探索性问题、需模型解 释逻辑。
提示词案例: 多轮对话,与AI自然交互,无需结构化指令。
1. 为什么选择梯度下降法解决此优化问题?请对比其他算法。**这类提示词的优势与风险:**✅ 触发模型自解释能力❌可能偏离核心目标1. **推理模型:**“你觉得人工智能的未来会怎样?”思路:强制逻辑链条(如“分三点回答”)1. **通用模型:**“从技术、伦理、经济三方面分析 AI的未来”思路:情感化提问(如“你害怕AI吗?”)
-
-
简化提示语的结构:尽量使用简洁明了的语言描述任务,避免复杂的结构化模板。
-
决策需求模版:适用于直接建议,依赖模型经验归纳
需求表达式: 目标 + 选项 + 评估标准
**提示词案例:**"为降低物流成本,现有两种方案:1. 自建区域仓库(初期投入高,长期成本低)2. 与第三方合作(按需付费,灵活性高) 请根据ROI计算模型,对比5年内的总成本并推荐最优 解。"
-
分析需求模版:适用于表层总结或分类
需求表达式: 问题 + 数据/信息 + 分析 方法
**提示词案例:**"分析近三年新能源汽车销量数据(附CSV),说明:1. 增长趋势与政策关联性; 2. 预测2025年市占率,需使用ARIMA模型并解释参数 选择依据。
-
创造性需求模版:适用于自由发散,依赖示例引导
需求表达式: 主题 + 风格/约束 + 创新 方向
**提示词案例:**"设计一款智能家居产品,要求:① 解决独居老人安全问题;② 结合传感器网络和AI预警;③ 提供三种不同技术路线的原型草图说明。
-
验证需求模版:适用于简单确认,缺乏深度推演
需求表达式: 结论/方案 + 验证方法 + 风险点
**提示词案例:**"以下是某论文结论:'神经网络模型A优于传统方法B'。 请验证: ① 实验数据是否支持该结论; ② 检查对照组设置是否存在偏差; ③ 重新计算p值并判断显著性。"
-
执行需求模版:适用于严格按指令执行,无自主优化
需求表达式: 任务 + 步骤约束 + 输出格式
**提示词案例:**"将以下C语言代码转换为Python,要求: ① 保持时间复杂度不变; ② 使用numpy优化数组操作; ③ 输出带时间测试案例的完整代码。"
-
-
高阶技巧
-
角色与场景设定:通过设定特定的角色和场景,激活模型的特定知识图谱,结合领域与场景进行任务处理。
-
系统化框架设计:使用思维链驱动的方法,强制模型分步推理,确保逻辑清晰。
-
CO-STAR框架:构建完整的指令体系,包括背景、目标、风格、语调、受众和回应。
-
约束与扩展:结合专业术语和通俗解释,确保结果的准确性和可理解性。
-
伦理边界盒植入:动态约束模型的输出,防止结果偏离价值观。1
-
3. 自己构建提示词:有用的不是提示词,而是你的思维与表达方式。
-
什么是提示语 (Prompt): 提示语是用户输入给AI系统的指令或信息, 简单来说就是我们与AI“对话”时所使用的语言,它可以是一个简单的问 题,一段详细的指令,也可以是一个复杂的任务描述。
-
提示语的基本结构: 包括指令、上下文和期望
-
指令(Instruction):这是提示语的核心,明确告诉AI你希望 它执行什么任务。
-
上下文(Context):为AI提供背景信息,帮助它更准确地理 解和执行任务。
-
期望(Expectation):明确或隐含地表达你对AI输出的要求 和预期。
-
-
提示语的本质
沟通桥梁 连接人类意图和AI理解 “将以下内容翻译为法语:Hello, world”
**上下文提供** 者 为AI提供必要的背景信息 “假设你是一位19世纪的历史学家,评论拿 破仑的崛起” **任务定义器** 明确指定AI需要完成的任务 “为一篇关于气候变化的文章写一个引言, 长度200字” **输出塑造器** 影响AI输出的形式和内容 “用简单的语言解释量子力学,假设你在跟 一个10岁的孩子说话” **AI能力引导** 器 引导AI使用特定的能力或技 能 “使用你的创意写作能力,创作一个关于时 间旅行的短篇故事”
-
提示语的实用技巧
-
立角色:通过设定角色,激活模型的特定能力包,简化任务描述。
-
述问题:清晰描述任务的具体问题,确保模型能够理解任务需求。
-
定目标:明确任务的目标,确保模型的输出符合预期。
-
补要求:对任务进行补充要求,如格式、长度限制等。
-
三、DeepSeek在各个场景下的实践案例
待更新……