DeepSeek学习 一
- 一、DeepSeek是什么?
- 二、Deepseek可以做什么?
- 模型理解
- 提问内容差异
- 使用原则
- 模式认识
- 三、如何提问?
- RTGO提示语结构
- CO-STAR提示语框架
- DeepSeek R1提示语技巧
- 总结
一、DeepSeek是什么?
DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应
用。
DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。
二、Deepseek可以做什么?
直接面向用户,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,
支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。
模型理解
推理模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。
例如:DeepSeek-R1
,GPT-o3
在逻辑推理
、数学推理
和实时问题解决方面
表现突出
通用模型: 适用于大多数任务,通用模型一般侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。
例如:GPT-3、GPT-4(OpenAI),BERT(Google)
,主要用于语言生成、语言理解、文本分类、翻译
等任务。
提问内容差异
使用原则
模式认识
基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“规范性 ”任务
深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“开放性 ”任务
联网搜索:RAG(检索增强生成),知识库更新至2024年7月。
三、如何提问?
基础模型(V3):“过程-结果”清晰(指令)
深度思考(R1):目标清晰,结果可以模糊(推理)
不要想一次就出结果,有时需要多次补充才能得到想要的答案
RTGO提示语结构
CO-STAR提示语框架
DeepSeek R1提示语技巧
总结
这次学习主要是认识DeepSeek,已经提问时的一些技巧。