欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 房产 > 建筑 > DeepSeek学习 一

DeepSeek学习 一

2025/3/10 3:14:53 来源:https://blog.csdn.net/qq_27756989/article/details/146118971  浏览:    关键词:DeepSeek学习 一

DeepSeek学习 一

  • 一、DeepSeek是什么?
  • 二、Deepseek可以做什么?
    • 模型理解
    • 提问内容差异
    • 使用原则
  • 模式认识
    • 三、如何提问?
      • RTGO提示语结构
      • CO-STAR提示语框架
      • DeepSeek R1提示语技巧
  • 总结

一、DeepSeek是什么?

DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应
用。
DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。

二、Deepseek可以做什么?

直接面向用户,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景,
支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。

模型理解

推理模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。
例如:DeepSeek-R1GPT-o3逻辑推理数学推理实时问题解决方面表现突出

通用模型: 适用于大多数任务,通用模型一般侧重于语言生成、上下文理解和自然语言处理,而不强调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像推理模型那样复杂的推理和决策能力。
例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译等任务。
在这里插入图片描述

提问内容差异

在这里插入图片描述

使用原则

在这里插入图片描述

模式认识

基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“规范性 ”任务
深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“开放性 ”任务
联网搜索:RAG(检索增强生成),知识库更新至2024年7月。

三、如何提问?

基础模型(V3):“过程-结果”清晰(指令)
深度思考(R1):目标清晰,结果可以模糊(推理)
不要想一次就出结果,有时需要多次补充才能得到想要的答案

RTGO提示语结构

在这里插入图片描述

CO-STAR提示语框架

在这里插入图片描述

DeepSeek R1提示语技巧

在这里插入图片描述

总结

这次学习主要是认识DeepSeek,已经提问时的一些技巧。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词