12月26日,Deepseek发布了全新系列模型DeepSeek-v3,一夜之间霸榜开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet相提并论。
该模型为MOE架构,大大降低了训练成本,据说训练成本仅600万美元,成本降低10倍,资源运用效率极高。有AI投资机构负责人直言,DeepSeek发布的53页的技术论文是黄金
使用总结如下:
一、deepseek介绍
用很低的成本训练出和gpt4差不多性能的模型;
二、本地化部署
deepseek V2版本可用ollama集成搭建本地服务,模型大概100G;
三、deepseek开放平台
1、平台地址:https://platform.deepseek.com
2、赠送10元500万个token
3、使用vscode加载cline插件,调用api接口,
输入api key,选择deepseek模型就可以调用开放平台的接口了。
1)聊天交互
提交一份本地文档,做文档总结和分析;日常问题的提问;
====和大模型差不多;
2)生成代码:
生成一个贪吃蛇的网页,会在本地生成html,js,css三个文件,运行贪吃蛇游戏;
====大模型能力,无法在本地直接生成可运行的代码;
3)生成图
调用第三方的api
为了创建图像生成MCP服务器,我需要您获取一个Stable Diffusion API密钥。请按照以下步骤操作:
访问https://stability.ai/并创建一个账户
登录后,进入API Keys页面
生成一个新的API密钥
将生成的API密钥复制并告诉我
请注意,Stable Diffusion API可能需要付费使用。您可以在他们的网站上查看定价详情。
4)生成视频
也是调用第三方api
为了创建视频生成MCP服务器,我需要您获取一个RunwayML API密钥。请按照以下步骤操作:
访问https://runwayml.com/并创建一个账户
登录后,进入API Keys页面
生成一个新的API密钥
将生成的API密钥复制并告诉我
请注意,RunwayML API可能需要付费使用。您可以在他们的网站上查看定价详情。
5)生成ppt
为了创建PPT,我需要了解以下信息:
-
请描述PPT的主题和具体内容要求。
-
目标受众是谁?(例如:公司内部、客户、学生等)
-
是否有特定的品牌风格或模板要求?
-
需要多少页?每页的大致内容是什么?