本地基于Ollama部署的DeepSeek详细接口文档说明

前文，我们已经在本地基于Ollama部署好了DeepSeek大模型，并且已经告知过如何查看本地的API。为了避免网络安全问题，我们希望已经在本地调优的模型，能够嵌入到在本地的其他应用程序中，发挥本地DeepSeek的作用。因此需要知道本地DeepSeek的API结构，知道什么接口地址要输入什么参数，以及如何使用。

前置文章：

（1）个人windows电脑上安装DeepSeek大模型：https://lzm07.blog.csdn.net/article/details/145491693

（2）查看和使用本地Windows系统下通过Ollama部署的DeepSeek模型的API：https://lzm07.blog.csdn.net/article/details/145601121

先了解接口的详细内容，再postman对接口进行验证。

一、核心接口文档说明

1. ‌模型列表查询‌

‌接口地址‌：GET http://localhost:11434/api/tags

‌功能‌：获取本地已部署的模型列表，包含模型名称、版本及大小信息‌。

‌响应示例‌（json）：

{"models": [{"name": "deepseek-r1:8b", "modified_at": "2025-03-20T12:00:00Z", "size": 8.2e9}]}

2. ‌文本生成‌

‌接口地址‌：POST http://localhost:11434/api/generate

‌功能：根据输入提示生成文本内容，支持代码、文章、问答等场景‌。

请求参数（json）‌：

{"model": "deepseek-r1:8b",  // 必填，需与本地模型名称一致‌:ml-citation{ref="2,4" data="citationList"}"prompt": "输入问题",        // 必填"stream": false,           // 是否流式输出（默认true）‌:ml-citation{ref="4,7" data="citationList"}"temperature": 0.7,        // 随机性控制（0-1，默认0.8）‌:ml-citation{ref="4,7" data="citationList"}"max_tokens": 1000         // 最大输出长度‌:ml-citation{ref="4,7" data="citationList"}}

‌响应示例‌（json）：

{"response": "生成内容","created_at": "2025-03-21T10:00:00Z","done": true}

3. ‌对话交互‌

‌接口地址‌：POST http://localhost:11434/api/chat

‌‌功能‌: 支持多轮对话交互，维护上下文语义。

请求参数（json）‌：

{"model": "deepseek-r1:8b","messages": [{"role": "user", "content": "你好"},{"role": "assistant", "content": "有什么可以帮助您？"}],"options": {"temperature": 0.7,      // 可选参数‌:ml-citation{ref="4,7" data="citationList"}"num_ctx": 4096          // 上下文窗口大小‌:ml-citation{ref="7" data="citationList"}}}

‌响应示例（json）‌：

{"message": {"role": "assistant", "content": "回复内容"},"done": true}

二、模型管理接口

4. ‌拉取模型‌

‌接口地址‌：POST http://localhost:11434/api/pull

‌功能‌: 从仓库下载指定模型到本地。

请求参数（json）‌：

{"name": "deepseek-r1:14b",  // 需与模型仓库名称一致‌:ml-citation{ref="5,8" data="citationList"}"stream": false             // 是否显示下载进度流‌:ml-citation{ref="5,8" data="citationList"}}

‌响应示例‌（json）：

{"status": "success", "digest": "sha256:..."}

5. ‌创建自定义模型‌

‌接口地址‌：POST http://localhost:11434/api/create

‌

请求参数‌（json）：

{"name": "custom-model",    // 自定义模型名称"modelfile": "FROM deepseek-r1:8b\nPARAMETER temperature 0.9"  // 模型配置文件‌:ml-citation{ref="5,8" data="citationList"}}

6. ‌删除模型‌

‌接口地址‌：DELETE http://localhost:11434/api/delete

‌功能‌: 移除本地已部署的模型。

请求参数‌（json）：

{"name": "deepseek-r1:1.5b"}  // 需删除的模型名称‌:ml-citation{ref="6,8" data="citationList"}

三、高级接口

7. ‌查看模型信息‌

‌接口地址‌：GET http://localhost:11434/api/show

‌请求参数‌（json）：

{"name": "deepseek-r1:8b"}    // 模型名称‌:ml-citation{ref="8" data="citationList"}

‌响应示例（json）‌:

{"license": "Apache-2.0","modelfile": "...","parameters": "temperature 0.8"}

‌8. 流式响应处理‌

‌说明‌: 在请求（文本生成/对话）中设置 "stream": true 时，响应将以数据流形式分块返回‌。

‌‌数据格式‌: 分块返回SSE（Server-Sent Events）格式数据。

示例‌（使用 curl）（CMD中执行）:

curl http://localhost:11434/api/generate -d '{"model": "deepseek-r1:8b","prompt": "写一首关于春天的诗","stream": true}'

四、Postman下载安装

了解了以上接口之后，我们要先对接口进行验证，看接口的地址、类型、以及请求的参数是否都正常，便于之后在其他程序中应用这些接口。当前我们使用来postman验证接口。

先下载和安装postman程序。

1. 下载postman

官方网址：https://www.postman.com/downloads/

2. postman安装

点击Postman-win64-Setup.exe。不用登录，点击下方的“Continue without an account”。

不用登录，点击“Open Lightweight API Client”。

进入postman主界面

五、Postman测试说明

‌1.配置请求头‌

设置 Content-Type: application/json‌。

‌

2.发送请求示例（对话接口）‌

‌步骤‌：

（1）选择 POST 方法，输入 http://localhost:11434/api/chat

（2）在 ‌Body‌ 标签中选择 ‌raw‌ 格式，粘贴以下内容（json）：

模型名称一定要写对，根据自己本地安装好的模型修改，如我们前面已经在本地部署好了deepseek模型，并将模型命名为my_model_name ，则此时，应该填写："model": "my_model_name"

{"model": "deepseek-r1:8b","messages": [{"role": "user", "content": "解释机器学习中的过拟合"}]}

（3）点击 ‌Send‌ 获取响应‌。

‌3.流式响应处理‌

若设置 "stream": true，需在Postman中启用 ‌Stream‌ 模式，逐块接收数据‌。

（1）在 ‌Body‌ 标签选择 ‌raw‌ → ‌JSON‌，输入以下内容（json）：

{"model": "deepseek-chat", "messages": [{"role": "user", "content": "你的问题"}], "stream": true  // 关键参数，启用流式输出‌:ml-citation{ref="7,8" data="citationList"}}

‌

（2）关闭 SSL 验证（可选）‌

在 Postman 设置（Settings → General）中关闭 ‌SSL certificate verification‌，避免证书错误中断流式传输‌。

六、注意事项

‌ （1）模型名称匹配‌：确保接口中的 model 参数与通过 ollama list 查看到的名称完全一致‌。

‌ （2）显存限制‌：高参数版本（如14B）需至少32GB内存，低配置设备建议使用1.5B或8B版本‌。

‌ （3）端口占用‌：若端口11434被占用，可通过 OLLAMA_HOST 环境变量修改服务端口‌。

‌ （4）跨域问题‌: 若通过 Swagger 调用，需在Ollama服务端配置CORS头（bash）：

# 启动服务时添加参数OLLAMA_ORIGINS=* ollama serve

通过以上接口，可全面管理本地部署的DeepSeek模型并实现交互式调用。

本地基于Ollama部署的DeepSeek详细接口文档说明

一、核心接口文档说明

1. ‌模型列表查询‌

2. ‌文本生成‌

3. ‌对话交互‌

二、模型管理接口

4. ‌拉取模型‌

5. ‌创建自定义模型‌

6. ‌删除模型‌

三、高级接口

7. ‌查看模型信息‌

‌8. 流式响应处理‌

四、Postman下载安装

1. 下载postman

2. postman安装

五、Postman测试说明

‌1.配置请求头‌

2.发送请求示例（对话接口）‌

六、注意事项

相关资讯

热文排行

最新新闻

推荐新闻

热搜词