基于gunicorn+flask+docker模型高并发部署

2025/7/13 15:26:40 来源：https://blog.csdn.net/qq_43689451/article/details/139911503 浏览: 次关键词：基于gunicorn+flask+docker模型高并发部署

为了基于 Gunicorn、Flask 和 Docker 部署一个高并发的模型服务，您可以按照以下步骤进行：

### 1. 准备 Flask 应用

首先，创建一个简单的 Flask 应用（app.py）：

```python
from flask import Flask, request, jsonify
import time

app = Flask(__name__)

@app.route('/predict', methods=['POST'])
def predict():
data = request.get_json()
# 模拟模型推理
time.sleep(1)
return jsonify({'prediction': 'mocked_result'})

if __name__ == '__main__':
app.run(host='0.0.0.0', port=5000)
```

### 2. 配置 Gunicorn

创建一个 Gunicorn 配置文件（gunicorn.conf.py）：

```python
workers = 4 # 根据服务器的 CPU 核数进行调整
bind = '0.0.0.0:5000'
timeout = 120
```

### 3. 创建 Dockerfile

编写 Dockerfile，用于创建 Docker 镜像：

```Dockerfile
# 使用官方的 Python 镜像作为基础镜像
FROM python:3.9

# 设置工作目录
WORKDIR /app

# 复制应用程序文件到容器中
COPY . /app

# 安装所需的 Python 包
RUN pip install --no-cache-dir -r requirements.txt

# 暴露端口
EXPOSE 5000

# 使用 Gunicorn 运行 Flask 应用
CMD ["gunicorn", "-c", "gunicorn.conf.py", "app:app"]
```

### 4. 创建 requirements.txt

创建 requirements.txt 文件，列出 Flask 和 Gunicorn 依赖：

```
Flask==2.0.1
gunicorn==20.1.0
```

### 5. 构建和运行 Docker 容器

使用以下命令构建 Docker 镜像并运行容器：

```sh
# 构建 Docker 镜像
docker build -t flask-gunicorn-app .

# 运行 Docker 容器
docker run -d -p 5000:5000 flask-gunicorn-app
```

### 6. 扩展和负载均衡

为了处理更高的并发量，您可以在同一台机器上运行多个容器，或在多个服务器上部署容器，并使用负载均衡器（如 Nginx）进行请求分发。

#### Nginx 负载均衡配置示例

在 `/etc/nginx/nginx.conf` 中配置 Nginx：

```nginx
http {
upstream flask_app {
server 127.0.0.1:5000;
server 127.0.0.1:5001;
server 127.0.0.1:5002;
server 127.0.0.1:5003;
}

server {
listen 80;

location / {
proxy_pass http://flask_app;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header X-Forwarded-Proto $scheme;
}
}
}
```

确保每个容器在不同端口上运行，并更新 Nginx 配置中的端口信息。

### 7. 运行多个容器

使用不同端口运行多个容器：

```sh
docker run -d -p 5000:5000 flask-gunicorn-app
docker run -d -p 5001:5000 flask-gunicorn-app
docker run -d -p 5002:5000 flask-gunicorn-app
docker run -d -p 5003:5000 flask-gunicorn-app
```

### 总结

通过以上步骤，您可以使用 Gunicorn 和 Flask 创建一个高并发处理能力的模型服务，并使用 Docker 进行部署和扩展。结合 Nginx 进行负载均衡，可以进一步提升服务的并发处理能力和可靠性。

基于gunicorn+flask+docker模型高并发部署

相关资讯

热文排行

最新新闻

推荐新闻

热搜词