欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 文化 > 鲲鹏+昇腾(适用310P和910芯片)部署Embedding和rerank模型连接Dify

鲲鹏+昇腾(适用310P和910芯片)部署Embedding和rerank模型连接Dify

2025/3/16 17:47:33 来源:https://blog.csdn.net/mizhiakk/article/details/146282985  浏览:    关键词:鲲鹏+昇腾(适用310P和910芯片)部署Embedding和rerank模型连接Dify

配置

Atlas800I A2(910B4 8*32G)
系统:openEuler 22.03-LTS
驱动:24.rc3
参考文章:https://www.hiascend.com/developer/ascendhub/detail/07a016975cc341f3a5ae131f2b52399d
在这里插入图片描述

准备好模型使能镜像

mindie_docker_images/800IA2-mis-tei-6.0.RC3.tar

embedding-rerank-models

docker load -i mindie_docker_images/800IA2-mis-tei-6.0.RC3.tar //加载镜像rar -xvf BAAI.tar  //解压在你想放的目录下,我放在/www/down

在这里插入图片描述
我这次部署是:bge-large-zh-v1.5 和 bge-reranker-large

部署

我是分别两个模型进行容器创建:

docker run -u root -e ASCEND_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 -itd --name=tei-reranker --net=host \
-e HOME=/home/HwHiAiUser \
--privileged=true  \
-v /www/down/:/home/HwHiAiUser/model \
-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
-v /usr/local/Ascend/driver:/usr/local/Ascend/driver \
--entrypoint /home/HwHiAiUser/start.sh \
swr.cn-south-1.myhuaweicloud.com/ascendhub/mis-tei:6.0.0-800I-A2-aarch64 \
BAAI/bge-reranker-large 127.0.0.1 8085 
docker run -u root -e ASCEND_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 -itd --name=tei-large --net=host \
-e HOME=/home/HwHiAiUser \
--privileged=true  \
-v /www/down/:/home/HwHiAiUser/model \
-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
-v /usr/local/Ascend/driver:/usr/local/Ascend/driver \
--entrypoint /home/HwHiAiUser/start.sh \
swr.cn-south-1.myhuaweicloud.com/ascendhub/mis-tei:6.0.0-800I-A2-aarch64 \
BAAI/bge-large-zh-v1.5  127.0.0.1 8086

可以查看docker logs 镜像ID判断是否启动成功,最后出现ready就成功了
在这里插入图片描述

测试接口

rerank模型测试:
curl 127.0.0.1:8085/rerank \-X POST \-d '{"query":"What is Deep Learning?", "texts": ["Deep Learning is not...", "Deep learning is..."]}' \-H 'Content-Type: application/json'
embedding模型测试:
curl 127.0.0.1:8086/embed \-X POST \-d '{"inputs":"What is Deep Learning?"}' \-H 'Content-Type: application/json'

在这里插入图片描述
在这里插入图片描述

连接dify

bge-reranker-large模型API:http://IP:8085/rerank ,API key随便填
bge-large-zh-v1.5模型API:http://IP:8086/embed,API key随便填

在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词