欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 教育 > 幼教 > LangChain上使用huggingface的embedding模型(如jina-embeddings-v3)

LangChain上使用huggingface的embedding模型(如jina-embeddings-v3)

2024/11/29 22:08:52 来源:https://blog.csdn.net/weixin_44737922/article/details/143569814  浏览:    关键词:LangChain上使用huggingface的embedding模型(如jina-embeddings-v3)

一、背景知识

embedding将文本映射到稠密的向量空间中,方便存储和查询。
huggingface的embedding榜单
这里结合自己的应用场景,选择1b以下的embedding模型,综合考量下选择arkohut/jina-embeddings-v3
模型链接

下载
在这里插入图片描述
使用模型卡片提供的命令,用cmd下载(强烈建议使用SSH命令下载!!!!用http容易报错)
在这里插入图片描述
需要使用魔法上网才能下载。如果超时的话,也可以选择手动下载。注意下载后的文件名应该和网站上提供的一样。
在这里插入图片描述

二、jina功能

论文地址:
jina-embeddings-v3: Multilingual Embeddings With Task LoRA
在这里插入图片描述
它的创新点主要有:
1.支持的文本长度高达8192 tokens
2.可以进行Task-specific的embedding
3.检索失败时可以合成数据
4.用上了最新的技术,提高了性能

三、LangChain上部署

model_name = "E:\jina-embeddings-v3"
model_kwargs = {'device': 'cpu','trust_remote_code':True}
encode_kwargs = {'normalize_embeddings': False}
hf = HuggingFaceEmbeddings(model_name=model_name,model_kwargs=model_kwargs,encode_kwargs=encode_kwargs
)

完整代码可见
我的实战博客

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com