欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 财经 > 金融 > moonshot:一个用于评估任何 LLM 应用程序的简单模块化工具

moonshot:一个用于评估任何 LLM 应用程序的简单模块化工具

2025/2/24 18:13:01 来源:https://blog.csdn.net/qq_43128256/article/details/141568205  浏览:    关键词:moonshot:一个用于评估任何 LLM 应用程序的简单模块化工具

大模型相关目录

大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
从0起步,扬帆起航。

  1. swift与Internvl下的多模态大模型分布式微调指南(附代码和数据)
  2. 多模态大模型Internvl-1.5-26B微调后部署及测试实录(附代码)
  3. 多模态大模型Internvl-2-26B的OCR赋能方案(附代码)
  4. miniconda+xinference的大模型推理部署指南
  5. Mem0:大模型最强赋能“有记忆的LLM”
  6. 再谈Agent:Dify智能体实现Txet2SQL
  7. Moe模式:或将是最好的大模型应用开发路径
  8. 一文带你了解大模型RAG
  9. 详细记录swfit微调interVL2-8B多模态大模型进行目标检测(附代码)
  10. DIfy中集成magic-pdf实现文档解析agent与多模态大模型图文问答
  11. 大模型Prompt trick:利用大模型同情心提升模型性能
  12. 一文带你入门大模型微调
  13. 开源大模型LLaMA架构介绍
  14. CyberScraper-2077+simple-one-api:使用大模型爬虫
  15. 大模型高效利用结构化信息研究:HTML格式或许更好
  16. moonshot:一个用于评估任何 LLM 应用程序的简单模块化工具

文章目录

  • 大模型相关目录


Moonshot 由 AI Verify Foundation 开发,是首批将基准测试和红队结合在一起的工具之一,可帮助 AI 开发人员、合规团队和 AI 系统所有者评估 LLM 和 LLM 应用程序。

在这个初始版本中,Moonshot 可以通过多个界面使用:

用户友好的 Web UI - Web UI 用户指南
交互式命令行界面 - CLI 用户指南
通过 Moonshot 库 API 或 Moonshot Web API 无缝集成到您的 MLOps 工作流程中

在这里插入图片描述
环境需求:

Python 3.11 (We have yet to test on later releases)GitVirtual Environment (This is optional but we recommend you to separate your dependencies)# Create a virtual environment
python -m venv venv# Activate the virtual environment
source venv/bin/activate
If you plan to install our Web UI, you will also need Node.js verion 20.11.1 LTS and above

安装
要安装 Project Moonshot 的全部功能:

# Install Project Moonshot's Python Library
pip install "aiverify-moonshot[all]"# Clone and install test assets and Web UI
python -m moonshot -i moonshot-data -i moonshot-ui
python -m moonshot web

在这里插入图片描述
当然我自身工作不涉及评估,有需求的网友可以测试一下看看。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词