欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 科技 > IT业 > llama-factory微调deepseek-r1:1.5b

llama-factory微调deepseek-r1:1.5b

2025/3/15 21:15:02 来源:https://blog.csdn.net/BruceBorgia/article/details/146258097  浏览:    关键词:llama-factory微调deepseek-r1:1.5b

1.下载llama-factory

llama-factory

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

查看版本

llamafactory-cli version

在这里插入图片描述

2.启动web ui

需要内网穿透工具:netapp

export USE_MODELSCOPE_HUB=1 && llamafactory-cli webui

在这里插入图片描述
进行端口映射:
在这里插入图片描述
映射完成后,打开 127.0.0.1:7860, 即可打开web端
在这里插入图片描述

3.测试

选择模型后,选择chat,加载模型
在这里插入图片描述
控制台下载模型
在这里插入图片描述
下载成功后,测试模型
在这里插入图片描述

4. 修改数据集

数据集存在 LLaMA-Factory\data 路径下

备份identity.json后,修改其中的变量,数据集变为如下
在这里插入图片描述

5.训练

选择配置参数后,在cmd中或者在web端都行
在这里插入图片描述
点开始后,cmd中输出正在训练

在这里插入图片描述
3 epochs 效果不好,改为30 epochs
在这里插入图片描述

6.测试

在chat中修改检查点,测试效果
在这里插入图片描述

7.导出模型

选择模型和检查点,填写路径,导出
在这里插入图片描述
导出结果
在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词