欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 科技 > 能源 > meta-llama/Llama-3.2-1B 微调记录

meta-llama/Llama-3.2-1B 微调记录

2025/4/22 12:48:24 来源:https://blog.csdn.net/NewBaiChen/article/details/144587054  浏览:    关键词:meta-llama/Llama-3.2-1B 微调记录

踩坑:

1.刚开始部署在自己的windows电脑上,semgrep不支持windows ,然后就换了linux服务器

2.服务器没有梯子,huggingface无法访问,模型数据集无法下载

解决方法:

        使用huggingface镜像网站下载模型, 网站在这HF-Mirror

注意:llama模型的下载需要申请权限(或者使用  魔搭社区 来下载),申请大概在1h内就能通过,看帖子说地区尽量选国外,这里我选的Australia

额,第一次遇到需要权限才能下载的模型,卡了一会。。。

权限申请通过之后,点击huggingface右上角头像,点击Access Tokens,创建一个token,复制下来

接下来在服务器中接种镜像网站进行下载,详细参考hf-mirror教程

huggingface-cli

huggingface-cli 是 Hugging Face 官方提供的命令行工具,自带完善的下载功能。

1. 安装依赖

pip install -U huggingface_hubCopy

2. 设置环境变量
Linux

export HF_ENDPOINT=https://hf-mirror.comCopy

Windows Powershell

$env:HF_ENDPOINT = "https://hf-mirror.com"Copy

建议将上面这一行写入 ~/.bashrc
3.1 下载模型

huggingface-cli download --resume-download gpt2 --local-dir gpt2Copy

3.2 下载数据集

huggingface-cli download --repo-type dataset --resume-download wikitext --local-dir wikitextCopy

补充:因为本模型需要权限,所以需要先登录一下

huggingface-cli login

然后把刚才的token输入即可安装上述教程下载、

3.数据集相关问题

由于服务器没法访问huggingface,我将数据集下载到了服务器本地。
这里记录下做的相关改动

补充:这里注意,要把下载的数据解压。。。。。。。。。这里没解压,以为是加载数据集方法的问题,又卡了一上午.....

4.为了能运行成功做的一些改动

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词