文章目录
- 1、数据配置
- 2、llama factory
- 3、选择本地的基础模型路径和数据集选好,选择LORA开始训练
1、数据配置
data/dataset_info.json
"identity": { //数据集名称 在界面上选择的"file_name": "identity.json" // 在该文件夹下的文件名}
# 数据集的格式
[
{"instruction": "给定一个数组,找到其中不重复的数字以及它们出现的次数。","input": "","output": "2:1, 3:2, 4:2"},{"instruction": "给定一个数组,找到其中不重复的数字以及它们出现的次数。","input": "","output": "2:1, 3:2, 4:2"},
]
2、llama factory
llamafactory 0.8.2.dev0
用conda 安装好环境,启动
https://github.com/hiyouga/LLaMA-Factory/
src 文件夹 下 启动脚本如下
#!/bin/bashCUDA_VISIBLE_DEVICES=1 python src/webui.py