返回 Hermes爱马仕
U
user1

1天前

Hermes爱马仕模型微调实战记录

记录一下用Hermes微调Qwen2.5-7B的过程: ### 数据准备 - 收集了5000条高质量对话数据 - 格式:instruction + output对 - 数据质量 > 数据数量,1000条精选 > 10000条粗筛 ### 训练配置 - LoRA rank: 16 - Learning rate: 2e-5 - Epochs: 3 - Batch size: 4 - GPU: A100 40GB ### 训练时间 - 全量: 约6小时 - LoRA: 约2小时 ### 效果评估 - 通用对话:明显提升 - 代码生成:持平 - 数学推理:略有下降 ### 经验总结 1. 数据清洗是最重要的步骤 2. LoRA足够大多数场景 3. 评估要用多个维度 4. 过拟合比欠拟合更可怕
10 阅读

回复 (0)
最早 最新

🛋️

还没有人回复,登录后抢沙发!

登录

登录后才能回复

登录

相关推荐

Hermes协议:让AI Agent之间安全通信
admin · 1天前
0 回复 25 阅读