训练集损失和验证集损失一直维持在一点几，不下降 #64

youzihaha · 2024-08-23T03:19:09Z

用您的这个模型，加上llama-chinese框架，训练十几万条数据（通用单轮数据+个人单轮数据），训练的时候，训练集损失和验证集损失一直维持在一点几，不下降，有什么办法吗

CrazyBoyM · 2024-08-23T03:35:46Z

全量微调或者lora微调时把lmhead、norm layer也解开一起训练

CrazyBoyM · 2024-08-23T03:37:22Z

另外不是说 loss越低越好，建议根据公司需求构建相关评测指标，每学习xx步/轮eval一次中间数据作为对模型训练的可视化监控，纯看loss的方式比较低级，无法满足实际训练生产需求。

Provide feedback