欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 汽车 > 时评 > 大模型知识学习

大模型知识学习

2024/10/24 22:21:02 来源:https://blog.csdn.net/sgliquangang/article/details/140162331  浏览:    关键词:大模型知识学习

大模型训练过程

数据清洗
  • 拟人化描述:知识库整理
预训练
  • 拟人化描述:知识学习
  • 可以使用基于BERT预训练模型进行训练
指令微调
  • 拟人化描述:实际工作技能学习
  • 实际操作:让大模型模仿具体的输入输出进行拟合,即模仿学习
强化学习
  • 拟人化描述:价值观学习
  • 实际操作:通过奖励算法(RLHF)来实现价值观对齐

大模型拓展

为什么要拓展

大模型与小模型共同使用相同的神经网络模型结构与预训练方法,大模型展现出来的各种能力的指数级增长,其最大的原因就是因为参数规模拓展导致的,所以要探索如何做好规模拓展

拓展方式1:KM拓展法则
  • 法则介绍:该法则描述了模型规模、数据规模、算力之间的关系,根据关系,可以进行资源的调整,以达到效率最优的模型训练效果

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com