欢迎来到尧图网

客户服务关于我们

您的位置：首页 > 汽车 > 时评 > 大模型知识学习

大模型知识学习

2024/10/24 22:21:02 来源：https://blog.csdn.net/sgliquangang/article/details/140162331 浏览: 次关键词：大模型知识学习

大模型训练过程

数据清洗

拟人化描述：知识库整理

预训练

拟人化描述：知识学习
可以使用基于BERT预训练模型进行训练

指令微调

拟人化描述：实际工作技能学习
实际操作：让大模型模仿具体的输入输出进行拟合，即模仿学习

强化学习

拟人化描述：价值观学习
实际操作：通过奖励算法（RLHF）来实现价值观对齐

大模型拓展

为什么要拓展

大模型与小模型共同使用相同的神经网络模型结构与预训练方法，大模型展现出来的各种能力的指数级增长，其最大的原因就是因为参数规模拓展导致的，所以要探索如何做好规模拓展

拓展方式1：KM拓展法则

法则介绍：该法则描述了模型规模、数据规模、算力之间的关系，根据关系，可以进行资源的调整，以达到效率最优的模型训练效果

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

相关资讯

热文排行

最新新闻

推荐新闻

热搜词

AI 自学 Lesson3 - 逻辑回归（LR） 10款具备强大数据报告功能的电脑监控工具,办公电脑怎么监控深入解析Spring AI框架：在Java应用中实现智能化交互的关键基于 Datawhale 开源的量化投资学习指南（7）：量化择时策略 java--抽象类和接口（详解） JavaScript（操作元素属性：样式style，className，classList，表单元素，自定义属性,间歇函数）注册用户协议同意倒计时