自蒸馏技术在语言模型微调中的桥梁作用

2025/2/4 22:45:28 来源：https://blog.csdn.net/qq_59084968/article/details/140933493 浏览: 次关键词：自蒸馏技术在语言模型微调中的桥梁作用

论文：https://arxiv.org/pdf/2402.13669
代码：https://github.com/sail-sg/sdft
机构：浙江大学、Sea AI Labs和腾讯
领域：模型微调
发表：ACL2024

这篇论文的标题是《Self-Distillation Bridges Distribution Gap in Language Model Fine-Tuning》，作者们探讨了在对大型语言模型（LLMs）进行微调（fine-tuning）以适应特定任务时遇到的挑战，尤其是如何在提升任务性能的同时保留模型的通用指令遵循能力。论文提出了一种新颖的微调方法——自蒸馏微调（Self-Distillation Fine-Tuning，简称SDFT），旨在通过引导微调过程使用模型自身生成的、与

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

热文排行

热搜词

30分钟入门CompletableFuture并发工具使用【玩转 Postman 接口测试与开发2_012】第十章：用 Postman 监控 API 接口【Numpy核心编程攻略：Python数据处理、分析详解与科学计算】1.30 性能巅峰：NumPy代码优化全攻略 MIMIC-IV数据部署1：数据的准备（博主因手头上还有15+个SCI项目，龟速更新） linux用户管理 Android车机DIY开发之学习篇(七)NDK交叉工具构建

自蒸馏技术在语言模型微调中的桥梁作用

相关资讯

热文排行

最新新闻

推荐新闻

热搜词