欢迎来到尧图网

客户服务关于我们

您的位置：首页 > 新闻 > 资讯 > 论文笔记：SIBO: A Simple Booster for Parameter-Efficient Fine-Tuning

论文笔记：SIBO: A Simple Booster for Parameter-Efficient Fine-Tuning

2024/10/31 23:51:10 来源：https://blog.csdn.net/qq_40206371/article/details/143228320 浏览: 次关键词：论文笔记：SIBO: A Simple Booster for Parameter-Efficient Fine-Tuning

ACL 2024

1 intro

基于 Transformer 的大模型一般都有很多层
- 在广泛采用的 PEFT 技术（包括 Adapters 和 LoRA）中，尤其是在深层中，也存在过度平滑现象（即token之间的相似度很高）
论文评估了同一语句中 token 之间的余弦相似性以检测过平滑现象
- 给定一个包含m个 token的句子(h1,h2,....hm)，其token间余弦相似性为
- 结果如下：
  - 随着模型层数的增加，token之间越来越像了

——>论文提出了 SIBO
- 通过在 PEFT 模块（adapter/LORA）的输入中注入初始残差，减少了 Transformer 模型中的过平滑问题

2 方法

3 结果

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

相关资讯

热文排行

最新新闻

推荐新闻

热搜词

每日读则推(十四)——Meta Movie Gen: the most advanced media foundation models to-date 微软官宣 GitHub Spark：编程进入自然语言时代瑞芯微RK3566/RK3568 Android11下该如何默认屏蔽导航栏/状态栏？看这篇文章就懂了 Python | Leetcode Python题解之第520题检测大写字母 ubuntu openmpi安装（超简单）完全透彻了解一个asp.net core MVC项目模板1