大模型面试题：Prefix LM和Causal LM的区别是啥？

2025/2/8 4:12:48 来源：https://blog.csdn.net/hguo11/article/details/143445494 浏览: 次关键词：大模型面试题：Prefix LM和Causal LM的区别是啥？

获取更多面试真题的集合，请移步至 https://i.afbcs.cn/naPbNY

说白了：就是attention mask不一样，如下所示：

img

它们定义如下：

Prefix LM（‌前缀语言模型）‌：在输入序列的开头添加一个可学习的任务相关的前缀，然后使用这个前缀和输入序列一起生成输出。这种方法可以引导模型生成适应特定任务的输出。

‌Causal LM（‌因果语言模型）‌：也称为‌自回归语言模型，它根据之前生成的 token 预测下一个 token。在生成文本时，模型只能根据已经生成的部分生成后续部分，不能访问未来的信息。

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

热文排行