#AI夏令营 #Datawhale #夏令营
一、 baseline
跑通 Baseline 本身挑战性有限,关键是熟悉 LLM-centric 相关任务 coding 层面的流程方法,比如:
- 大模型 API(这里为科大讯飞 Spark)调用
- token消耗的理解
- 如何调用大模型实现针对给定 prompt 的反馈
拥抱 LLM-centric Research 的到来~
二、精读 baseline
分享嘉宾给出的 baseline 精读相当有帮助,基本涵盖了任务的主要问题:
- LLM 可能给出带有 markdown 格式的 “json” 标志
- LLM 可能给出不符合格式的结果,即使 prompt 对格式已做要求,需要做二次检查和纠正
- Prompt 设计颇有讲究,值得学习
三、构思 baseline 提升 idea
- 微调也许有用,但其一是需要算力,二是需要数据。对原始数据的清洗和prompt 的设计也许是这个题目上分的关键
- Prompt 设计可以常识让 LLM 注意连续的对话之间的关系
这个夏令营不简单 #AI夏令营 #Datawhale #夏令营