论文笔记:RAR: Retrieving And Ranking Augmented MLLMs for Visual Recognition
1.挑战/问题(Challenges/Issues) 这篇论文面临的主要挑战是如何提高模型在细粒度识别任务中的性能。CLIP(Contrastive Language–Image Pre-training)模型虽然在广泛的候选识别上表现出色,但在区分细微差别的细粒度项…
2024-11-29