习题集
-
【单选题】在RAG应用的文档解析与切片阶段,若遇到文档类型不统一,部分格式的文档不支持解析的问题,以下哪种解决方式不可行?( )
A. 开发对应格式的解析器
B. 转换文档格式
C. 直接忽略该类型文档
D. 改进现有解析器以支持更多格式 -
【多选题】在选择向量数据库时,云服务向量存储具有以下哪些优势?( )
A. 无需关注运维,自动扩容
B. 提供完善的监控和管理工具
C. 按量付费,成本可控
D. 数据安全性高于本地向量数据库 -
【单选题】在RAG工作流程中,将文本转换为高维向量,并存储到向量数据库的阶段是( )。
A. 解析与切片阶段
B. 向量存储阶段
C. 检索召回阶段
D. 生成答案阶段 -
【多选题】在优化RAG应用的检索召回阶段,以下哪些属于检索前的优化策略?( )
A. 问题改写
B. 重排序
C. 基于用户画像扩展上下文
D. 滑动窗口检索 -
【单选题】在使用DashScopeParse解析文件时,nest_asyncio类的作用是( )。
A. 提高文件解析速度
B. 解决嵌套异步操作中事件循环的问题
C. 优化解析后的Markdown文本格式
D. 从解析结果中提取结构化信息 -
【多选题】以下关于多种文档切片方法的说法,正确的是( )。
A. Token切片适合对Token数量有严格要求的场景
B. 句子切片会保持句子的完整性,适用于大多数场景
C. 语义切片根据语义相关性自适应地选择切片点,适合逻辑性强的文档
D. Markdown切片专门针对Markdown文档优化,能利用其标题层级进行智能分割 -
【单选题】在RAG应用中,当发现检索结果不够理想,处理长文档且需要保持上下文时,优先考虑使用哪种切片方法?( )
A. Token切片
B. 句子窗口切片
C. 语义切片
D. Markdown切片 -
【多选题】在生成答案阶段,为了减少大模型产生幻觉的几率,可以采取以下哪些措施?( )
A. 选择合适的大模型
B. 充分优化提示词模板,明确要求不编造答案
C. 调整大模型的temperature参数