欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 科技 > IT业 > MedQA、MedMCQA、PubMedQA 和 MMLU数据集简介

MedQA、MedMCQA、PubMedQA 和 MMLU数据集简介

2024/10/25 15:19:48 来源:https://blog.csdn.net/qq_46396470/article/details/142686020  浏览:    关键词:MedQA、MedMCQA、PubMedQA 和 MMLU数据集简介

MedQA、MedMCQA、PubMedQA 和 MMLU数据集简介

1. MedQA数据集

  • 简介

    • MedQA 数据集是一个面向医学领域的问答数据集,模拟了美国医疗执照考试(USMLE)的风格。它包含了英文、简体中文和繁体中文的问题,旨在评估模型对医学知识的理解和推理能力。
  • 数据集主页

    • Papers with Code - MedQA Dataset
  • 问题类型

    • 单选题
  • 数据集的完整格式

{"question": "问题文本","options": ["选项A", "选项B", "选项C", "选项D"],"answer": "A"
}
  • 模型的回答
{"id": "问题的标识符","prediction": "A"
}

2. MedMCQA数据集

  • 简介

    • MedMCQA 是一个大规模的多选题问答(MCQA)数据集,专为解决实际医学入学考试问题而设计。它包含了超过194,000个高质量的 AIIMS 和 NEET PG 入学考试多选题,涵盖2,400个医疗保健主题和21个医学科目。
  • 数据集主页

    • MedMCQA Homepage
  • 问题类型

    • 多选题
  • 数据集的完整格式

{"question": "问题文本","opa": "选项A","opb": "选项B","opc": "选项C","opd": "选项D","cop": "a","choice_type": "multi","exp": "答案解释","subject_name": "科目名称","topic_name": "主题名称"
}
  • 模型的回答
{"id": "问题的标识符","prediction": ["a", "c"]
}

3. 数据集

  • 简介

    • PubMedQA 数据集是从PubMed摘要中收集的新颖的生物医学问答(QA)数据集。它要求模型能够理解并推理生物医学研究文本,尤其是其中的定量内容,以回答研究问题。
  • 数据集主页

    • PubMedQA Homepage
  • 问题类型

    • 解释类
  • 数据集的完整格式

{"question": "问题文本","context": "相关上下文文本","long_answer": "长答案文本","answer": "yes/no/maybe"
}
  • 模型的回答
{"id": "问题的标识符","prediction": "maybe"
}

4. MMLU数据集

  • 简介
    • MMLU(大规模多任务语言理解)数据集是一个多语言、多任务的评测数据集,旨在评估和提升人工智能模型在不同语言、认知和文化背景下的性能。
  • 数据集主页
    • MMLU Dataset | Papers With Code
  • 问题类型
    • 单选题
  • 数据集的完整格式
{"question": "问题文本","options": ["选项1", "选项2", "选项3", "选项4"],"answer": "1"
}
  • 模型的回答
{"id": "问题的标识符","prediction": "1"
}

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com