GMAI-MMBench:医学AI领域的综合性多模态评估基准。它为通用医学AI的评估提供了一个全面且结构化的框架,助力医学AI研究与应用。 融合284个数据集,涵盖38种医学影像模态;提供18个临床相关任务和18个临床部门的多感知粒度评估;实现了50种LVLM模型的评估,GPT-4o仅达到53.53%的准确率,表明提升空间巨大