近日,清华、腾讯混元、斯坦福与卡耐基梅隆联合发布RBench-V基准,专测多模态大模型视觉推理能力,填补评估空白。基准含803题,涵盖几何改写等多领域。
科技前沿,尽在掌握。