快讯详情
豆包大模型团队开源基准测试集SuperGPQA
电商报| 2025-03-04 12:10:25

3月4日消息,豆包大模型团队近日开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。

转载之前请先阅读转载说明,违规转载法律必究
寻求报道或合作,请点击这里
如果您加入壹览的讨论群,请联系我们的工作人员(微信号:star_3979)