logo工具导航

SuperCLUE

SuperCLUE:中文通用大模型权威评测基准

SuperCLUE 是当前最具影响力的中文通用大模型综合性评测基准,通过三大维度、70+项细分能力指标,全面评估大模型的中文理解与生成能力。

核心评测维度

1. 基础能力(10项核心指标)

  • 语义理解:精准把握中文语义细微差别
  • 多轮对话:上下文连贯性及话题维持能力
  • 逻辑推理:复杂问题的因果推断能力
  • 角色模拟:特定身份的语言风格模仿
  • 代码能力:编程问题解决与代码生成
  • 创意写作:诗歌、故事等文学创作

2. 专业能力(50+学科覆盖)

  • 学术考试:涵盖高考、研究生入学等标准化考试
  • STEM领域:数学推导、物理问题求解、化学方程式
  • 社会科学:经济学原理、历史事件分析
  • 专业认证:法律、医学等专业领域知识

3. 中文特性能力(特色评测)

  • 成语典故:理解与运用能力
  • 古典诗词:创作与鉴赏水平
  • 汉字解析:字形结构分析与演变
  • 方言理解:各地方言与普通话转换

为什么选择SuperCLUE?

  • 最全面的中文评估体系:唯一覆盖基础教育到专业领域的评测基准
  • 动态更新机制:持续跟踪大模型技术演进
  • 标准化测试环境:确保评测结果客观公正

作为中文大模型发展的风向标,SuperCLUE持续为学术界和产业界提供权威的模型能力评估服务。

发布信息

站点www.cluebenchmarks.com
发布时间2025-06-16

最新流量情况

月访问量

13.53K

平均访问时长

00:02:30

每次访问页数

1.73

跳出率

59.30%

流量来源

直接访问

50.66%

自然搜索

34.58%

外链引荐

13.36%

社交媒体

0.94%

邮件

0.10%

展示广告

0.36%

地理位置

🇨🇳 China

66.95%

🇹🇼 Taiwan

13.23%

🇭🇰 Hong Kong

12.51%

🇸🇬 Singapore

3.43%

🇺🇸 United States

2.81%

热门关键词

关键词

每次点击费用

superclue

$0.00

zeroculb 零样本榜单

$0.00

智能体评测榜单

$0.00

superclue 幻覺

$0.00

大模型基准测评报告

$0.00