工具导航

SuperCLUE

SuperCLUE：中文通用大模型权威评测基准

SuperCLUE 是当前最具影响力的中文通用大模型综合性评测基准，通过三大维度、70+项细分能力指标，全面评估大模型的中文理解与生成能力。

核心评测维度

1. 基础能力（10项核心指标）

语义理解：精准把握中文语义细微差别
多轮对话：上下文连贯性及话题维持能力
逻辑推理：复杂问题的因果推断能力
角色模拟：特定身份的语言风格模仿
代码能力：编程问题解决与代码生成
创意写作：诗歌、故事等文学创作

2. 专业能力（50+学科覆盖）

学术考试：涵盖高考、研究生入学等标准化考试
STEM领域：数学推导、物理问题求解、化学方程式
社会科学：经济学原理、历史事件分析
专业认证：法律、医学等专业领域知识

3. 中文特性能力（特色评测）

成语典故：理解与运用能力
古典诗词：创作与鉴赏水平
汉字解析：字形结构分析与演变
方言理解：各地方言与普通话转换

为什么选择SuperCLUE？

最全面的中文评估体系：唯一覆盖基础教育到专业领域的评测基准
动态更新机制：持续跟踪大模型技术演进
标准化测试环境：确保评测结果客观公正

作为中文大模型发展的风向标，SuperCLUE持续为学术界和产业界提供权威的模型能力评估服务。

发布信息

站点www.cluebenchmarks.com

发布时间2025-06-16

分类

最新流量情况

月访问量

3.91K

平均访问时长

00:00:04

每次访问页数

1.32

跳出率

42.89%

流量来源

直接访问

36.24%

自然搜索

40.56%

外链引荐

18.57%

社交媒体

3.64%

邮件

0.08%

展示广告

0.81%

地理位置

🇺🇸 United States

20.35%

🇯🇵 Japan

7.91%

🇦🇺 Australia

5.91%

热门关键词

关键词

每次点击费用

superclue

$0.00

混元大模型分数

$0.00

ai评测的网站有哪些？其中有一个llam开头的

$0.00

用1b模型做ner

$0.00

中文数学批改数据集

$0.00