工具导航CMMLU:衡量中文大规模多任务语言理解能力 - haonan-li/CMMLU
CMMLU(Chinese Massive Multitask Language Understanding)是一个专为中文语境设计的综合性评估基准,旨在全面衡量语言模型在中文知识和推理能力方面的表现。
CMMLU是目前最全面的中文语言理解测评基准,其中国特色的设计使其成为评估本土化语言模型的黄金标准。相比其他基准,CMMLU更能准确反映模型在中文环境下的真实表现。
作为完全中国化的测试基准,CMMLU为研究人员和 开发者提供了可靠的中文语言模型评估工具,助力提升AI在中文场景下的理解和应用能力。
月访问量
542.61M
平均访问时长
00:06:22
每次访问页数
6.10
跳出率
36.08%
直接访问
58.50%
自然搜索
29.08%
外链引荐
10.54%
社交媒体
1.47%
邮件
0.05%
展示广告
0.36%
🇺🇸 United States
19.17%
🇨🇳 China
12.64%
🇮🇳 India
9.57%
🇷🇺 Russia
5.59%
🇩🇪 Germany
4.20%
关键词
每次点击费用
github
$0.88
zapret
$0.00
iptv github
$0.48
$1.43
clawdbot
$0.00