首页
次级导航
站长导航
魔法世界
生活社区
医学导航
游戏娱乐
WP导航
电商导航
Emlog导航
英语学习导航
IOS快捷指令
异次元导航
办公&学习
系统&软件
B2B网址大全
AI工具
地区导航
北京地区
上海地区
杭州地区
重庆地区
丽水地区
台州地区
衢州地区
金华地区
嘉兴地区
湖州地区
绍兴地区
温州地区
宁波地区
天津地区
网站热榜
三石知识库
博客&资源
公告
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
模型评测
共 13 篇网址
魔法世界
影视娱乐
日常常用
其他分类
实用工具
政府政务
物流运输
学习相关
生活社区
资源分享
设计工具
在线办公
软件资源
技术交流
AI工具-1
资讯文章
旅游出行
游戏娱乐
友情链接
行业爱好
金融理财
采购平台
建筑房产
电脑系统
AI工具-2
B2B网址大全
公众号
站长导航
建站服务
WordPress导航
数据运营
客服工具
运营资源
开店货源
商业服务
社区资讯
跨境电商
BI数据
Emlog主题
Emlog插件
北京地区
上海地区
天津导航
丽水导航
台州导航
衢州导航
金华导航
嘉兴导航
重庆导航
CQ新闻媒体网站
杭州导航
湖州导航
绍兴导航
温州导航
宁波导航
Y内科
Y外科
Y五官科
Y儿科
Y妇产科
Y中医科
Y医学影像科
Y国际药学
英语阅读
英语听力
英语口语
英语词汇
英语写作翻译
英语语法批改
英语考试留学
英语培训机构
英语下载专区
英语课程
IOS生活
IOS社交
IOS效率
IOS视频
IOS娱乐
IOS工具
IOS图片
对话聊天
搜索引擎
语言翻译
内容检测
提示指令
训练模型
模型评测
学习网站
开发框架
排序
发布
更新
浏览
点赞
PubMedQA
生物医学研究问答数据集和模型得分排行榜
0
58
0
模型评测
H20 EvalGPT
H20.ai推出的基于Elo评级方法的大模型评估系统
0
62
0
模型评测
LLMEval3
http://llmeval.com/index
0
65
0
模型评测
Chatbot Arena
以众包方式进行匿名随机对战的LLM基准平台
0
66
0
模型评测
HELM
斯坦福大学推出的大模型评测体系
0
65
0
模型评测
MMBench
全方位的多模态大模型能力评测体系
0
52
0
模型评测
CMMLU
一个综合性的大模型中文评估基准准
0
58
0
模型评测
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
0
63
0
模型评测
SuperCLUE
中文通用大模型综合性测评基准
0
61
0
模型评测
FlagEval
智源研究院推出的FlagEval(天秤)大模型评测平台
0
63
0
模型评测
C-Eval
一个全面的中文基础模型评估套件
0
57
0
模型评测
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
0
55
0
模型评测
MMLU
大规模多任务语言理解基准准
0
59
0
模型评测
没有了
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件
书籍