(资料图片)
500道题目、对标接受过高等教育的人类水平、强调对产业和生活的实际价值……8月12日,新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位。
据悉,《报告》严格按基础能力指数、智商指数、情商指数、工具提效指数四大测评维度进行权重设计,讯飞星火在四大评测维度中的智商指数和工具提效指数两个维度获得第一,“在工作提效方面优势明显”。
《报告》认为,讯飞星火具有7大核心能力(即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力)的讯飞星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
在智商评估方面,《报告》认为,人类在智商方面仍然具有明显优势。课题组分别从常识知识(20%)、逻辑能力(50%)和专业知识(30%)方面对大模型进行考量,结果显示,讯飞星火排名第一。
代码能力无疑是讯飞星火“高智商”的底层能力,8月15日讯飞星火代码能力将进行重大升级,同时还将推出相关代码产品成果。
在工作效率提升方面,《报告》认为, AI对人类提供了有力的支持,AI的处理速度远远超过人类。然而,尽管AI具有高速度和高效率的优势,但在某些复杂和具有创新性的任务中,人类的智慧和想象力仍然具有无法替代的作用。课题组重点在工具提效(50%)和生成创新(50%)方面进行考量,结果显示,讯飞星火以350分排名第一并遥遥领先。
《报告》认为,与2023年6月相比,当前中国大模型产品进步显著,但与接受过高等教育的人类相比,大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中,AI和人类表现出不同的优劣势,但在整体上,AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响,大模型正在加速走进生活、走进产业。

- 派力戈建材-祝贺成都大运会完满闭幕派力戈建材-祝贺成都大运会完满闭幕以青春的名义,与梦想集结...
- 无限接近L3级智驾,问界M5智驾版轻松“拿捏”城区NCA?8月2日,问界M5智驾版迎来首次OTA升级,“智能驾驶天花板”得...
- 家装环保体系2023版震撼发布!业之峰第15届环保家装艺术节来啦新鲜升级的环保体系、潮流时尚的体验玩法、全面覆盖的家装保...
- 业之峰刘毅:业之峰自营家装4.0就是省心!今年4月,业之峰装饰集团发布了“自营家装4 0”新模式,在中...
- 阿里妈妈正式发布万相台无界版8月8日,阿里妈妈全新一站式营销投放系统 - 万相台无界版正式发布
- 北向资金是什么意思?跟着北向资金买股票可行吗?
2023-07-07 14:35:28
- 如何区分大盘股和小盘股?小盘股与小票股的区别?
2023-07-06 16:34:04
- 高位横盘是什么意思?高位长期横盘的股票意味什么?
2023-07-05 15:40:11
- 股票型基金怎样选择最佳买点?股票基金的筛选指标有哪些?
2023-07-04 11:21:51
- 港股通标的股票是什么意思?港股通能交易哪些港股?
2023-07-03 16:23:25