5月6日,讯飞星火认知大模型成果发布会在安徽合肥举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型7大核心能力,并发布教育、办公、汽车、数字员工4大行业应用成果。
发布会现场,语音输入,实时互动。在现场真机实测的互动提问环节,无论是文本生成、语言理解,还是知识问答、数学能力、逻辑推理等,大模型的回答引来场下阵阵掌声。
在数学能力的提问中,除了常规计算、几何题等,现场还抛出了较为复杂的应用题,“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”星火大模型很快准确给出了答案,并给出解题步骤。
刘庆峰公布了大模型年内三次升级时间点,后续还将联合开发者推动大模型应用落地,共建人工智能“星火”生态。
刘庆峰表示,从chatgpt关注的48个主要任务方向和讯飞开放平台上400多万开发者团队的需求分析,通用人工智能应当具备7大维度能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。此外,他还透露,2022年12月,科大讯飞正式启动“1 n”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“n”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
刘庆峰表示,科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。在科学的评测体系中推动大模型的发展。
“今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。”刘庆峰强调。
此外,发布会还展示了大模型面向泛领域开放式知识问答,它具备很好的通识知识,能够对生活常识、科学知识、工作技巧,以及医学知识等应对自如。此外,星火大模型也具备逻辑推理能力与代码能力,未来还将进一步升级多模态输入和表达能力,不断实现自身迭代进化。
刘庆峰表示,虽然目前大模型技术还存在待攻克的缺陷,比如新知识难以及时更新,事实类问答容易“张冠李戴”,史实、传统典籍容易“编造情节”等问题,但这些问题在今年会得到明显的改进。