科大讯飞正式发布星火认知大模型V2.0,代码能力和多模态能力均显著提升
驱动中国2023年8月15日消息,今日14:00,科大讯飞召开了星火认知大模型V2.0的发布会,正式公布了一些新能力,将上线“代码生成、图片生成、视频生成、星火插件”等新功能。
其中代码生成能力可以实现代码生成、代码补齐、代码纠错、代码解释、单元测试生成等。
(资料图)
在发布会现场,科大讯飞还演示了通过星火认知大模型V2.0来一句话编写代码,仅仅是发出了用Python写一个贪吃蛇小游戏的指令,就自动生成了一个简单的小游戏,能力非常强大。
科大讯飞董事长刘庆峰介绍,讯飞星火V2.0代码能力实现大幅度提升,从业界参考测试集上的效果对比来看,星火V2.0基于Python和C++进行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%。
从Python语言的代码生成、补齐、纠错、解释和单元测试生成这几个维度都可以看到,现在讯飞星火V2.0代码生成和补齐已经超过了Chat GPT,其他几项能力也在快速追赶中。
据刘庆峰介绍,当前讯飞星火V2.0对于代码的逻辑、算法、方法、体系、数据准备已经全部就绪。
基于此,科大讯飞公布了基于星火2.0的智能编程助手:iFlyCode 1.0。
据悉,iFlyCode 1.0拥有星火大模型的所有代码生成相关能力,并可以无缝集成至开发环境。
此外,它还可以帮助开发者生成功能实现思路,提供修改建议,并解答相关的专业提问。
根据讯飞内部的研发效能统计,超过2000名员工在使用iFlyCode 1.0后,代码的采纳率提升30%以上,编码效率提升30%以上,综合效率提升超过了15%。
可以说,iFlyCode 1.0的推出,解放了开发的生产力,大大提升了效率。
此外,讯飞星火认知大模型V2.0还展示了语音生成图片、虚拟人等功能。据现场展示,讯飞星火认知大模型V2.0能够快速根据指令生成准确图片,同时还能根据新指令对图片进行修改。
比如,生成一副雪山壮丽景色,高耸山峰被白雪覆盖的图片后,又新增“加上小女孩登山”的需求,讯飞星火认知大模型V2.0都能正确生成内容。
在中文理解方面,讯飞星火认知大模型V2.0也能完美生成像“关羽骑摩托车”“山重水复疑无路,柳暗花明又一村”等图片,领先竞品。
除图片外,讯飞星火认知大模型V2.0还支持生成带有虚拟人的视频,对公司企业来说,可以省去请真人拍摄产品等宣传片的成本。
刘庆峰表示,当前代码能力的逻辑、算法、方法体系、数据准备已就绪,所需要的就是时间和算力。
讯飞星火认知大模型V2.0的代码能力和多模态能力均持续提升,2.0版本中,文本生成能力提升72%,语言理解提升78%,知识问答提升70%,逻辑推理提升60%,数学能力提升72%。
讯飞星火认知大模型的数学能力在国内首屈一指,在高考后各大第三方评测中遥遥领先。发布会上,讯飞还演示了一道三角形数学题,并表示国内只有讯飞星火认知大模型V2.0能解答这一数学问题。
此次发布会的重头戏就是代码能力,讯飞称,从代码生成、补齐、纠错、解释和单元测试生成,这几个维度都可以看到,现在在代码生成和补齐上已经超过了ChatGPT,其他各项能力也正在快速追赶。
刘庆峰表示,我们已经定了非常明确的目标,到今年10月24号,各个代码的能力都会超越ChatGPT,明年上半年将正式对标GPT4。
在讯飞看来,代码是一个硬碰硬的能力,不存在任何主观评分的标准,所以它也应该被当成是大模型聪明程度的非常重要的标志。
责任编辑: