8月15日,科大讯飞召开发布会并正式发布讯飞星火V2.0。在讯飞星火V2.0众多项能力升级中,代码能力方面的提升让人印象尤其深刻。
(资料图片)
在发布会上,科大讯飞董事长刘庆峰首先强调了代码能力对于一个通用大模型的重要性。
代码是一个硬碰硬的能力,不存在任何主观评分的标准,所以它应该被当成是大模型聪明程度的非常重要的标志;同时代码能力也是构建和链接数字世界的非常有效的手段;另外,代码能力也会提升开发效率、降低创业成本,进而大幅降低数字经济的创业门槛。
紧接着,在发布会上,科大讯飞研究院院长刘聪对讯飞星火V2.0的代码能力进行了详细演示。
刘聪让大模型先后写了画红色心形线、用渐变色绘制马鞍面方程三维立体图、开发贪食蛇小游戏、将视频转换成表情包等难度各异的多个程序,结果讯飞星火都顺利完成挑战,程序全部一次性运行成功。
通过演示可以看出来,相比讯飞星火V1.5,V2.0在包括代码生成、代码补齐、代码解释、代码纠错和单元测试生成等能力方面都展现出了突破性的进步。
据悉,依据OpenAI代码能力公开测试集显示的测试结果,星火V1.5 Python语言的效果只有41分,V2.0则达到了61分,已经接近ChatGPT的水平。而根据认知智能国家重点实验室构建的代码实用场景测试集测试结果,讯飞星火V2.0在代码生成和补齐维度上已经超过了ChatGPT。
根据科大讯飞的计划,讯飞星火的各项代码能力将在今年10月24日超越ChatGPT,明年上半年将对标GPT-4。
除了大模型代码能力的升级外,科大讯飞此次还重磅发布了讯飞星火智能编程助手iFlyCode。
iFlyCode是一个集成开发环境,程序员可以在iFlyCode里面通过指令或者注释的方式让讯飞星火编写代码。
刘聪现场使用iFlyCode开发了一个用手指捏合来凌空写字的程序,结果还不到十分钟,在一行代码都没有手工书写的情况下,程序功能就开发完成了。而这个需求如果交给一个经验丰富的程序员的话,也至少需要半天到1天才能完成。
据了解,在讯飞内部的测试统计中,iFlyCode生成编码的采用率已经达到了30%,不仅如此,在采纳iFlyCode后,编码效率提升了30%,而综合工作效率则提升了15%。
现在,讯飞星火的编码能力已经开始赋能越来越多的行业。例如,采用了科大讯飞的教育数字基座之后,学校甚至不需要编写哪怕一行代码,就可以实现类似离校管理应用这样的全新管理流程需求。
除了学校之外,包括医院、大学、企业、政府等众多行业,都可以通过使用讯飞星火和iFlyCode来实现数字化管理需求的快速和低成本搭建。
此次讯飞星火认知大模型V2.0代码能力的突破,必将加快大模型编码在各行业的普及速度,进而大大降低各企业信息系统建设的整体成本,最终为国家经济的数字化和智能化转型做出自己的贡献。
标签: