对话科大讯飞刘庆峰:国内大模型发展要推动自主可控,国外算力难以保证安全

搜狐科技   2023-08-16 16:29:17

距5月6日首次发布星火认知大模型后,科大讯飞在8月15日迎来“百日会战”节点。在这次发布会上,星火大模型V2.0在代码和多模态能力上实现突破,并推出多项应用和产品。


(资料图片)

“代码能力不仅对我们的软件开发有帮助,也可以大幅降低创业者的创业门槛,同时是将来大模型连接真实世界和数字世界的工具和桥梁。”在与搜狐科技等媒体对话中,科大讯飞董事长刘庆峰强调称。

这也是为什么星火大模型要坚持升级代码能力的原因。刘庆峰表示,星火大模型的代码生成和补齐上已超ChatGPT,到今年10月24日全面超越ChatGPT,明年上半年要对标GPT-4。

目前,通用人工智能主要具备七大核心能力,包括文本生成、知识问答、逻辑推理、语义理解、数学能力、代码能力以及多模态能力。

刘庆峰表示,星火大模型在多轮对话和长链条的逻辑推理能力提升得不够快。“模型尺度要进一步提升,此外还没有完全开放,用户规模不够大,训练不够。”

对于星火大模型下一步的发展,刘庆峰表示,将继续提升七大能力,并构建更大规模算力,推动自主可控。“国外的算力现在不见得能买得到,就算买到训练完以后,安全性也很难得到保障。”

“我们有信心成为中国最早能够把大模型红利兑现到内部产品,同时能在行业快速落地的企业。”刘庆峰说,讯飞会理清主要赛道,哪些自己做,哪些通过生态开放给创业者。

在此次发布会上,颇为外界关注的还有,科大讯飞联手华为发布星火一体机,合作共建国产化算力底座。刘庆峰提到,这是首个基于国产算力可以一体化部署给企业,既能做大模型的训练和推理,又能做大模型定制优化的设备。

“华为跟我们联手打造,从算力、网络、存储等方面把算子库做得更透彻,效率就能更好的发挥。”刘庆峰透露,星火一体机能够对标英伟达A100的性能。

对于当前的百模大战,刘庆峰认为现阶段应该是鼓励为主,让更多人参与进来并不是坏事,可以让它更快成熟,发展得更好。

不过,他建议,为避免鱼龙混杂和误导投资人、消费者,国家有关部门或行业协会要制定相对比较权威科学的测评方法,让国内知道跟国外的差距还有多少,怎么补齐。

“到明年,通用大模型国内应该剩不了几家,但垂直行业会有很多家,而且应该百花齐放。”刘庆峰认为,这个过程中,哪些企业真正具有创新能力,哪些企业是瞎吹牛包装概念,慢慢就会水落石出。

在商业化方面,刘庆峰认为,大模型在各个行业深度应用,最关键要具备三大要素。一是安全可控,内容要安全,算力要安全,要把未来发展构建在完全自主可控的平台上。

第二是要从原来一昧构建概念去推广回归到场景驱动,看清楚带来的价值是什么;最后要构建专属模型,让用户非常快速和低门槛的去学习和训练,才能够使它赋能千行百业。

目前,大模型也逐渐分化为通用大模型和垂直大模型两派。对此刘庆峰认为,通用大模型是做好垂直大模型的前提。

“对创业公司或没有太多技术积累的公司来说,去做垂直大模型先解决行业的应用刚需,是一个比较科学合理的选择。”刘庆峰表示,但讯飞必须一开始去做通用大模型,否则未来在国际舞台上连上桌的机会都没有。

此外,他也希望,有数据、懂场景的行业细分龙头要多跟讯飞合作。“做大模型还是很专业的事情,很多企业以为拿开源的就能做出来,但最后可能做不下去,潜在风险也很高。”

“我们提供通用的能力底座和训练平台,他们来做优化,在内部满足各种场景需要,甚至可以联合起来往行业去推广。”他表示,讯飞会跟行业伙伴一起构建起星火大模型的新生态。

以下是部分对话节选(经编辑整理):

媒体:星火大模型自发布以来,最让您惊喜的能力是什么?还不太满意的能力是什么?

刘庆峰:第一个比较惊喜的是任意风格的长文本生成,中文大家都不错,但英文我们接近ChatGPT。我们的数学能力也迅速做到行业第一,比ChatGPT还要好,国内也是遥遥领先。当时搜狐测的10道高考数学题,我们对了5道。这次的代码能力也很惊喜,非常接近ChatGPT,多模态理解能力在业界也是最好。

相对不满意的是,多轮对话和长链条的逻辑推理能力提升得不够快。模型尺度还要进一步提升,到了GPT-4的规模会更好,此外我们还没有完全开放,用户规模不够大,训练不够。

媒体:为什么这次星火大模型的升级把代码能力放在第一位,它的价值体现在哪些方面?

刘庆峰:代码能力不仅对我们的软件开发有帮助,可以大幅降低创业者的创业门槛,同时是将来大模型连接真实世界和数字世界的工具和桥梁。无论是软件产业还是数字经济发展,中国如果在大模型时代不把代码能力提升到国际领先水平,整个国民生产效率一定没法跟国际巨头去比,所以我觉得这件事情很关键。

媒体:讯飞星火功能的进一步的丰富或完善,现在有什么样的限制或困难?

刘庆峰:今天影响我们更快进步的主要是两个方面,一个是算力,我们也在构建更大规模的算力,预计到今年10月份会构建成功几千P的算力。同时要构建自主可控的国产算力平台,国外的算力现在不见得能买得到,就算买到训练完以后,安全性也很难得到保障。我们也需要理清主要赛道,要确定哪些自己做,哪些通过生态开放给创业者。

媒体:跟华为联合推出的星火一体机如何定位,能给产业带来什么价值?

刘庆峰:星火一体机是首个基于国产算力可以一体化部署给企业,既能做大模型的训练和推理,又能做大模型的定制优化的设备,我们算是填补空白。华为跟我们联手打造,从算力、网络、存储等方面把算子库做得更透彻,效率就能更好的发挥。同时因为集群架构更好,所以我们可以对标英伟达A100芯片的性能。

媒体:做大模型对于科大讯飞来说意味着什么,对您来说意味着什么?

刘庆峰:对科大讯飞和对我的意义应该是相通的,讯飞就是我奋斗的舞台。大模型的通用能力可以进一步推动我们在各个维度和领域的人工智能应用更加成熟和相互协同。大模型也可以彻底改变内容生产的方式和人机交互的方式,将来能做各种智能助手。最后大模型可以带来人工智能生态进一步极大的反哺,我们有信心成为中国最早能够把大模型红利兑现到内部产品,同时能在行业快速落地的企业。

媒体:国内大模型已经过百,您怎么看待目前现状和未来趋势?

刘庆峰:百模大战我觉得是好事,现阶段应该是鼓励为主,让更多人参与进来并不是坏事,可以让它更快成熟,发展的更好。但为了避免鱼龙混杂和误导投资人、消费者,国家有关部门或行业协会要能够制定一个相对比较权威科学的测评方法,让我们知道跟国外的差距还有多少,怎么补齐。否则会导致整个市场混乱和认知混乱,不利于整个产业健康发展。

我觉得到明年,通用大模型国内应该剩不了几家,但垂直行业会有很多家,而且应该百花齐放。同时,哪些是用的第三方开源模型,去瞎吹牛包装概念,哪些真正具有原创新能力、平台开发能力和赛道应用能力,慢慢就会水落石出。

媒体:大模型的商业化落地有哪些难点?

刘庆峰:我觉得有两个,一个是我们需要在国产算力安全和数据安全的前提下给各领域赋能,基于完全不可控的第三方开源平台,不知道训练的数据怎么来,也不知道会产生什么结果。

第二要从原来一昧构建概念去推广回归到场景驱动,要看明白带来的价值是什么,是新增效益、节约成本,还是提高质量。最后要构建专属模型,能够让用户非常快速和低门槛的去学习和训练,才能够使它赋能千行百业。

媒体:从技术跃升潜力和市场规模前景两个维度,您更看好通用大模型还是垂直大模型?

刘庆峰:我肯定是首先看好通用大模型,这是做好垂直大模型的前提。对创业公司或没有太多技术积累的公司来说,去做垂直大模型先解决行业的应用刚需,是一个比较科学合理的选择。但讯飞必须一开始去做通用大模型,否则未来就不可能在国际舞台有一席之地,连上桌的机会都没有。

媒体:现在很多垂直领域的领军或龙头企业去做垂直大模型,您怎么看或有什么建议?

刘庆峰:我觉得挺好,大家要拥抱,但我认为将来比较科学、可能做到效果最好的方式,是这些有数据、懂场景的行业细分龙头要跟讯飞这样的公司来合作。

我们提供通用的能力底座和训练的平台,他们来做优化,在内部满足各种场景需要,甚至可以联合起来往行业去推广。做大模型还是很专业的事情,自己从头到尾做不值得,很多企业以为拿一个开源的能做出来,但最后可能做不下去,潜在风险也很高。

媒体:大模型越来越强调生态,讯飞未来生态建设会怎么来做,跟合作伙伴怎么分工?

刘庆峰:讯飞是平台+赛道的双轮驱动,平台就是构建生态。但中国整个产业的价值链分解并不够科学和合理,微笑曲线在国内是一个抛物线,技术和生产公司都挣不到钱,主要掌握在有用户资源的企业手中,没有给核心技术合理的定价。这导致我们不得不去做垂直行业,否则就没法盈利,没法支撑技术梦想的实现。

我们会跟开发者说清楚,保证开发者做的事情不会跟我们撞车。这一次星火是新生态,是用户做各种小助手,做插件,比原来的生态更加丰富,也更加容易激活。我们也跟国产算力、操作系统深度联合,除华为外,跟寒武纪、曙光及国产操作系统企业等都有长期合作,构建起国产的软硬件生态体系。第三就是行业生态,用讯飞的人工智能能力,用行业龙头的场景和影响力,联合打造场景,然后去全面推广。

责任编辑:

推荐