原标题:对话 联想集团CTO芮勇:GPT技术架构还没有实现人的闭环,应用比较危险
随着以ChatGPT为代表的人工智能前沿科技的持续火爆,大模型越来越发受到重视,国内外科技巨头目前都在争先恐后研发相关产品。这也使得对算力等需求将进入井喷期,近日OpenAI就因算力紧张而暂停了ChatGPT会员的注册服务。
“大模型是AI突飞猛进的划时代的现象,如同网景带来互联网的爆发,iPhone引发智能手机爆发,大模型也将推动人工智能的爆发。”联想集团高级副总裁、CTO芮勇近日接受搜狐科技等媒体采访时表示。
他表示,联想集团将会积极抓住大模型及其对各行各业带来的新机会、新变化。“我们此前也有思考和布局,不是等大模型火了才去弄算法,那黄花菜都凉了。”
芮勇表示,GPT大模型涉及到的核心算法,包括零样本学习(Zero-shot Learning)、小样本学习(Few-shot Learning)和上下文学习(In-Context Learning),联想研究院的AI实验室之前都有布局,边缘人工智能跟大模型在很多核心算法上相通。
据了解,联想研究院的AI实验室是芮勇2016年加入联想集团后不久成立,并在去年开始发力边缘人工智能。联想集团还在2021年底建立了第一个技术委员会,杨元庆担任技术委员会主席。“这是第一次我们从整个集团角度,从上往下进行统筹和规划。”芮勇表示。
芮勇透露,今年联想集团将瞄准两个技术领域进行布局,computing和AI,即计算和人工智能。他表示,计算是联想的基因,其自成立以来所做的事情都跟计算有关,同时要面向未来,而人工智能就是未来,今后联想所有技术都会围绕着这两个最重要的锚点。
在他看来,计算(computing)是更宏大的概念,不仅仅包括计算设备(computer)和算力(computing power),还包括算法、中间件、应用,甚至解决方案等。
芮勇提到,在过去三十多年的发展,计算经过了PC和互联网、智能手机和云,以及目前AI和元宇宙等多场景不同的时代,不同时代的工作负载对计算体系架构有不一样的要求,而今后的计算越来越是新场景驱动下的计算。
芮勇认为,大模型会给联想集团的“3S”带来机会。第一个S是智能设备,它们为AIGC和大模型提供了入口。第二个S是智能基础设施,联想集团在去年首次提出“普慧算力”的主张,强调把算力变成产品和服务提供给用户。
在近日的新财年誓师大会上,杨元庆透露,联想集团已成为全球第三大服务器提供商、第五大存储设备厂商,并再次强调全力推动普慧算力的落地和普及。
“AIGC和大模型对算力将是成百上千倍的需求,今年没这么火的元宇宙早晚还会火,那时候对算力需求又会非常大。这就可能导致全球算力都不足,但不能拼命消耗算力,还有绿色环保的问题。”芮勇表示,联想连续九次蝉联全球高性能计算Top500的第一名,且很早就在投入绿色计算。
联想集团执行副总裁兼ISG基础设施方案业务集团总裁Kirk Skaugen以AIGC为例谈到,从大型语言模型的训练到AIGC应用的运行,都需要高性能计算中心作为基础设施,预估单个大型AIGC的训练和运行,相关基础设施投资应在数百亿元左右。
这意味着,AIGC将对数据中心行业带来巨大的发展和增长机会。为此联想集团也确定了成为全球增长最快、最终成为最大的端到端基础设施解决方案提供商的目标。
芮勇还提到,大模型是依靠分布式、并行式训练的架构来支撑,过去几年研究院对此也有很多投入。同时,联想研究院去年还成立了一个新的实验室——先进计算实验室,包括异构计算和隐私计算,都是跟大模型密切相关的技术。
在第三个S即行业智能方面,大模型可以基本解决很多ToC的问题,但还有很多很庞大的市场是来自ToB垂直行业的智能化。“无论是智能制造,还是医疗、教育,目前大模型的知识能力跟行业专家比还有差距,联想将通过垂直领域大模型推动行业转型。”芮勇表示。
不过,做大模型也面临很多挑战,各家企业做出来的产品,由于在数据、算力和算法等方面的不同可能也会有明显的差异,但大模型还是被寄予了厚望,正如不少观点都认为ChatGPT开启了通用人工智能的时代。
“大模型是不是能解决所有的问题?有人说大模型是通向AGI通用人工智能的一条路,我们还是比较谨慎地说这话。”芮勇表示。
他认为,GPT和Transformer整个技术架构还没有实现人的闭环系统,这也就是它为什么会出现“幻觉”的原因,在部分场景应用的话就会比较危险。因此,大模型的闭环系统还有待于进一步开发。
芮勇还提到,人是群体智能,人和人之间可以协作,但目前大模型暂时还没有这样的能力。因此他认为,目前大模型距广义上的通用人工智能跟人还有差距,未来还有一段路要走。返回搜狐,查看更多