新浪新闻探索大会|刘伟光:大语言模型是人类大脑的极限延伸
更新时间:2024-11-04 22:38 浏览量:5
10月28日,由微博、新浪新闻联合主办,清华大学经管学院EMBA倾力支持的“新浪新闻·2024探索大会”在北京圆满落幕。阿里云智能集团资深副总裁、公共云事业部总裁刘伟光分享了题为《AI跃进,探索创新》的演讲。
阿里云智能集团资深副总裁、公共云事业部总裁刘伟光-主题演讲
以下是刘伟光演讲实录,内容经编辑略有删减:
阿里云是AI行业的实践者、探索者,也是探索者的陪伴者,今天我代表阿里云也来谈一些我们的感受和对未来人工智能发展的展望。
今天无论是大语言模型,还是耳熟能详的各种新兴的APP、自动驾驶最大的智能体,其实每一种智能化应用都是今天人类最聪明大脑能力极限的延伸。只是说人类在预测、探索、计算的时候存在稳定性、算力各种各样的限制,我们不能够把人脑发挥到极致。
今天算力、模型去助力在人脑当中最极致的智慧延伸到更多的场景,大家看到人脑就是计算机到AI是一个完整的延伸过程,人脑的计算过程就是今天人工智能、大语言模型、计算、推理、运算判断的决策依据,如人的视觉延伸到电视、智能手机的延伸,人的听觉延伸到广播、电话等等。
在我们不断探索人工智能大语言模型过程中,我发现这就是一个人脑、千亿神经元向更大一个参数过程非常重要的演进,今天人工智能是非常好地模拟了人脑的思维方式、推理方式,并且给予了更大的算力空间。总结一句话,大语言模型就是今天最复杂、最聪明的人类大脑的极限延伸。
AI探索不止于“已知”,更在于“未知”的星辰大海。大家今天对于大语言模型理解90%是手机终端那几个APP,但是这些APP只是人工智能今天产生的一种表现形式的沧海一粟,无论今天你在聊天、生成视频、生成图像,从文本生成、图像生成,包括各种各样的交互方式的优化和改变,这些其实都没有对今天的社会产生真正巨大深远的社会价值的影响。
我相信人工智能未来对整个社会影响绝不仅仅在于手机屏幕上的聊天和对话,它会更多地深入到生产、制造以及社会的方方面面,这才是人工智能AI for Science真正价值。
今天我们看到中国人工智能实践,包括看到海外的实践,我们深刻感觉到AI for Science,2024年诺贝尔奖颁给了AI领域的专家,我们有理由相信今后人工智能大语言模型延伸这些技术一定会解决生产制造、包括健康等等更多的社会型问题、人类型问题。人工智能必须要跟当前的社会运转体系进行更好的结合,才能爆发出很多新的体验和新的价值。
我们看到人工智能未来改变不仅仅是从手机终端,更多是对事物、对数据的理解,解决问题方法的改变,技术工具的改变以及专家能力的全方位提升,这些方面才是AI for Science真正价值所在。
跟大家分享我们认为AI创新的八大范式,也是未来我们要坚持走的八个领域:改变解决问题的方法、对复杂世界新的理解、改变基础工具、赋能物理世界、改变交互的范式、改变协作方式、降低门槛复杂性、赋予专家全新能力。
第一是改变解决问题的方法。
以今年诺贝尔奖主要的话题和成就为例——一个关于蛋白质分析的主题研究。传统的蛋白质科研从样本到采样、分析、处理到最后蛋白质结构分析,这个过程持续了很多年,而今天采用从AI for Science以及AI推理、创新、模拟、预测产生新的方法之后,它的效率提升一百倍以上,今天可以在单位时间内实现蛋白质分析的结构时间成本、创新成本要高百倍到千倍以上,这是一个非常大的飞跃,可以说今天人工智能在这个领域当中的探索远远超越了人类过去的实践。
第二是改变工具和创新。
最近埃隆·马斯克的火箭回收非常引人注目,其实我们仔细看背后的变化,是从传统的几十年来才有的火箭的发射回收技术,到今天AI的加入,使整个Space X创新成本、投入成本仅是过去的七分之一,但它实现了过去非常多实现不了的能力。
此外,AI for Science也可以应用到对人体健康基因方面的探索研究。比如我们和一个合作伙伴一起开发基于新的遗传病快速诊断的案例,我们通过AI模型的探索和预测、分析,使得整个分析诊断率提升20倍。
第三是对复杂世界新的理解。
天气预报是每个人平时都会看的,我们通过它了解天气。在没有人工智能之前,它就是一个非常大参数的类似于大数据分析计算的典范,它需要超级计算机,很多的参数和数据投进去之后产生的结果。
而今天,我们和复旦大学借用AI做了一些尝试,有一些明显的变化。首先,我们可以在这个模型当中投入的参数是过去的几倍甚至几十倍,也就是说我们可以在有限的算力下处理比过去高几倍、几十倍的数据,参数模型变多了,数据变多了,数据量变大了,单处理能力反倒提升了。其次,我们可以让预测周期从5天、10天延长到15天,但需要注意的是,当第15天发生的时候它预测准确率跟第5天是几乎一样的,这就是人工智能带给行业非常大的变化。
第四是端侧大模型。
大会期间有一个非常令人兴奋的仪式就是小鹏交车仪式,未来我们有理由预测手机、汽车、机器人是三位一体的车,这也非常得益于今天AI和很多新的技术能力的不断提升,让手机、汽车和机器人都具有原来没有自动化的拟人的沟通和交互模式。今天的机器人再也不止于扫地、运输这些体力活,更多是今天机器人的控制大脑就是大语言模型非常典范式的延伸。大语言模型能够让机器人拥有人工智能最高的指挥中枢,让机器人能够实现各种各样拟人的操作,实现更多能力的延伸。
我们相信在未来5到10年,除了汽车之外,每个家庭都会购入自己的第一个机器人,帮助家庭实现各种各样能力的提升、体验的提升以及家庭幸福感的提升。
今天很多汽车已经不再满足于物联网的应用,座舱大模型甚至自动驾驶,包括和机器人的紧密结合,带给我们的体验不仅仅是电动汽车的改变,更多是车和人的亲密无间拟人式对话和交互方式,以及汽车自动驾驶带来无与伦比的体验,可以说自动驾驶就是人工智能迄今为止最伟大的智能体应用。
我相信未来手机一定不是今天大家看到的某几个典型应用Copilot,未来无论是在车里面增加智能体,还是手机里面增加Copilot,可以说这只是AI interpretation,下一代产品一定是原生的AI手机,原生的AI汽车,AI能力将原生的被内嵌制手机、汽车和机器人当中。
第五是交互方式。
在手机终端发生了很大的变化,有很多新的APP的出现。这里面有两类趋势,第一类是叠加智能体,增加互动性,增加客户体验,提升日活、月活;第二类是很多全新的基于GPU推理集群的APP,这些APP最大的特点是打开以后没有按钮,没有菜单,只有一个对话框,你需要的就像你跟一个人沟通一样,你问他各种各样的问题,你让他帮你做各种各样的操作。这种拟人式的交互将大大解放人的生产力,提升使用效率,让更多人群能够便捷的使用这种唾手可得、在身边的AI能力,这就是AI带给未来手机终端、APP终端非常大的变化。
从中国到美国,现在已经有越来越多的各种各样类型的AI本地应用的产生,这会让很多应用重新再写一遍。未来无论在手机终端的应用,还是在企业终端PC端的应用,都将被AI所改写,或者重写,或者重构,将采用新的架构、新的GBU集群来重新技术推理和运算。
第六是多角色协同。
今天智能体绝不仅仅只是交互、对话、娱乐,更多的是一站式的全链路的辅具。举个例子,当我对智能体说帮我订一张机票,它真的帮我订完了,不只是帮我查一张机票,当我说帮我订一个酒店的时候,它真的订完了,不是说给我查了个酒店的信息。
在钉钉里边有一个实践,它将很多智能体做了细分,订酒店、订机票、生活助理等等,并且它能够让不同的智能体组合成一个小的家庭,小的群体,让不同智能体进行联合操作,帮你完成更复杂的生活助理、工作助理,会议、生活、机票、酒店、沟通等等。今天智能体发展已经逐渐走向了一站式,而不简简单单是智能对话的智能体,我们相信这种智能体会越来越垂直化、具象化和专业化。
第七是降低的门槛。
今天我们看到未来终端将具有很多智能化能力。
一个多月前在杭州举行的云栖大会,我们CEO吴泳铭讲了一句话,人工智能大语言模型的延伸绝不仅仅在手机终端屏幕里面,一定会延伸到未来真实的物理世界。换一个角度来解释,今天看到各种终端,无论是手机、汽车还是未来的提款机、各种各样电子终端和物理实体终端以及以菜单形式存在的终端,未来一定都会具有拟人对话能力、沟通能力。这将对社会智能化有一个巨大的提升。
第八是快速赋能专家能力。
快速赋能专家能力是整个大语言模型当中在今天迄今为止最有价值的落地。
在代码、程序编写方面,今天大语言模型对现在程序员的提升是非常显著。无论在阿里内部,我们已经上线了第一个AI程序员,还是我们跟很多大型企业、央国企合作代码大模型,都看到代码大模型可以非常好地解决很多重复性代码、代码校验等等工作,尤其在代码应用层提升了程序员的创作效率,最重要的是它是一个没有情绪、不知疲劳的代码程序。
再讲一个例子:我们从两个季度之前,阿里巴巴在美国上市公布的财报,已经采取让通义千问自己的大语言模型来编写。大家知道上市的报告是一个非常复杂的工作,而今天这些工具的创作只要给它喂入足够多的语料,它的创作效率是人创作的几千倍、几万倍。
所以在非常复杂的文档、文案创作当中,大语言模型能够真正体现出非常高的价值,今天我们看到在我所接触的客户当中,这类产品是接纳最多的一类产品。我相信这只是迄今为止,更多智能化会不断地释放出来。
最后,今天我既是代表阿里,也是代表阿里做智能化新的使命,所以阿里云既是云计算提供者,同时也是中国乃至世界非常重要的个人工智能大模型探索者。我们自己在研究探索大模型过程当中,对产业、现有客户端,看到很多变化、也产生对行业的理解。
对我们自己来讲,云和大模型真的是一个齿轮咬合效应,两者是相互的相辅相成。讲几个简单的例子,当我们去构建一个非常大的参数的大语言模型的时候,今天你需要的可能是一个至少超过5000卡的GBU算力的集群,甚至万卡集群。当你构建这样的集群的时候,它是一个真正的高速网络、存储共同调度的过程。
今天云计算的网络存储能力对于千卡、万卡集群能力是一个巨大能力的加持,同时当我们持续不断的构建推理训练集群的时候能源消耗是非常大,今天在百度上搜索一道数学题和在通义千问上APP上算一算这一道题,对背后的CPU、GPU的消耗是非常不同的,今天当你构建一个很复杂的模型、不断更新的时候,背后整个的算力,包括电力都有很大的挑战。
所以今天云之于AI不仅仅是网络、存储,也包括能源各方面能力的加持,反过来讲AI带给云很多变化,正因为有了AI我们才出现了用AI来检测云的安全稳定性,云的智能化,让云的运维更加智能,今天AI之于云,云之于AI都是相辅相成、共同成长螺旋的上升过程,希望未来跟大家有更多一起探索和沟通的机会,感谢!