新闻中心


NEWS

全球视野——透视AI大模型与元宇宙创新标准


自2022年底,ChatGPT横空出世,让世人看到了通用人工智能的曙光,大模型就成为了创业圈、创投圈最热的话题。
如今,中国的大模型创业者已经集结在十字路口。他们之中既有研究自然语言理解、计算机视觉、机器人等领域将近40年的科学家,也有已经功成名就的前创业者,还有刚刚博士毕业的年轻人。创业者们在各个层面展开竞争。
为此我们发起AI大模型系列直播【探索AI大模型时代 引领AIGC新浪潮】,本系列直播共5场,主要从大模型应用场景、元宇宙标准 、大模型在to B、to C领域的应用等方面,邀请国际、国内AI领域方面的重量级嘉宾为大家深度解析大模型的当下与未来。
人工智能技术的突破会对元宇宙的建设产生怎样的影响?带来哪些技术、产品、产业变革?人工智能和大模型领域有哪些重要关键的趋势?在面临下一个科技巨变的时代,未来的科技生态会有哪些改变?中国企业如何抓住这一契机,更好地融入全球创新生态与发展?
本期直播,袁昱和王湘云带来了重磅分享。
袁昱系全球最大的专业技术组织——IEEE的最高董事会董事兼IEEE标准协会主席。他是IEEE历史上第一位中国籍董事,也是IEEE标准协会历史上第一位来自美国以外的主席。作为富有远见的科学家、发明人和创业者,袁博士正领导若干企业在元宇宙、虚拟现实、增强现实、人类增强等方向深耕,进行前瞻性的技术积累和产业布局。他与盛景嘉成共同创立的VerseMaker(元创盛景),是立足全球服务中国的元宇宙创新赋能与产业孵化平台,致力于成为中国研究与研发、教育与培训、大企业、创业公司和投资机构参与全球元宇宙创新合作生态的桥梁和催化剂。
王湘云系盛景嘉成基金管理合伙人,主管盛景人工智能/元宇宙/产业互联网/企业服务/SaaS赛道,以及盛景海外母基金(美国/以色列)的投资;在加入盛景嘉成之前,历任清华紫光股份企业规划部总经理,SAP ERP咨询服务事业部总经理,博彦科技高级副总裁。
以下为精华内容整理,enjoy ~

一、Apple Vision Pro被誉为“划时代产品”。它的问世,会带来哪些技术、产品和产业的变革?
袁昱:
Apple Vision Pro的发布,从技术上来讲,谈不上划时代。它仅实现了现有技术的集成,在产品的设计做到了极致。
苹果的入局,对于整个XR行业是一个背书,会带来信心的提振。从这个方向上来讲,意义会更大些。
《连线》杂志上有一篇文章,称它的问世更类似于特斯拉的Roadster时刻。我认为这个比喻会更贴切一点。特斯拉的Roadster时刻和iPhone时刻的区别是什么?Roadster是特斯拉的第一款电动车,卖得并不是特别好,但是是一个成功品类的雏形,沿着这个雏形往前,会越来越好。
Apple Vision Pro兼容了很多2D的东西,同时也有3D的想象和延展,会鼓励推动更多的软件应用和内容创造者以此为中心创造出更多的内容。随着内容更加丰富,硬件能力也会进一步提升。
因此,我认为Apple Vision Pro目前仅仅是一个过渡产品,真正要做规模化或者大面积的商业化,还需要有第二代或者第三代产品的迭代。
我很早就提出元宇宙有“两个半核心技术”和“五大支撑技术”,Apple Vision Pro,是“体机接口”一个很好的展示。
从这个意义上来讲,苹果此次发布没有提及元宇宙很正常,因为Apple Vision Pro本身并没有涉及到怎么去创建一个虚拟世界,只涉及了感知与交互。
二、马斯克投资的脑机接口公司(Neuralink)获得了人体试验资格。由于Neuralink的“顶流”地位和与众不同的愿景,这件事被很多媒体评价为“脑机接口”领域的里程碑。您如何看待?
袁昱:
马斯克做的脑机接口至少在相当长时间内将主要用于治疗。
一方面,可以读取脑电信号以帮助瘫痪的人。比如,这些人靠原来的神经信号已经没有办法去驱动肢体,但是通过脑机接口,能够把意图读取出来,通过AI去掉噪声,尽可能复原意图。
另一方面,通过“神经调控”,即通过脑电信号的刺激对脑部疾病进行治疗。
所以马斯克目前的脑机接口并没有太科幻,离所谓的意识上传也还差得太远。
而且我压根不认为意识上传可能实现。马斯克认为我们现在有可能已经生活在一个虚拟世界当中。那既然生活在虚拟世界当中,我们的意识就压根不是这个世界当中的虚拟大脑的虚拟神经元活动所构成的,从哪里上传呢?
所以从逻辑上来讲,“意识可以上传”与“世界是虚拟的”这两种观点根本上是互相矛盾的。
三、脑机接口、AR,包括最近大火的人工智能技术,这些核心技术的突破,会对元宇宙的建设产生怎样的影响?带来哪些技术、产品、产业变革?
袁昱:
我把元宇宙定义为一种数字的宇宙,这个数字宇宙分为三类:

第一类是跟当下宇宙不一样的宇宙——也就是VR(虚拟现实)。
第二类是当下宇宙的数字扩展——也就是AR(增强现实),
第三类是当下宇宙的数字副本或者数字对应物——也就是数字孪生。
这三类囊括了元宇宙所有类型。但是从严谨定义的角度,我归纳为体验的角度——元宇宙本身是一种用户体验,把外界的输入感知为一个宇宙。
从功能的角度,也可以认为元宇宙是下一代的万维网(Web 3.0),下一代的互联网(Internet),下一个阶段的数字化转型。
我们现在处在数字化转型的4.0和5.0之间,4.0是智能化阶段,得益于人工智能的突破,实际上即将到来的下一个阶段,就是元宇宙阶段,或者称之为现实化阶段。
我反复强调,人工智能并不是让元宇宙受到了冷落,而恰恰是元宇宙的奠基石之一,而且可能是最重要的一个奠基石。
从供给侧角度,人工智能可以从四个方面赋能元宇宙:创造丰富的内容、驱动虚拟的角色、理解世界、理解用户。
从需求侧角度,之前不少人觉得元宇宙有什么用呢?谁会真正去用到元宇宙呢?但人工智能的发展会使得劳动力市场发生不可逆转的变化,人工智能拉高了技能平均线,在平均线之下的人需要在元宇宙中寻找新的工作机会。
此外,人工智能为人类打工,让人类可以休息更多的时间,将来可能会每周休息三天甚至四天。现实世界当中资源有限,因此给大家提供娱乐休闲最好的场所,就是元宇宙。
我认为,将来工作的概念需要被重新定义。工作可以被定义成“为他人做出贡献”,那么在元宇宙当中通过社交娱乐跟他人产生交互,客观上提升了他人的体验,因此也是一种贡献、一种工作。
所以,人工智能的发展将促进劳动力市场的变迁,倒逼元宇宙成为刚需。
此外,元宇宙本身对人工智能也将起到促进作用。
在元宇宙当中,能够以最低的成本提供更多样化的训练环境,训练具身智能。未来,在元宇宙当中训练人工智能会成为人工智能研发的新范式。人工智能下一步发展需要多模态的训练数据。数据从哪来?元宇宙是既经济又有效的来源。
因此,人工智能和元宇宙相互促进。从数字化转型编年史的角度来看,我们目前正处在智能化阶段和元宇宙阶段的中间。
四、关于OpenAI 大模型的发展计划,Sam Altman 提到,今年的首要任务是要有更便宜、更快的GPT-4,要把"智能的成本"降低到最低。要有更长的上下文窗口,有状态的API。
您怎么看待Sam对大模型发展的预测,从您的视角认为大模型将如何发展?您常年在国外,从全球视野来看,看到人工智能和大模型领域有哪些重要关键的趋势?

袁昱:
除了用来辅助工作外,ChatGPT本质上更像是一个用自然语言编程的计算机。从编程的角度而言,实现更复杂、更丰富的功能是它的发展方向。
此外,面向通用人工智能需要有更多多模态的数据去训练,同时也会产生直接的应用场景,包括像机器人、虚拟世界的NPC等等。让它们在元宇宙环境里接受多模态的输入,不只是OpenAI、也是多个人工智能研究队伍所共同努力的方向。
王湘云:
如果算力足够或者交互的数据量足够,大模型结合多模态,可以给每一个用户构建一个角色,这个角色描述了各个维度的特征,未来如果这些数据被存储到模型里,模型可以根据这些特征给每一个用户提供更加个性化的反馈。
如果未来GPT既要承担通用的基础模型服务,又要承担面向每个用户的个性化的服务,一家公司肯定是完不成的,不排除会进行分层。有人做通用模型,在通用模型基础上,再去训练一些应用层的模型,应用层的模型分别服务于教育、医疗、金融等行业。
为了提供更好的服务,保证服务质量,一定要做好每个用户的颗粒度。为此,需要产业链上下游的协同,分担一部分算力。因此,在产业结构会诞生新的需求和机会。
五、您怎么看待AI对于人类所带来的风险?
袁昱:
谈到人工智能的风险,很多人的理解是人工智能一旦涌现出和人类相当甚至超过人类的智能之后,万一是邪恶的,可能会灭绝人类。这大概是很多科幻片和科幻小说给大家的印象。
但是这里涉及两个问题,一是人工智能到底能不能够达到甚至超越人的智能水平,二是人工智能到底会不会有危害?因为人工智能的智能水平高低和它有没有危害是两件事情。
不管从元宇宙的角度,还是从人工智能的角度,我们对于隐私和安全的担心,都有相应的技术手段和立法手段解决。
新兴科技越来越多,与传统的“标准被市场所驱动”不同,现在更多是“标准驱动市场、引领市场”。
在一个技术或者市场成熟之前,我们要预先考虑到有哪些地方需要标准进行相应的规范。我们需要意识到有这样的问题存在,然后主动去设计相应的对策。
六、通用大模型对算力要求很高,小模型对算力要求没有大模型那么高,但是准确度会不会受影响呢?
王湘云:
小模型对算力要求低,可以围绕着特定任务去做优化,但是小模型的泛化能力不够好。因此,可以基于底层的通用大模型,针对特定的场景或者专有的数据,做一些微调的小模型。
大模型提供了一个认知的基础或者说基础学习平台,在逐步优化过程当中,相当于有了一个非常智慧的大脑。比如,在这个基础上去学数学,相当于已经具备了80%的知识、认知和能力,只需要针对数学再训练一下剩下的20%就可以了。
人工智能产业化难、可扩展性难、可规模化难的原因就在于,针对每个任务都要训练专门训练模型,要求每一个任务或者每一个场景都需要非常专业的人工智能专家或者技术人员去训练。
具备通用大模型以后,使得人工智能可以更加普及化。人工智能的技术能力可以更加可扩展,支持更多的场景和应用。
原先的小模型什么都自己做,从零到一开始做,能力很难扩展。而未来的小模型是在一个强大的大模型基础上训练出的小模型,针对具体的任务,它的成本更低、训练更快。
七、大模型正在以肉眼可见的速度重塑这个社会,一场重新定义未来的比赛已经开始。在面临下一个科技巨变的时代,未来的科技生态会有哪些改变?中国企业如何抓住这一契机,更好地融入全球创新生态与发展?
袁昱:
从生态角度来讲,我有两点观察。
第一,开源。开源战略,不靠卖软件本身去挣钱,相当于借用了全世界的脑力,让大家一起在开源社区上添砖加瓦,速度会比闭源要快得多。不管大企业还是创业公司,都需要去深入思考:到底是走开源还是闭源的策略?
第二,去中心化。生成式人工智能极大提升了生产力,会促使生产关系进一步变化,值得我们去慎重审视、顺势而为。
开源、去中心化,这两点是值得大家思考的课题。
王湘云:
元宇宙是数字转型的高级阶段和长期愿景。不管是在消费领域、产业、工业领域,还是科学研究、政府治理、社会治理维度,这是未来的终极发展方向。
元宇宙到底是什么?一般意义的理解是,用数字化的技术优化现实世界,在这个过程当中,需要数字世界和现实世界能够更好地进行映射,而且数字世界能够在一个更大的维度和广度内对现实世界进行建模。
以前算力不够或者技术能力不够的时候,我们研究的对象往往是一个个体。如果站在一个更高更宽广的维度来看,我们会发现个体和个体之间、企业和企业之间、事物和事物之间,都是相互关联的。某种意义上,大模型提供了一个全局最优解。
因此,当我们有了足够多的算力算法模型的时候,可以在一个更广泛的角度把所有的关系建立起来构成模型,这就是元宇宙。
元宇宙是最广泛的数字建模。
建模的目的是什么?只在数字世界里就能够帮助我们更好地认识、优化、管理、控制、改造现实世界。
我们会发现,数字化和智能化的升级合二为一,最终结果是智能元宇宙。
各种各样的场景会由此产生。比如,在生活服务领域,大模型作为统一接口;
在教育、医疗、金融、法律等专业领域,会训练出来更多的专业模型;
在工业领域,随着产业元宇宙、工业元宇宙的到来,不是对单台设备进行优化,而是对于每一个行业的核心生产场景,会建立一个统一的元宇宙平台,这个元宇宙平台会把所有的生产、运营数据进行融合分析,形成一个实时的、在线的智能化计算平台,服务于前台的各种生产经营活动。
做通用大模型门槛很高,大部分企业都不具备这样的条件。但是做软件、做信息数字化服务、工业服务的企业,可以去构建行业大模型行业元宇宙平台,融合元宇宙、人工智能的技术,面向客户提供服务,这其中蕴藏着巨大的机会。
通用人工智能是人工智能皇冠上的明珠,用它构建一个服务平台,用足够大算力和数据泛化能力给各行各业做智能赋能。虽然门槛很高,需要非常强大的技术能力,但是也有企业朝着这个方向在不断努力。
通用人工智能会给各个行业进行有效赋能,通过多模态,形成完整的感知,能够把数字世界和物理世界进行有机融合。

推荐新闻