新闻中心


NEWS

畅谈大模型时代的产业变革与颠覆


 

如创世纪般,大洋彼岸的振翅,掀起了全球的AI巨浪。

 

ChatGPT、GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API,一颗颗重磅炸弹,扎堆引爆。

 

国内,百度抢先做出文心一言,做了第一个吃螃蟹的人。目前,阿里、京东等互联网大厂,华为、商汤科技、昆仑万维等科技公司纷纷推出自家大模型,内容平台知乎也发布了 “知海图AI”。

 

创业者们摩拳擦掌,美团联合创始人王慧文振臂一呼,直接all in;搜狗创始人王小川成立百川智能,旨在打造中国版的OpenAI。

 

AI大模型群雄逐鹿。如阿里CEO张勇所说,“面对AI时代,所有产品都值得用大模型重做一次。”大潮来临,投资人与创业者一样激动、紧迫且焦虑,担心慢一步就落后于时代,错失最大的机遇。

 

AI会成为新的造物者吗?大模型时代,产业结构和生态、创业和投资逻辑会发生哪些重塑和变化?多模态大模型创业备受关注,又将带来怎样的机遇与挑战?大模型能否解决AI商业化难题?个人应该化解大模型时代的冲击?

 

本期盛景大咖谈,盛景嘉成创投管理合伙人王湘云,澜舟科技合伙人、首席产品官李京梅、数据智能领军人物、教授级高工张晓璐带来了重磅分享,这也是盛景大咖谈系列直播的第102场直播。
以下为精华内容整理,enjoy ~

 

OpenAI的技术进展可以说是日新月异,不断挑动着大家的神经。OpenAI从成立发展至今,到底做了哪些方面的进步或突破?

 

王湘云:GPT开启了一个智能平民化的时代。回顾过去产业发展的历史,能源平民化的时代让电力等能源可以为普罗大众共享和拥有,PC计算机的到来让我们进入信息技术平民化的时代。

 

今天,GPT来了,智能——这样一个人类最高价值的圣杯,也可以为普罗大众所拥有,这是OpenAI所带来一个本质性改变。这样的结构性变革,会带来很大的冲击和想象空间,让我们不断思考未来会发生哪些可能性。 

 

李京梅:首先,GPT重新定义了搜索引擎。GPT除了能进行关键词查询,还可以对整个搜索意图有更加广泛、从语言角度的理解。不但搜到结果,还能把搜索结果进一步做总结、做摘要,进一步溯源。

 

GPT对办公软件也进行了颠覆,包揽了一切可以提升效率的工作。微软宣布名为Microsoft 365 Copilot的AI产品将应用于该公司一些最受欢迎的商业应用程序中,包括Word、Excel、PowerPoint、Outlook、Teams等。Copilot基于大型语言模型(LLM)基础之上,背后有来自于Microsoft Graph、GPT-4等模型的支持。Word应用上,Copilot能够和用户一起撰写、编辑、总结和创作。

 

PowerPoint应用方面,Copilot通过自然语言命令将用户的想法转化为设计好的演示文稿。在Excel中,Copilot将帮助用户在短时间内创建专业形式的数据可视化。

 

此外,在文化创意领域,重复性的设计工作都被取代,AI甚至可以自动生成脑洞大开的设计稿。

 

而在技术领域,原来可能每一个方向都需要单独有一个模型,而如今一个大模型就可以搞定。

 

因此,在AI领域、在搜索、办公、内容创作等方方面面,大家都感受到了一种即将被颠覆、未来已来的感觉。

 

张晓璐:GPT4主要有三方面的改进。第一,它是一个多模态,将影像、图像的东西和文本进行了结合。第二,文本的长度从4096扩大了八倍,可以大大提升多轮对话的效果。第三,因为本身大模型的训练和推理的成本是非常高的, GPT4做了比较扎实的基础工作,用相对少的计算来预测,在大模型的性能上有大幅提升。

 

多模态之于模型发展有着怎样的意义?未来从多模态的角度,是否文本必须是根本性的?从产业的角度,未来具备什么底层能力的AIGC更有优势?

 

张晓璐:人接收到信息大概83%来自于视觉,11%是来自于听觉,剩下的来自于触觉和味觉。叠加起来人的信息来源是多模态的。如果想模拟一个通用人工智能,多模态肯定也是必不可少的技术路线。

多模态、不同模态之间会有互补,理论层面上来看,多模态要比单模态在模型预测上会带来更好的性能。随着数据量的增加,多模态的性能增益会更大。

 

从模型本身来说,多模态会让整个模型的开发进入一个更加蓬勃发展的时期。多模态最重要的一个任务是多模态特征的表示——用统一的语言能够表示多模态的信息。

 

另外多模态的转换还会涉及到多模态的对齐,比如语音、影像怎么能自动化进行对齐,还会有一些协同工作。在模型的研发上,会带动一批新的研究领域。比如对于盲人来说,能够把一些视觉的信息能转换成音频。对医生来说,本身看病也是多模态的,先有问诊,会看之前的病例和影像。随着技术的进步,会融入更多DNA、蛋白组学、代谢组学的信息,让医生更好地判断疾病,给出更好的治疗方法。

 

王湘云:从计算机的角度,不同模态的数据最终都是转化成计算机所能识别的符号。但是对于用户而言,文本这种能力的生成以及文本和其他模态数据的联动,比如声音文本、图像文本、视频文本和未来元宇宙时代的3D模型的打通,是非常必须的。

 

在智能时代有两类用户,人和机器。对于机器用户,可能不需要文本。但对于人类用户,文本是一个通用的界面。图形界面的开启使每个人都可以跟计算机来进行沟通和交互,文本则开启了普罗大众都可以跟大模型这样智能化平台来进行自然语言交互的统一的、最广泛适用性的入口。

 

如果从产业角度来看,多模态智能化的平台有了一个最通用、最充分的扩展性。当从经济角度去研究一个主体、一个模式、一个企业,是否具备经济性的一个重要评价纬度是是否具备可扩展性。这种扩展性决定将来有多大的规模,有多少个场景能够使用,也意味着有多大潜在的市场规模来分摊创新成本。

 

我认为,大模型实现了多模态,使得大模型在未来经济性的可持续发展上成为可能。之前当很多人工智能企业不具备多模态能力的时候,它的模型、智能能力往往是针对特定场景和特定数据的。但是有了多模态的能力,这个模型有广泛的适用性。这是未来在大模型时代或者GPT时代的一个经济性体现,这种经济性瓶颈的突破会让产业生态带来非常实质性的改变。

 

李京梅:自然语言是人工智能领域皇冠上的明珠,因为语言很难、非常丰富,表达了人的很多思考。由感知智能向认知智能去演进的过程中,人工智能在语音识别、图像识别、人脸识别等技术上已经非常成熟。但是当听到、看到,是不是能够去思考,能够去做决策,甚至能直接生成、创造更多的内容,都跟认知智能整体相关。目前,在底层通过一些向量化的表示,让不同模态的数据进行比较,比如图片和文字、语音是否一致,已经成为了可能。

 

自然语言是非常好的人际交互界面,我相信会持续下去。有了多模态的技术,会让人类跟机器之间的交互表达更加高效。

 

ChatGPT的横空出世,让人觉得很酷、很有逻辑,但有时候也会觉得是一本正经的胡说八道。有些很简单的问题也会答错。OpenAI创始人Sam Altman最近的深度访谈里也提到,让模型变得更可靠、更信赖,是OpenAI接下来重点发力的技术方向之一。在产业应用场景,这种瓶颈是否会带来应用场景的受限?

 

王湘云:从价值链的环节角度来看,所谓一本正经地胡说八道,其实体现了一种多样性的试错。这种多样性的试错,在研发设计阶段其实是好事。

 

工业界、产业界一个常用的词叫仿真,仿真就是对一些新的设计进行模拟,来预测可能产生的结果。在大模型或者智能化的模型以后,数字化仿真的成本会越来越低,意味着用虚拟数字化的手段,就可以以低成本的多样性来试错。

 

一方面,在这个过程当中,可以把模型更加浓缩和精炼。在大模型的基础上,通过多样性试错以后,来生成一个相对小的模型,而这个小的模型对具体的场景来讲会更加精准和精确。也就是说,前期的仿真试错会让我们生成一个更加垂直或者是专有的模型。

 

另外,仿真过程当中,这种多元化的试错也可以帮我们去启发一些思路。比如李世石和AlphaGo下围棋,人工智能下出来的很多棋路,是之前人类没有见过的,在人类棋手对弈过程中是缺少此类数据的,它扩大了平常经验的范围。所以,我觉得在设计和研发阶段,多样化的试错是好的事情,或许会偏离正确的答案,但也带来创新的启发。

 

当然,当真正地投入能量、物质等等来进行生产的时候,要注意实时化的精准,而且要快速响应,很多东西可能不能等到在一个大模型里慢慢生成,以秒、毫秒级的响应,对模型的要求就要很精准,就不能一本正经地胡说八道了。

 

所以我觉得在不同的场景下试用性是不一样的。但是从整体范围来讲,这是一个多样性和准确性的平衡。在有的场景下,我们希望有更多的多样性试错;有些场景下需要精准性。这种组合可能是一个更好的解决方案。

 

李京梅:实际上,最后大家从ChatGPT这种大模型里想要得到的,归根结底是一个语言能力。但公众希望大模型无所不能。这种预期本身在商业化落地的时候,是不现实的。像在金融行业等容错率比较低的行业,从大模型引入的是一种语言能力。在行业里进一步去落地的时候,要融入专属的数据以及知识图谱。

 

商业化的场景容错率相对会低一些,解决一本正经地胡说八道,肯定不完全靠大模型,要靠人机互动。从行业落地来讲,更多希望把语言能力(多轮对话的能力),还有思维训练、逻辑分析能力可以引入到行业、实现落地。

 

电力时代、信息时代到来,都使得产业结构发生了非常大的变化,有些产业诞生了,有些产业消亡了,很多产业的产业结构和产业链也发生了深刻的变化;作为大模型开启的智能化的时代,产业结构和生态会发生哪些重塑和变化?

 

王湘云:互联网等容错率比较高的行业会率先发生变化。未来互联网的生态,会在基于底层大模型的基础上,上层颗粒度会解耦。以前个人和个人之间更多是偏消费性的协作,可能一起购物、花钱、娱乐等等,但是随着大模型时代的到来,很多技术底层实现的工作被替代,一些个人会变成有高生产力的单元,个人和个人之间就会发生很多生产性的协作。在这种情况下,我觉得生产单元会解耦。现在互联网的大平台是集中化的平台,实现了很多能力之间的紧耦合,紧耦合的好处是效率、可信度、服务质量的提升。

 

生产单元解耦的同时,要形成一种生产力的协同,不能变成一盘散沙。这个时候除了大模型以外,还会形成一种协作平台,就是这种细颗粒度的生产单元的协作平台。在这个协作平台上,会实现规划的能力,包括流程协作的能力、权限分配的能力、利益机制分配的能力。

 

我觉得可能最先发生变化的就是互联网产业,未来我相信大家协作进行生产,内容会更加多样化。

 

至于工业化,未来一定是混合态的模式,既需要大模型的能力,也需要小模型的能力,因为工业对精准度实质性的要求会更高。有了人工智能大模型的支持,一些传统、不经济的碎片化服务,结合机器人的能力,会变得更加经济,会利好服务机器人产业。

 

大模型是一种人工智能的路径,但不是唯一的路径。人类实现智能化和大模型实现智能化,是两种不同的路径。人类更像一个生物芯片,未来可能会有一种新的人工智能路径出现,这种人工智和现有大模型路径形成互补,所以我相信未来的人工智能也是多模态或者是说混合态的人工智能。

 

李京梅:云计算其实有三种:IaaS、PaaS跟SaaS。IaaS指基础设施即服务;PaaS包括中间开发平台或者面向技术人员提供组件,更方便去搭建自己的应用;SaaS型就是软件即服务,直接把应用型端到端的软件放到云上,用户以订阅式的方式去购买、使用、租用这个软件,把它变成一种服务。

 

今天大模型时代,又提出一个新的概念,就是MaaS(模型即服务),把模型作为一种服务开放给更多的技术人员。

 

中小型企业不太可能做私有化部署自建模型,它就会利用这种平台型/云计算型的厂商提供的模型即服务,或者只是做一些微调,就可以满足任务的需求。那这时候模型即服务也是会发生一些深刻的变化的。

 

张晓璐:AI底层越来越大一统,上层的应用会百花齐放。原来会分成计算机视觉、NLP、语音等几个大的方向,每个大的方向下有很多垂直的子任务。到现在,整个大模型,特别是OpenAI提出的多模态转换,会将不同模态变成一个非常底层的架构,上层的应用会非常薄,但会非常多。

 

其他产业的一些结构,比如说建筑领域,整个地基会变成标准化的产品,上面的组件像积木一样能够标准化生产,根据不同的应用需求去做搭建;餐饮行业,集中厨房来进行加工,餐厅会强调场景化和氛围感,这可能会是大趋势。

 

从个人工作来说,未来真正需要参与工作的人可能是TOP10或者TOP1这些更顶尖的这些人。不止ChatGPT,谷歌在医疗领域做了一个Med-PaLM,在医师考试的水平上面的已经可以达到TOP10医生的水准,法律行业接近85%水平。意味着说,低于这个线下面的很多工作,就变得没有太多意义。这是对于我们未来工作参与度的改变。

 

再长远一点,大模型本身具备生成的能力,但还有一个很重要的能力是对知识压缩的能力。

 

未来机器和人、人和人的通信,有了大模型、语言模型作为知识存储,压缩中间环节,叠加上大通量的脑机接口通信能力,未来在接受教育、知识积累的这部分时间的长度是不是可以大大压缩呢? 

 

大模型时代的创业和投资逻辑、投资模式会发生哪些变化?

 

王湘云:OpenAI给我们示范了一个智能时代的投资新模式。它把这种大模型更多地看成是一种社会公共服务,是一种社会的基础设施,所以我们看到OpenAI并没有继承完全的私有化投资逻辑,更像是一种社会化或者联盟化的投资逻辑。当所有初始投资人都得到回报以后,最终OpenAI真正变成一个非盈利机构所控制的社会公共的基础设施了。

 

我想作为这种大模型,未来在整个社会、经济、产业当中承担的角色,社会化、联盟化应该是一个趋势。因为它的能力对我们整个社会的赋能太重要了,很难说让单一的机构、单一的盈利主体来完全控制,更多还是共享共有机制。

 

除了大模型之外,我觉得未来可能还会有一些服务于企业更私有化、更专属的 AI模型。

 

VC投资的掐尖逻辑可能也会发生变化。以前VC研究各个赛道的规模、创新的项目,把凡是有可能的一些新公司、项目都看一遍,在其中选出最有可能成为TOP3的企业投进去,这叫掐尖逻辑。

 

这个掐尖逻辑的前提是所有的赛道是垂直的或者说是桶状的,赛道和赛道之间的边界相对比较清晰,围绕着垂直的赛道去做一个相对有约束边界的研究。

 

但是未来,随着智能化能力、数字化能力的泛化,未来可能不是按赛道来分,可能是按照要素或者模型来分。

 

假如一个生产企业,可能有提供原材料的、有做供应链服务,有提供生产设备的,有提供资金的,也有提供数字化运营化能力的。传统的逻辑是都集中在一个企业里来做,未来可能会分化、会解耦,投设备的就投设备,投供应链的就投供应链,投数字化运营能力的就投数字化运营能力,投资金就投资金,大家把各个要素能力整合在一起,去完成一个产业链的布局。在这个过程当中,起到引领作用的就是这种数字化、智能化的能力。

 

因此,未来做这种数字化加智能化产业运营平台会是最有价值的,因为所有的产业的KNOW-HOW、数据、模型、智能化的能力都会在这个平台上,而且这个平台会脱离于机器设备、原材料、物料、资金而存在。所以未来与其投一个软件的工具,不如投一个运营级的平台、数字化的平台。

 

那种最终能交付结果的企业,是值得投资的。所以运营平台其实也是一个结果导向的投资逻辑,会是有价值的,而那些工具导向的企业慢慢就会边缘化。

 

大家可以看到,大模型其实也从工具导向变成了结果导向,直接生成一个结果。而结果的生成实际上是要形成一个长链的逻辑,而且还要整合很多的数据要素等等。所以我觉得未来的企业或者是说真正有价值的企业,会越来越多的提供一个整合的智能结果的交付,这是值得投资的。

 

大模型/AIGC和其它创新投资热点的关系,如和元宇宙的关系?是不是AIGC来了,元宇宙就凉了?

 

王湘云:元宇宙未来大规模的发展,应该在十年、十五年以后。正是因为GPT的到来,可以把元宇宙产业规模化的时代提前至少一半的时间。

 

人工智能实际上是元宇宙时代非常底层的能力。元宇宙以前发展缓慢,大家总认为是硬件不成熟的原因,但我觉得实际上更重要的原因是内容生成的成本太高,很多内容都需要靠程序员写代码实现,很难规模化和普及化。

 

元宇宙为什么都用在品牌营销的场景,其实用的是marketing的经费。但是真正未来要用到生产场景和运营场景,就一定要足够低的成本来创建内容,GPT恰恰解决了这一点。而且多模态实现了任何元宇宙平台非常自然的交互,人可以用语言文本,生成图片、3D内容等等。

 

此外,未来元宇宙时代的生产协作关系有可能会发生本质性的变化。元宇宙很多时候是用在去中心化的场景,而这个去中心化的平台未来在元宇宙平台里,能更好地生成内容,可以相互协作,协作之后还可以分享收益。也就是说,生产力的问题突破了,生产关系的问题也能够突破。元宇宙和GPT是互相拉动、互相支撑的关系。   

 

每个人如何利用大模型时代的机遇,化解大模型时代的冲击?包括教育的方式、工作协作的方式需要哪些变革?哪些是我们每个人可以从自身,从现在做起的?

 

李京梅:从整个社会来看,有一些岗位会消失,一些纯体力劳动或者重复性比较机械性的工作,被一些自动化AI去取代,这是很正常的事情。一定会有新的岗位来产生。淘汰了一些岗位,但一定会衍生出新的岗位。即便没有人工智能、没有大模型,它其实也是在升级换代,而且生产力效率一定会提升。

 

从个人来讲,要从现在做起,要学习,要与时俱进,保持积极的心态来应对变化。

 

张晓璐:在人的教育方面,前期阶段会更加重视基础能力的积累,积累到一定程度以后,在真正垂直领域的深探方面,大模型的涌现会起到非常重要的作用。

 

很多人用GPT提问问题,它给出的答案会有很多置信度比较低或者随意生成的部分,那就需要我们要有一个判断,再用搜索引擎或者其他的方式去找相关的文件的支持,有一些迭代,更好地把工作助手用起来。

 

王湘云:站在一个更高的视角,我觉得可以用两个词,平民化和平均化来定义——接受智能能力支持的门槛大大降低,因为门槛降低,使得每个人可能接触这些能力的机会提高,最后就会带来平均化。

 

在这种情况下,我觉得未来的教育第一是多模态的教育,比如可以用图形化的工具来解释微积分的原理,让门槛很高的知识更好更容易地得到理解和体验。第二个是仿真式的教育,因为很容易生成图片、视频、3D模型也好,未来制作教材会更加简单,学生可以进行仿真式体验。第三是对抗式的教育,未来或许会有一个智能学习助理进行互动,在互动过程中,哪怕出现一些错误,也会让学生从错误中得到学习。

 

未来人类大量的时间都在和机器打交道,需要去操控机器形成生产力,元宇宙的经济或者一些真正意义上的虚拟经济、创意经济等等,会在我们生活当中占的比重越来越高,大家将怎么样去适应这种变化呢?

 

我认为去中心化的协作会是一个解决方案。有了生成式的人工智能以后,它会倒逼生产协作方式发生改变,形成一种去中心化的模型。如果不去快速适应,可能就会落伍。

 

从个人的角度来讲,第一是认知,每个人都是宇宙很渺小的一分子,要认知规律、适应规律,外部的世界已经改变;第二,要有一种适应的心态,要享受人工智能给我们的助力。 

 

阅读原文:https://mp.weixin.qq.com/s/_T-lBqKZV6sSx8eHL7s19A

推荐新闻