智能体的浪潮正在改写AI产业的主导逻辑。
在过去的这一年里,智能体从内容创作转向了任务执行领域,这一转变不仅开辟了大型模型能力的新途径,同时也吸引了独立模型制造商和互联网巨头纷纷加入竞争,将其视为布局的新焦点。
在这场变革之中,大型模型制造商正面临一道棘手的抉择:是维持原有角色,继续充当基础服务的供应方,退守至底层?抑或是选择攀登高峰,打造自己的平台,直接切入应用层面?在商业化困境与技术发展道路的双重压力下,究竟哪些参与者能够继续留在竞争的舞台上?
近期,《虎嗅·AI无悖论》节目特地邀请了智谱公司高级商业副总裁、曾担任字节跳动飞书&Lark全球首席商业官的吴玮杰,还有企业知识开源计划创始人、前波士顿咨询Platinion董事总经理及前IBM咨询全球合伙人陈果,共同参与了一场深入讨论。他们针对智能体技术带来的冲击,分享了模型厂商在战略布局上的最新动态,并对行业进行了深刻的思考。
本期主持人为资深媒体人、热AInext主理人陈庆春。
以下是交流实录,有删编:
智能体是什么,谁在制造?
主持人:那么,什么是智能体(Agent)?它与我们所提到的大模型之间又存在着怎样的联系呢?
吴玮杰表示,他将大型模型比喻为图书馆。当前众多聊天应用,更像是图书管理员。一旦接收到用户的指令,它们便会在图书馆中检索各类书籍,并给出相应的回应。
然而,如今的智能体更像是项目经理或项目的帮手——它依照我设定的目标,前往图书馆搜集相关资料,并据此执行具体操作,或是生产出相应的成果。
陈果指出,智能体本质上是一种智能系统,它能够感知周围环境,进行判断,并基于这些判断采取行动,最终目的是为了达成既定目标。
智能体在2023年初迎来了真正的繁荣,这一现象的背景是2022年底GPT等大型模型的迅猛发展。起初,这些大模型主要用于文本生成,随后其应用范围逐渐扩大至图像、音频等“生成式AI”领域。更进一步,人们开始探索一个新问题:既然能够生成内容,那么是否也能够“生成并执行动作”?这一思考将我们引向了智能体的研究领域。
简言之,由大模型驱动的“智能体”标志着人工智能从“生成内容”阶段迈向了“执行任务”的新阶段。
主持人:那现在是谁在制造智能体?是专业开发者的专利吗?
吴玮杰指出,目前任何人都有能力创造智能体。这情形与几年前“每个人都能成为产品经理”的流行观点颇为相似。
对于一般用户和初学者开发者而言,智能体就如同“美图秀秀”这样的便捷工具——操作简便、趣味性强,适用于制作网页、聊天机器人等基础应用场景。
对于大型模型企业或互联网巨头,智能体更类似于“Photoshop”——适用于深入的业务场景,模型企业能够将智能体的某些功能“融入”到模型之中;而互联网企业则擅长将用户的使用习惯与入口生态相结合,以实现产品的实际应用。
陈果提到,他的一个朋友从事创业项目,专注于推广“五分钟打造智能体”的教程,无论你是否有意愿学习,仅需五分钟,你就能成功制作出一个智能体。
主持人:陈总的观点令人深思,那么吴总,作为一家大模型厂商的负责人,对此有何看法?当前智能体的发展门槛显著降低,这对大模型厂商产生了怎样的影响?
吴玮杰表示,他更倾向于认为这对大型模型企业起到了积极的推动作用。随着大模型逐渐转变为基础设施,并且计算成本下降,它们才有可能真正被用户所采纳。
自然,这也引发了一个问题,那就是随着模型制造商向基础设施领域转型,参与其中的用户数量会逐渐减少,这种情况在预料之中。即便缺少类似deepseek这样的开源模型,其淘汰的命运也是不可避免的,唯一的区别可能只是时间的早晚而已。
今日,位居首位的模型制造商,特别是那些专注于B端和G端市场的,其商业化策略已不再局限于“供应一个模型”,而是向更高层次的MaaS平台和智能体平台拓展,并能够提供一系列完整、可执行的解决方案。
这种技术的更新换代所带来的“能力交替提升”的竞争态势,实际上对第一梯队中的所有参与者都是有益的。
主持人:那第二梯队就不存在了吗?
吴玮杰表示,这个问题提得相当不错。实际上,自2024年末起,一个显著的变化是众多互联网巨头纷纷加入竞争。与此同时,早期的“六小虎”企业大多正在进行转型,并逐步呈现出分化的趋势,它们分别专注于国内消费者端的应用、特定行业的应用以及海外市场的拓展。
这个问题,若追溯至SaaS的早期阶段,情形亦然。当前,互联网巨头在SaaS领域主要聚焦于钉钉、飞书、腾讯会议等工具型应用的开发,然而这并不妨碍市场上存在众多专注于特定垂直行业的深度SaaS企业。
陈果表示,在基础模型领域,不存在第二梯队。大型模型构成了基础架构,其发展轨迹与云计算初期的发展模式相似。
起初众多企业纷纷涉足云计算领域,然而最终能够持续存活的却寥寥无几,不超过五家。这主要是因为在基础设施层面,竞争呈现出同质化、高投入、成本竞争的特点,最终往往导致行业巨头垄断市场。
人工智能领域亦是如此,其最根本的构成要素是计算能力和图形处理器;目前,全球市场中的80%份额已被英伟达所掌握;而向上延伸至基础的大规模模型层面,从长远视角来看,仅有极少数企业能够凭借其深厚的技术实力和丰富的资源储备得以留存。
主持人:那是不是意味着除了头部厂商,其他都没有机会了?
陈果表示,并非如此。随着层级提升,逐渐接近用户端,玩家数量随之增加,这是因为用户的需求错综复杂,应用场景亦丰富多彩;同时,高层的应用领域宽广,能够充分满足不同定位的需求。
因此,在大型模型之上的若干“层级”构成了创业和实现差异化竞争的领域:首先,是模型微调层面(例如小规模模型、二次训练、蒸馏技术等),这一领域将吸引部分专注于特定场景的技术公司参与;其次,是智能体构建层面,它涉及针对不同行业和流程场景来打造智能体,这个领域最有可能呈现出多样化的创新局面。
主持人:吴总目前作为领先的大模型制造商,是否已经为人类做出了最根本的奉献?随后,他是否会逐渐淡出历史舞台,转而以新的角色出现?
吴玮杰:我觉得我们还在舞台中央。
未来模型市场中,一类是以互联网巨头企业为先锋的,它们构建了独有的生态系统,拥有特定的应用领域,长期保持优越的市场地位;另一类则是专注于国内市场,以服务企业客户为主、兼顾个人消费者需求的独立模型生产企业,为众多企业量身定制差异化的解决方案。
我完全赞同陈总的观点,对于大型模型而言,若其定位更偏向基础设施领域,那么赢家将独占鳌头。首先,位居第一、第二的企业日子过得相当惬意;而第三名企业则过得较为艰辛;至于第四、第五名,他们每天都在担忧自己能否继续生存下去。
中国市场与海外市场在多个方面存在显著差异,无论是SaaS时代,抑或是当前的模型时代,国外市场推广的众多产品均采用了MCP标准化的接口。相较之下,国内市场中的相关生态系统尚未实现全面融合,这一状况为某些特定企业创造了机遇。
技术与巨头冲击下,大模型厂家走向分野
主持人提到,创业企业在资源方面可能遭遇更大挑战,那么,现在这些互联网巨头是否会将压力传导至你们?它们是否在争夺你们的业务呢?
吴玮杰表示,这个问题提得相当不错。实际上,在今天的市场上,出现了一个引人注目的现象。那就是,许多针对B端和G端的项目在招投标过程中,常常难以召集到三家以上的竞标者。这主要是因为客户对项目的要求越来越苛刻。
互联网巨头实际上从事的是较为通用的模式,这可以带来较为轻松的收益。借助API的调用,它们可以在自己的生态系统中推广云计算与智能一体化的服务——推广大型模型的真正目的是为了促进云计算业务,虽然大型模型可能会带来一些亏损,但可以借此机会销售一些算力资源,从而弥补亏损。
陈果表示,她完全赞同吴总之前的观点,去年多数人都在追求跑分竞赛,就如同过去的手机和摄像头性能测试那样。然而,当这种追求达到某个阶段,便会出现瓶颈。
你做到95分之后,边际效率就开始走平了。
吴玮杰表示,确实,在23年和24年的上半年,这种现象尤为突出,许多模型公司纷纷投身于刷榜热潮,这种行为实属异常荒谬。我们甚至曾用一句话来概括这一现象,那就是道德的底线直接决定了你排名的高度。
那时,各式各样的排行榜层出不穷,它们全都是公开的数据集合,人们可以根据需要对这些数据进行处理。众多模型公司中,不少都设有专门的刷榜团队,他们的职责就是解决排行榜上的排名问题。
越关注榜单其实是客户对模型的认知还处于一个比较早期的阶段。
主持人:在之前的讨论中,两位嘉宾探讨了互联网巨头对B端市场的影响,那么对于C端市场,这些大厂带来的冲击是否会更为显著呢?
吴玮杰表示,大型企业凭借入口优势,自然而然地吸引了大量C端用户。目前,部分大厂正利用其垄断地位,禁止其他竞争对手在其平台进行投放活动,仅允许推广自家的产品。这种情况对整个C端应用场景构成了巨大挑战。由于它们拥有丰富的语料库,因此强者愈发强大。
主持人询问:你们是否将C端产品视为核心产品进行重点开发,抑或将其作为实现商业盈利的渠道之一?
吴玮杰指出,在商业变现方面,利用面向消费者的聊天工具实现盈利颇具挑战。实际上,这种情况并不局限于智谱,全球范围内,通过聊天或订阅模式实现盈利同样困难重重。近期,百度也推出了全面免费的服务。
主持人提到,面对如此沉重的压力,像Manus这样的厂家,它们既没有现成的模型基础,又无法直接面向企业用户提供服务,这样的纯智能体生产商所承受的压力,无疑会更加显著。
吴玮杰认为,这类厂商的相当一部分收入源自海外市场的调用。这是因为海外市场相对成熟,商业环境更为发达,消费者更愿意为此支付费用。
主持人询问:其他投身智能体创业的企业,能否将这种在海外成功的商业模式进行复制?
吴玮杰表示,目前很难断言有任何一种商业模式能够被复制。实际上,当我们审视大模型应用的相关排行榜时,会发现每半年就有大约一半的知名企业从榜单中消失。这种现象在技术快速更新的过程中是不可避免的一个结果。
主持人提问:在智能体这一发展阶段,智能体难道不能孕育出属于自己的创业企业吗?
吴玮杰表示,情况并非一成不变。观察到的现象是,模型的功能与具体应用领域正逐渐分离。
在今日的模型中,我们将看到MaaS层和智能体平台等中间层的存在,其目的是引导客户与用户将注意力集中在更高层次的应用上。
在某些特定情境中,deepseek表现尚可,而在其他一些场合,智谱的表现明显优于其他竞争者,而在某些领域,OpenAI可能依然占据领先地位。客户可借助上述MaaS平台,挑选并调用不同的模型功能。因此,预计仍将涌现出一些业内表现优异的智能体企业。
陈果补充道,这实际上是对模型进行编排的过程。所谓智能体系统,即一个大智能体来领导一个小智能体。其核心在于,你所设计的是面向任务的智能体,还是面向流程的智能体?以客服智能体为例,除了接听电话,还包括众多其他环节,这其中蕴藏着提供综合服务的技术跑道和新机遇。
主持人提出疑问:目前,大模型技术已衍生出一些在聊天机器人中可直接点击购买的原生智能体,这对大型模型制造商而言,是否有助于实现商业价值的转化?
吴玮杰指出,智能体的问世显著提升了大型模型中tokens的使用频率,然而,截至目前,我国大多数大模型制造商并未能由此实现丰厚的利润回报。
陈果指出,全球范围内的大型模型企业尚未摸索出盈利之道,特别是在基础模型营业收入方面。实际上,全球大型模型所创造的收入中,有70%落入GPU制造商手中,另外30%则被算力供应商瓜分,目前似乎尚无企业能够实现盈利。
吴玮杰表示,智能体的商业价值实现方式,对于我们的业务而言,仅仅是众多变现途径之一;此外,我们还将协助其他国度培养具有自主知识产权的大型模型。
主持人提问:针对那些规模较大的模型制造商,他们是否能够利用智能体的这一契机来实现自身的业务转型?
吴玮杰提到,他对这个问题进行了深思熟虑。对于2023和2024年的“几条虎”,他们已经放弃了基座模型的选择,转而全面投入医疗和教育领域。那么,他们是否能在另一条道路上取得成功呢?我认为这无疑是一项极具挑战的任务。
我们之前提到基础模型位于底层,而当大家选择不同的赛道时,实际上是在从事更偏向应用层的工作。然而,这两类公司在人才需求画像和基础能力要求上存在差异。在一条赛道上遇到难题时,转战另一条赛道仍可能遭遇类似问题,甚至可能更加棘手。这是因为在此阶段,你缺乏对行业的深入洞察。
因此,我认为,即便是一家模型制造商今日转向从事行业模型开发,其优势未必能超越那些曾在此领域为医疗企业提供服务、拥有SaaS或软件背景的公司。
主持人:正如我们最初讨论的那样,大型模型制造商要么跻身前列,要么面临被市场淘汰的命运。
吴玮杰:这是一个比较悲伤的故事,但这就是现实的故事。
智能体重构企业系统与入口
主持人提到,众多行业巨头已采纳MCP协议,这或许已成为广泛认可的通行规范了吧?
吴玮杰:怎么说呢,我觉得这是个被动式的响应。
在早期阶段,众多平台的心态普遍如同自家花园中种植自家蔬菜,这些蔬菜最终由自家收割。
陈果提到,以淘宝和微信为例,大家应该清楚它们并未实现互联互通,因此,无法将链接直接复制到另一个平台。
我认为是否属于联通范畴,还需看具体应用情况。MCP(模型上下文协议)并非智能体间通信的协议,而是用于模型与周围数据进行交互的协议。相较于MCP,它更侧重于底层技术;而A to A则更倾向于应用层面。MCP的逻辑本质上相当于一部电话簿,它具备众多接口,例如,一个企业级软件中,涉及订单、物料、客户和供应商等多个信息接口。这些接口的数量可能是十个,也可能是上百个,而且接口的深度和广度也有所不同。
根本性的问题在于企业应用系统的构建。在SaaS盛行的当下,流传着一种说法,即一家硅谷企业可能会使用大约一百种SaaS服务,每个细微环节都采用一种,要想让业务顺利运行,这些系统资源必须实现互联互通,这样便会自然而然地构建起一个生态系统。而在中国,所有厂商都渴望将客户的生意全部揽入怀中。
另一个因素在于客户自身的需求存在缺陷。一方面,他们倾向于依赖大型厂商提供全面解决方案;另一方面,一些大型公司选择自行处理,这导致了企业内部数字化进程的断裂以及大厂商的垄断,使得不同企业之间缺乏交流与合作。
主持人:目前我们正处于二次起跑阶段,智能体难道不是解决企业系统之间互联互通问题的有效途径吗?
陈果表示,系统间的互联互通与智能体系的形成并无必然联系。智能体仅仅是软件的一种新型形态,而软件行业及企业的应用环境本就如此,并非智能体的出现导致了变化。
智能体若要被称为智能体,必须具备工具和适宜的环境。智能体仅凭思维判断,决定要在ERP系统中创建订单或处理账目,反复进行账目处理或订单创建。智能体在企业的关键信息系统中运行,换言之,智能体就像是车辆,而ERP系统则是车辆行驶的道路。当你拥有了大脑,就如同拥有了车辆,但若没有道路,车辆又将在何处行驶呢?
企业如果连ERP都没有用好,不可能用智能体的。
主持人表示,在当前AI智能体的时代背景下,我国尚未形成普遍适用的协议,似乎没有一种广泛认可的标准能让智能体之间进行互联互通、相互调用,而服务器与服务器之间依旧处于隔离状态。对此,我相信吴总持有不同意见。
吴玮杰提到,近期在一场高峰论坛上,有人向他提出了类似的问题。面对这一提问,他发表了一则言论,或许在情商方面略显不足。他直言,当在场的所有45岁以上的首席技术官们相继退休之际,他认为这样的时代终将到来。
主持人提到,近期山姆奥特曼发表了一则言论,引起了广泛的共鸣,他提出智能体未来将成为操作系统,对此您有何见解?
陈果:他们说的都对,但那是2050年的事情。
吴玮杰表示,他在此问题上持有与众不同的看法。他提到,如今我们观察到的智能体,已经呈现出一定程度的入口特征。
第一类涉及类似OpenAI的GPT,以及智谱的AutoGLM等原生大型模型,它们作为入口,负责执行和操作任务。
这类APP属于互联网巨头所拥有的综合性应用,例如微信和支付宝中嵌入的其他服务功能。
此外,一种新兴的接入方式便是操作系统与智能设备的融合。部分企业专注于耳机的研发,另一些则致力于眼镜的生产,还有一些在打造智能手机,实际上,这些行为都旨在争夺接入的先机。
智能体若提升至操作系统核心地位,便能在不依赖APP的情况下,跨越众多应用场景进行操作。比如,我可直接向操作系统下达指令,请求预订一张从上海至北京的航班。对于智能体来说,它并不关心你使用了何种应用程序,而是会在众多应用中筛选出最经济的机票选项,并为你完成跳转。
在这种情形下,现有的商业生态系统将发生变革,那么开屏广告的售卖方式将如何调整?竞争态势是否会转变为后端供应链的较量,而非仅仅是前端入口的竞争呢?
陈果提到,我们需要从信息系统的基本原理出发来考虑。虽然我们刚才讨论的是预订机票的话题,但全球范围内的各家航空公司都必须拥有一个共同的机票信息管理系统。
今日,无论是面向企业的高阶系统还是面向消费者的系统,它们之间的一大区别在于对数据合规性的严格要求,数据需持续保存,信息必须能够追溯查询。
然而,现今的这些大型模型采用的是连接主义的方法,它们的核心是神经网络。因此,这些模型本身就带有一种根本性的缺陷,那就是它们永远无法被解释,也无法被预测。
因此,若企业打算利用人工智能打造智能体,它们需专注于那些对可预测性和可追溯性要求相对较低的任务。
从信息系统理论的角度来看,智能体被视为行动系统,而在业务流程和人机交互层面,它或许会引发范式上的转变;然而,在更基础的层面——即涉及企业核心数据、也就是记录系统这一层面——至少就目前而言,我并未观察到任何范式上的变革。
吴玮杰:我挑战一下果总,我觉得这件事儿是有可能会被解决的。
与十年前全球制造业智能化浪潮中出现的情形相仿,那时出现了两条技术路线。其一,美国提出了“工业互联网”的概念,它并不改变现有的系统,而是通过附加智能模块的方式来实现智能化,打个形象的比喻,就如同在传统的水表上安装一个摄像头,从而能够远程读取数据。而另一条路径,则是由欧洲引领的“工业4.0”,它直接将水表替换为智能化的版本。
现今众多企业运用智能体技术,依旧停留在“给旧式水表装上摄像头”的阶段——借助智能体在ERP系统中轻点下单按键,操作表格,仿佛一个AI版的按键助手。我清楚接下来的步骤,便指挥它去完成。
在大模型时代,我们或许会遭遇一种全新的模式——这种模式并非依托于传统的规则驱动引擎。
随着数据量的不断增加,大模型或许能够通过某种途径,甚至通过持续的更新迭代,发现一套并非完全依赖“先执行1,接着执行2,然后执行3,最后执行4”这一既定规则的算法机制。
在此过程中,大模型可能仍旧难以解释、难以预测,然而,其正逐步向揭示事物本质的方向迈进。
企业对AI的ROI误区
陈总向众多企业进行了咨询,您也提到了企业对于需求的积极性并不高涨。他们究竟是基于何种考量?难道是认为这种需求并无显著成效吗?
陈果提到,去年有一家制造业巨头,是我国自主构建GPU领域的重要企业之一。他们购置了一千台GPU,投入了数十亿元资金,搭建了自己的算力平台,并部署了多种大型模型。
尽管投入了如此庞大的计算能力,他真正发挥生产力的行为,却仅仅是绘制广告图片和撰写广告文案。
我向他询问,为何不采用智能客服系统,他回应称这涉及诸多法律合规问题,例如车辆损坏后的维修流程?若消费者遵照AI的指示自行修理,一旦出现问题,责任归属将成疑。然而,若派遣人工进行检修,客服人员数量却不会有所减少。
追求B目标需要盈利,然而遗憾的是,我们在企业价值阐述方面一直表现得不够突出。
吴玮杰认为,有两个方面会对客户对该事件的成败评价产生重要影响。
首先,需要确认这位客户是否已经找到了今日模型能力与业务价值之间的最佳契合点。
第二是相关的负责人是否有合理的预期。
国内某知名企业采纳了我们最新研发的模型,并在此基础上进行了一系列微调,旨在打造一个针对特定行业的模型。然而,大约经过4至5个月的运行,随着我们基础模型性能的增强,该企业主发现,经过微调的模型性能反而不如经过性能提升的基础模型。因此,企业主向我咨询,从这一角度来看,这个项目是否已经宣告失败?
这是一个相当典型的话题,我个人认为这确实是一个成功的案例。之所以这样说,是因为在项目实施过程中,我们提供的模型服务助力该业务赢得了5至6个月的领先优势。关键在于,我们需要考虑是否需要这5至6个月的领先优势。
主持人:在为企业提供服务的过程中,相较于去年,今年是否察觉到了显著的差异?是否观察到对人工智能技术的需求有了显著增强?
吴玮杰指出,我们可以清晰地察觉到,当前企业的需求正迅速聚焦到一个以价值为核心的时代。
自24年下半年起至今,我们观察到客户愈发关注你所能带来的商业效益,正如陈总所言,即衡量投资回报率。对于如今的上市公司而言,若想增强市场对其的信任,并非仅仅通过宣称自己引入了一个模型,而是需要确立一条清晰的路径,明确模型将带来何种价值,并且这种价值需具备一个相对明确的实现途径,资本市场才会对其产生一定的认可。
主持人提问:是否有可能,由于企业对人工智能的迫切需求,这种需求能够促使企业着手重构其数字化体系?
吴玮杰认为,当前企业需求呈现出多样化特点。其中一类需求是追求简单直接的降低成本和提升效率。这类需求明确要求在特定时间内实现投资回报,以及替换一定数量的人员编制。特别是在智能客服等特定场景中,这种需求表现得尤为突出。
主持人:就是要有明确的ROI?
吴玮杰表示认同,确实存在这样一类。而另一类则是创造全新的产品。原本看似无法实现,但随着大模型的问世,如今这一目标得以实现。例如,在汽车行业中,智能座舱和多意图识别功能的回答。
将此类需求统称为POC,即我的愿景是美好的,却不确定模型能否实现。此类需求普遍存在一个共性,即客户的预算通常不超过一百万。人们常将其视作试验田,设定了极高的目标,然而最终执行结果,往往与预期存在一定差距。
陈果提到,她与一家我国市值位居首位的制造型企业进行了交流,该公司曾试图与国内顶尖的科技企业合作,共同推进工业视觉领域的发展。
只是完成了初步验证后,他们便自行展开了工作,原因在于对于他们所在的企业而言,技术属于核心机密,他们决不允许任何厂商介入,若厂商参与其机器学习项目,实则等同于将他们的技术秘密带走。
因此,最初为他服务的那个厂商,仅收获了名声,稍后获得的一点项目经费,随后便无其他所得。这表明,若厂商的创新不能成为一种社会化的机制,它们很可能会成为先驱中的牺牲者。
主持人询问:对于企业而言,智能体在哪些具体的应用环境中实施更为适宜?
吴玮杰提到,评估一家企业在AI领域的竞争力,可以从多个角度考量。首先,企业选用的基座模型类型至关重要。其次,企业的组织能力亦不容忽视,例如,像智谱这类公司可能需进行大量预训练,并配备众多指令工程师;而另一些企业则更专注于应用开发,因此更需产品经理的参与,算法工程师的需求相对较低。最后,企业所拥有的数据资产也是衡量其竞争力的关键因素之一。第四,它有哪些应用场景。
以数据资产为例,若在本次访谈中,周围突然播放音乐,我们可能会将其视为干扰,但若我独自在家中卧床聆听,这音乐便不再成为噪音。由此可见,数据资产与用户的具体情境紧密相连。当你的资产在特定场景中具有价值时,它便能为企业提供服务。因此,我们今天提出,企业应更加注重其应用领域,不论数据资产是否经过清洗成为高质量数据,剩余的部分实际上都能借助不断发展的技术手段进行提取,进而实现能力的提升。针对您刚才提出的问题,即企业应从哪个场景入手最为适宜,实际上并没有一个确切的答案。
主持人:所以没有相对通用的场景?
吴玮杰表示:我目前尚未形成一套普遍适用的规则。然而,存在一个颇为引人入胜的现象。
若此大型模型的选择源自IT团队,那么多数情况下,人们会从智能客服或知识库着手,因为在这两类应用中,失败的风险相对较低;它们的区别仅在于准确率的高低,可能是85%、87%或是91%,从一名普通员工的角度来看,这样的选择安全性最高。
企业主通常不会基于这些因素作出决策,因为对他们来说,构建一个行政问答知识库仅能降低成本并提高效率,其带来的价值相对有限;他们更倾向于专注于业务本身。
因此,您所询问的推荐起点,需视他对于构建大模型的目的是否明确而定。
主持人:最后一个问题,两位觉得智能体它会彻底颠覆哪些行业?
吴玮杰指出,首先发生改变的领域是软件行业,特别是那些以代码模型为核心、侧重于前端工程化的企业。例如,原本需要工程师五天完成的工作,现在借助代码模型仅需三天即可完成,剩余两天则可以用来休息或处理其他事务。
随着推理模型的不断进步,陈总之前所涉足的咨询领域亦将面临变革。
若向大型模型提出请求,对其说明需对其分析北京朝阳区及海淀区在过去一年中在大模型领域涌现出的企业,那么模型便能生成一份约1至2万字的深度价值分析报告。
陈果提到,这里存在一个冲突,我尚未完全理顺,有兴趣的朋友们不妨一同思考探讨。
我坚信数据信息的搜集与解析任务有被取代的可能,然而,就我这类合伙人而言,却是不存在被替代之虞的。这其中的原因何在呢?首先,咨询工作并不仅仅是撰写文章那么简单,它还涉及到人与人之间直接的面对面交流;其次,这种交流还能传递出情感上的价值。
年纪已长,经验丰富,企业领导乐意与我交流,这其中的冲突点究竟在何处?倘若将孩子们都替换成机器,他们未经过锻炼,又怎能成为合伙人呢?在我看来,人工智能在社会逻辑层面存在诸多矛盾之处。
主持人:但人是不是可以跟机器人学习,以后机器人可以教人?
陈果提出疑问:当人类学会了机器的技能,是否就会成为老板?难道机器不是在取代人类的工作吗?我甚至已经失去了工作,你为何还要给我学习的机会呢?
吴玮杰认为,在人工智能的发展历程中,我们可以获得一些启示。人工智能最初所从事的活动是下棋。而图灵测试本身,便是将人类与机器进行对弈,以检验人们是否能够察觉出对手是机器。
下棋中存在一种称为棋谱的规则体系,相当于其规则引擎。无论是学习围棋还是象棋,都需要掌握成千上万种各式各样的棋谱。然而,在AlphaGo击败李世石的那场著名比赛中,它仅用了一招,我们后来将其称为神之一手,因为这一招在所有棋谱中均未出现过。
在击败李世石之后,AlphaGo开始自我对弈,经过三天的激战,诞生了Alpha Master。随后,Alpha Master之间展开对决,经过21天的角逐,最终诞生了Alpha Zero。
机器的智商一旦超越人类,实际上我们便难以借助人类的规则引擎来对这一模型进行训练。
但这个就比话题比较大了,变成了硅基能否战胜碳基。
文章标题:智能体洗牌“六小虎”,模型厂商如何转型?
文章地址为https://www.huxiu.com/article/4528846.html,请点击链接查看详细内容。