「钱景无限」的Agent,究竟是谁的机会?

原文来源:硅基研究室

作者:白嘉嘉

图片来源:由无界 AI生成

近日,主打企业级Agent产品的AI创企斑头雁智能科技收获了近千万美元的A轮融资。

Agent有「钱景」在业界已是共识。《产业家》的一组数据显示,截止2023年11月,Agent赛道发生融资事件13起,总融资金额约735亿人民币,公司融资均值为56.54亿人民币。

而在大洋彼岸,据知名AI记者Matt Schlicht的统计,至少有100个项目在将Agent商业化,近10万名开发者正在构建Agent。

AI界迅速凝聚共识离不开大佬们的推波助澜。

从去年6月OpenAI应用研究主管Lilian Weng提出Agent是AI应用层的发展方向,到11月比尔·盖茨在博文中指出“谁能主宰个人助理Agent,那才是大事。因为你将永远不去搜索网站,不去生产力网站,不去亚马逊”,「大模型赋能千行百业」俨然已经升级成「Agent 赋能千行百业」。

近期由IDC、钉钉联合发布的《2024 AIGC应用层十大趋势》中同样强调:“AI Agent是大模型落地业务场景的主流形式”。

为什么Agent成为了科技圈的新共识?它的价值是什么?科技弄潮儿又在它身上玩出了什么花样?从蓝图到现实,Agent距离我们的生活还有多远?

将大模型应用于生产和生活的过程中,许多人都会碰到的一个问题是,不知道如何与这颗硅基大脑沟通。

对此,市面上甚至出现了许多教人使用大模型的课程。这些课程的重点,往往都围绕着那些咒语般繁琐的提示词展开。

而Agent与大模型及其衍生产品相比,最突出的特点就在于,它不需要用户输入精准的提示词(Prompt)。

放在和大模型交互当中,Agent相当于替用户给出了一系列精准的提示词。从用户的视角出发,Agent和大模型在体感上的差别在于,Agent是掌握了一整套工作、思维方式,能主动完成信息抓取、分析和实操的老员工,而大模型只是需要人为反复强调细节信息的新人。

将视角从用户切换到企业身上。

卷了近一年大模型研发后,业界普遍认识到两点。一是价格高昂的通用大模型在各行业中所能起到的助力有限。二是通用大模型很难打出差异,眼下各大厂商的产品在功能上都差不多。

因此,为了吸引用户,尤其是更加务实的企业用户为AI买单,必须把高成本、高门槛、泛用的大模型向小型、专业、便捷的方向发展。

用更通俗的话来说就是,大模型企业必须打造出一款便宜、上手门槛低,且能凸显出自身差异的产品级AI应用,才能在市场竞争中生存下来。

而Agent正是这轮商业逻辑转向的抓手。

与通用大模型的大力出奇迹不同,想要打造出「小而美」的Agent,背后的企业必须在研发之初就决定好应用的场景和领域。往往只有对某个行业足够了解,才能觉察到其中的痛点环节。

譬如,近期发布AI Agent平台AskXBOT的澜码科技,为企业提供文档检索、AI调用、数据查询、智能编程等基础能力。这个平台的亮点在于它将各种模型能力都集成、封装到了一款工作流设计器中,支持用户使用「拖拉拽」的方式操作,定制AI工作流。

在「工作流」上下功夫的灵感来源于周健此前在PRA(机器流程自动化)厂商弘玑Cyclone担任CTO的经验。

RPA已经初步证明了用「拖拉拽」组件构建自动化办公流程的市场需求,但周健发现,RPA的实操过程中,由于员工缺少专家的经验,人和系统之前仍然存在操作的真空,比如业务流程到底是怎样的——这块知识的「空隙」仍需要人力去填充。

AI Agent的出现恰好可以弥合空隙。通过一个个AI工作流的建立,Agent既可获得对业务的理解能力,同时可以可自主执行任务,还能随着企业知识库的不断更新同步迭代。

某种程度上,「Knowhow、技术并重」是做好Agent的前提,开头提到的斑头雁智能科技的创始人张毅身上也能看到类似的特质。

张毅是原钉钉副总裁,任职期间,他曾用8年时间带领团队陆续打造出钉钉考勤、审批、智能人事、日志、健康打卡等产品。此外,他还在阿里无线技术委员会、ToB产品委员会担任委员。

Agent之所以成为创业者新的淘金地,也很好理解。一方面,在「大炼模型」阶段,AI创企由于在算力和技术上处于劣势,往往很难和BAT这样的大厂进行竞争。另一方面,进入到Agent阶段之后,研发者对行业的理解以及专业数据库扮演起了更重要的角色,这恰恰是他们的优势所在。

Agent的落地形式有两种,一种是单体Agent,一种是群体Agent。

单体Agent的特点是以组件的形式嵌入传统产业链当中去,针对颗粒度非常细的场景做优化。

比如高瓴创投投资的语音转录平台Airgram,推出了销售场景下的会议Agent;成立于2021年的魔音智能的Agent,聚焦在私域运营和客服场景。而百度、滴滴、蓝凌等大中型厂商,则针对企业的费控、数据分析、沟通等具体工作环节,分别推出了Agent方案。

这种做法的优点在于嵌入性、稳定性强,不会给企业运行带来太多的动荡。

对大型企业来说,除了要考虑未来的发展趋势,维持当下的运行稳定同样重要。因此,技术提供商给出的解决方案必须是开箱即用,能够被快速整合到原先的运行体系中的产品。

这种方式也是业内的主流意见之一,360创始人周鸿祎就曾在公开场合中表达过,AI产品与传统产业结合的路径应该是最初以松耦合的方式嵌入业务链条,然后再随着企业的智能化发展不断向其他环节蔓延。

然而,并不是所有业务都可以被切分成孤立环节的,在这些业务中,直接打造一条Agent作业链会是更直接有效的解决方式,群体Agent也因此应运而生。

譬如,清华大学计算机科学与技术系副教授刘知远成立的面壁智能,就把软件开发平台ChatDev做成了一家只有Agent员工的软件开发公司。CEO Agent负责接收用户需求后,并把开发和交付任务分配给CTO、开发经理、产品经理、测试专员等Agent角色。

ChatDev平台本身也是一个群体Agent的经典案例。

虽然从形式上看,ChatDev只是一家开发AI聊天机器人的公司,但这些聊天机器人可以扮演各种专业角色并相互讨论,直至给出一份完整的解决方案,包括源代码、环境依赖和用户手册等等。

与单体Agent相比,群体Agent有望帮助企业迅速从无到有搭建起新的业务部门或直接兜售解决方案,并且,他们似乎具有一定的创造力。

火遍全球的群体Agent项目「斯坦福小镇」就是一个典型案例。创作者在沙盒世界中放置了25个Agent,他们有自己的初始设定,彼此用自然语言对话。结果这些Agent之间的交互出现了人类意料之外的变化:Agent们自己创办了派对,并且它们的人际关系变得更加复杂了。

就目前而言,除了少数几家公司实验性地推出了群体Agent,大多数企业的选择都是从单体Agent出发。

对小企业而言,单体Agent路线的技术、算力门槛更低,从研发到形成商业闭环的速度更快。

但另一方面,单体Agent的竞争力高度依赖研发者对行业的理解以及背后的数据支撑,如果专业程度不够深,没有用户买单继而形成数据飞轮,就很容易成为大象脚边的蚂蚁。

去年11月GPT Builder在OpenAI的首次开发者大会上亮相后,许多Agent创企陷入了深度焦虑。究其原因就是很多企业只是套壳了Agent概念,没有真正找到落地场景。

对大公司来说,由于旗下场景、算力、技术储备都足够丰富,在「All in AI」理念的推动下,已经在全流程推动AI替代或研发,单体Agent或群体Agent的路线选择对它们来说并不重要。

有百度内部人士对「硅基研究室」透露,从2023年年初开始,李彦宏就已经要求内部养成AI思维,工作时保持思考能否将原先的业务用AI来做。

另一方面,群体Agent本身就是单体Agent的组合,虽然涉及到各业务串联等问题,但在场景有限Agent开发逻辑中,完全可以谋定而后动。

在介绍Agent时,许多人都会用《钢铁侠》里的贾维斯举例子,电影里最能体现Agent超越传统意义上工具一幕,是史塔克每次去冒险之前,贾维斯都会询问他要不要给波兹(史塔克的妻子)打个电话。

而在现实生活中,我们接触到Agent最多的场景,可能是电话那头的AI客服。从这个角度来说,蓝图和现实的距离就是我在电话这头,你在电话那头。

之所以会有这样的落差也不难理解。最直观的原因就是,大模型的复杂推理能力不够强、延迟过高等问题抑制了Agent应用的真正成熟,这也是接下来业界工程优化和技术科研突破的方向。

但对大多数企业来说,更务实的着眼处是如何在现有的技术条件下,打造出真正能发挥生产力的Agent。

办公协同软件几乎是国内Agent生长最肥沃的一片土壤,从WPS到钉钉、飞书、企微,都上线了相应的AI应用。究其原因,这些平台本身就具备良好的API接口和插件体系,这使得将大模型集成到现有工具中变得更加容易。

换而言之,在办公协同领域,那些Knowhow已经被整理成了符合大家工作习惯的工具链,这条链条上锤子、扳手、等工具都准备好了。并且,这个行业本身的数据规模就颇可观,这是训练出高质量输出的Agent的基础。

文首提到的张毅在介绍斑头雁拳头产品BetterYeah AI时也强调了类似的逻辑。

BetterYeah AI的一大优势就是拥有整套自研RPA等超级自动化工具集,及Web Builder低代码平台,可为Agent提供手和脚,在更多场景里使用,并大幅降低开发成本。

常被业内人士提及的另一个关键词是调用Agent的成本。

虽然与大模型相比,Agent更贴近产业,也能让客户的每笔钱都花得更值,但不论是对客户还是对开发商,Agent带来的收益是否迈过了成本的门槛仍是未知数。

一个具体的例子是,斯坦福和谷歌联合研究的Agent世界「西部世界小镇」里,每个Agent的成本是20美元/时,比大多数人的时薪都要高。

算力是成本构成的大头,但并非所有企业都有能力深入到算法环节进行优化,因此在交付环节下苦功可能会是更优选。譬如,可以提供一站式AI开发平台,或提供封装好的Agent,帮助企业或单位以极低成本快速应用。

科大讯飞在推广校园AI应用时就曾展示过对应开发平台,教师只需要通过自然语言输入需求,平台便可自动生成应用。

最后,也是对买家影响最大的因素,是Agent的安全性和隐私性。

Agent商业化的基础在于捕捉到了用户的痛点环节,这也意味着这些环节往往能接触到企业关键数据或信息。一旦Agent被攻击,导致短暂停工或信息泄漏,就有可能造成用户和社会蒙受巨大损失。

眼下GPT Builer面临的一个问题就是,开发者发现第三者可以通过与GPT Builer的对话套出Agent的Prompt和上传数据,知识产权无法得到有效保障。

立足当下,Agent无疑是传统企业的又一次机会,得以绕过算力和技术的壁垒凭借经验再下一城。但同时也应该清晰地认识到,经验有时候也会成为束缚,仍需要对行业范式的改变保持警惕。

毕竟马车夫再怎么钻研给技术,也不可能跑得过汽车。

参考资料:

AI Agent,为什么是AIGC最后的杀手锏?| 腾讯研究院·

OpenAI打了个“响指”,AI Agent厂商重建护城河|36氪·

审视AI Agent:追捧、落地,和2024年的To B破局点 | 产业家

为什么OpenAI下一步是Agent? 关于Agent你需要知道的一切 | AI新智能

原钉钉副总裁创业杀入AI Agent赛道,获亿元融资 | 36氪

2分钟定制Agent,「澜码科技」发布企业级AI Agent平台AskXBOT | 36氪