当各家大模型厂商终于开始“卷”向应用层,首家发布、首家向公众开放的文心一言,先发优势终于开始体现。正如百度CEO李彦宏在5月31日“文心杯创业大赛”启动时所说,“在中国,更多开发者将会基于文心大模型来开发AI应用。”
(资料图片)
到了9月5日的云智大会上,李彦宏的愿景又再度升级:“我们希望创业者在文心大模型之上,可以做出AI时代的爆款应用。”
李彦宏的“爆款应用”底气何来?
文心一言面向公众放开的24小时内,回答了用户超过3342万个问题。这是文心一言正式问世半年后的数据,生成式AI的广阔前景,已经不言而喻。
文心杯之外,百度面向开发者推出AI Studio星河大模型社区、插件机制以及文心大模型“星河”共创生态计划。目前,已有500多家生态伙伴通过百度智能云千帆大模型平台使用各类大模型服务。
DemoDay的路演现场,陆玖商业评论发现,在最终获奖的创业团队中,不仅有AI加持的社交软件、二次元同人社区,还有同时面向商家与个人用户的销售决策助理和电商导购买手,精准覆盖了目前互联网行业的热门赛道和成熟赛道。
在文心一言的加持下,这些应用的交互都在很大程度上实现简化,交互也从原先的机器输入变成自然语言。用户使用门槛一旦降低,原先被认为“难做”、“有壁垒”的赛道,也因为大模型的底层加持,变得不再高不可攀。
整个过程中,百度的文心一言底座提供生态和算力支持,应用厂商根植其中发挥专业能力,打磨用户体验,最终实现商业化。
某种意义上说,这不仅是生成式AI时代的创业样本,同样也是百度这家老牌AI厂商新的时代机遇。
01
AI原生应用,为什么重要
李彦宏之所以一再强调应用层的机会,也不全是为了站台“文心杯”。因为与上一个互联网创业时代不同,如今的大模型创业,门槛太高。
这个门槛不仅仅指资金和算力。因为能力越强的大模型,通常要求更大的数据量,进行必要清洗之后,成为预训练的数据集。
但在移动互联网时代,原先散落在公域的信息数据,已经被APP隔绝成一个个孤岛,一家想获取另一家的数据,即便是合作,也不可能全面掌握。对于初创的大模型团队更是如此。
在国内,抢先发布大模型的厂商,如百度、三六零、阿里,都是在各自的领域(搜索、安全、电商)积累了丰富的中文语料与行业数据,生长出来的大模型,几乎也等同于移动互联网时代的手机操作系统(安卓、IOS)。
对于人才储备、资金储备、算力储备“三不足”的初创团队而言,想在大厂占优势的模型层进行追赶,显然已经不可能。但在强调专业能力的应用层,却是天然的主场。
譬如此次获得“文心杯”一等奖的ChatDOC,是一个基于文档智能的专业知识问答助手及阅读平台。
ChatDOC创始人林得苗告诉陆玖商业评论,与通用模型厂商相比,他们会针对特定的行业做整理好的文档库,譬如目前正在推进的金融行业法律法规库,就是行业合规人员的“刚需型”产品。
想要这种数据库发挥能力,需要非常细致的分类工作,这主要是保证回答问题时,限定在文档范围之内。
但如此细分的“体力活”场景,大厂“亲力亲为”显然不太egktmpr可能,这就是更专业的AI原生应用的“存在意义”。
更进一步说,生成式AI的模型厂商与应用团队,二者间更像是一种共生关系:在初始阶段,大模型厂商需要给创业团队提供算力、API接口、模型能力在内的各项支持;
应用团队基于自己的专业能力和行业理解,对通用化的模型能力进行更专业的调试,最终实现商业化。但在整个过程中,仍然需要生态融合、投资方引入等必要环节。
“文心杯”大概就是这样一个场景,通过项目比赛,底层模型厂商、应用项目方和股权投资方齐聚一堂,让真正有前景的AI原生应用更快落地,更快商业化。
02
在集中路演Demo的间隙,陆玖商业评论集中走访了不同类型的数支团队。
从走访的结果来看,百度对于参赛的所有团队,提供的生态扶持是一视同仁的,但参赛团队在具体应用方式、应用程度上,存在较大差别。
譬如与AI结合的社交类app“麦小记”,由于主要产品形态以图文呈现。所以对于文心一言整体的应用,在用户端的感受更直接。
据“麦小记”产品负责人介绍,在用户个人内容发布的“记录”板块,用户可以用AI辅助生成内容,点击笔记下方的AI按钮之后,会直接调用文心一言的大多数功能,用户可以直接生成对应主题的文字和图片。
而在类微信朋友圈的“好友”和类豆瓣小组的“频道”板块,文心一言加持的AI机器人,则充当了版面管理员的角色,不仅可以自动筛选用户内容进行智能推荐,而且还有一定程度的社区治理权限。
麦小记的社群助手,是基于各类社群的具体场景,联手社群主进行数据训练,这使得其具有能以更贴合个性化需求的方式提供服务,这可以涌现出千群千面的社群助手,或者叫群主分身,这与上一代社群机器人有着本质的不同。
对比国外一些应用,譬如telegram的社群机器人,基于文心一言大模型基础训练的社群助手,其对中文语义的理解与表达,都有显著改善。
二次元同人创作社区“Genie AI”,对于文心一言的应用则有所不同。产品负责人告诉陆玖商业评论,目前Genie AI所涉及的“原神、星穹铁道”相关的同人创作,主要是基于其中的人气角色,进行对应单图、视觉小说、和漫画的相关二创。
爱好者们的创意各有千秋,但在多模态生成领域,并非所有用户都是天生的“提示词专家”。中间的提词优化过程,自然落到了平台头上。
产品负责人告诉陆玖商业评论,文心一言在实际表现中,已经与ChatGPT的体感相差无几,通过必要的“微调”,已经能够将用户输入的大多数自然语言,顺利转化为对应的二创内容。自然语言的跨模态转化,用户端感知可能有限,但却是整个项目的灵魂。
“Genie AI”目前的团队体量并不算大,纯后台研发只有3人。如果独立承担自然语言的全程优化与图像生成流程,在成本上显然不现实。
文心一言的接入,使得整体创业更为轻量化,可以让团队把主要精力放在产品优化和用户增长上——据创始人透露,Genie AI 在抖音和小红书公测仅仅4周,整体曝光量90w+。
除了图文相关创业领域的直接赋能,文心一言对于一些高精尖领域的研究,也有意想不到的效果。
譬如新材料发现平台幻量科技,就基于材料信息学,结合AI、计算物理、高通量实验等,融合跨领域数据,进行正向预测与反向设计,成功加速了各行业新材料研发的产业落地。
在材料学领域,将结果真正应用到产业领域,为企业带来成本节省、效率提升是关键。
CEO刘雨阳告诉陆玖商业评论,在研究者视角来看,原先需要通过代码和命令行驱动的实验进程和变量筛选,在文心一言的参与下,可以完全使用自然语言来进行。让整个过程更加高效。
在“实验语言”转变成自然语言之后,各类复合型人才将获益,对于有效实验变量的筛选不仅可以更快、更精准,整体实验的效率也会大大增加。
刘雨阳还提到,如果能借助文心一言这样的AI大模型排除无效变量,提高效率,加快实验进程,将产生更多对产业有实际帮助的成果。
03
百度的时代新机遇
从前述项目的细节就能发现,文心一言底座对于各个创业团队的“赋能”进程,实际上也是“百度系”AI应用,不断跑马圈地的缩影。
个中逻辑也不难理解:对于AI原生应用而言,底层模型就是类似“安卓”、“ios”这样的操作系统。各家大模型厂商在扶持自己的开发者群体时,自然会基于自家大模型进行对应扶持。
在模型深入应用、改造应用的同时,应用本身也“变成了模型厂商的形状”,团队也成了文心一言的客户。如果应用团队本身没有充分准备,很难贸然转投别家阵营。
正因如此,国产大模型竞争到应用层时,已经不再是资金与算力的竞争,而是对于优秀应用团队的竞争。谁对应用团队扶持的力度最大,谁就能在生成式AI时代获得话语权。
百度在这方面的需求自然是非常迫切的。原因不仅来源于移动互联网时代的“被迫缺位”——公司对于AI领域的长期投入固然“理想主义”,但同样也需要产业切实落地,把老赛道“重做一遍”的契机。
所以本次创业大赛中,同样也入围了专注电商和本地生活领域的AI原生应用团队。譬如专注AI电商导购买手的Buysmart.AI,在用户端输入需求,通过文心一言的模型能力加持,可以智能推荐对应需求的商品。
导购助手在用户购物进程中的作用,不仅替代了传统的电商广告和产品评测媒体,对于淘宝、百度等厂商的竞价排名广告体系,同样也是一种颠覆。
对于百度而言,这种方式虽然在传统业务“革自己的命”,但通过生成式AI做了一块更大的蛋糕。至于吃不吃,固然取决于公司整体决策,但在生成式AI的巨大产业前景面前,很难有不吃的理由。
更重要的意义在于,这些基于生成式AI的应用工具,实质上让已经固化的产业格局,提供了重新洗牌的可能。同一个电商赛道,原生AI应用的体验可能远胜于旧应用。
Buysmart.AI联合创始人邱运伟也认为,即便原来的电商巨头,会对此围追堵截、严防死守,但体量较小的原生应用团队可以跟新兴电商平台如百度电商,或者行业次强进行合作,用更好的用户体验和专业能力,为自己谋得一席之地。
作为底层模型厂商,百度也可以与应用团队的脚步一道,补全原先移动互联网时代“落下的课程”。真正用生成式AI“把所有行业重做一遍”。
只有这些革命性的AI原生应用越来越多,才会真正如百度CEO李彦宏所说,“越来越多的应用会建立在模型之上,整个生态系统将充满活力。”