AI大模型军备python竞赛已经打响,国内外大小科技公司你方唱罢我登场。
(资料图片仅供参考)
但有一个灵魂拷问——未来,技术之上的产品该是什么形态?
于是,产品经理和UI设计师们,纷纷担心起自己的前途——
毕竟ChatGPT几乎没什么产品设计,就征服了全世界。
只是一个简单甚至可以说简陋的网页,连OpenAI的CEO都承认这是个糟糕的产品,“根本就不是为易用设计的”。
如果看向那些率先整合AI能力的经典产品,就会发现……也都没什么变化。
搜索引擎、代码编辑器等等,都还是大家熟悉的样子,甚至连按钮、菜单都没多加几个。
AI绘画里最火的Midjourney呢?压根就不是个独立产品,而是借住在聊天软件Discord里。
和人聊天不受任何影响,想让AI画图就敲“/imagine”。
国内生产力工具里面行动最快的是钉钉,刚刚已宣布全面接入阿里巴巴通义千问大模型。国内首个走向智能化的生产力工具,就这样来了。
即便可能相较于微软前一阵发布的copilot概念片,可能还有差距。
不过从现场演示来看,无论是文档的内容生成能力,群聊、会议的摘要提取总结,还是对话或者拍照就能自动生成一个可直接使用的小程序,大模型对产品带来的巨大改变和惊喜,同样发android生在阿里千问大模型之于钉钉上。
但,新版钉钉表面看起来依然也是没什么大变化,AI能力全被收进这样一道斜杠“/”里。
为什么?
此前,英伟达CEO黄仁勋认为,AI迎来“iPhone时刻”,以此来强调AI行业已经到达了像iPhone横空出世时,为手机行业带来的革命性颠覆的时间点。
当ChatGPT发布插件功能时,很多人都联想到这就是AI的“应用商店”。
那么以斜杠为代表的新型人机交互方式,宣告着AI的“触摸屏时刻”。
为什么是一条“/”?
先来看看斜杠在不同场景下都能做到什么,又是如何发挥作用。
首先是最容易想到的文档,在指定位置敲上“/”紧跟所需的内容描述,就能召唤AI生成好内容。
原本是多人在线协作文档,从此增加了人机协作的新维度。人类只需要把握方向搭好骨架,AI来填充血肉。
另外虽然钉钉这次没有展示,但同样的功能用在邮件上想必也没什么问题。
如果说文档、邮件属于人与人之间的非同步沟通,在视频会议这种同步沟通场景上AI同样有用武之地。
实时生成多语字幕属于基本操作了,钉钉这次重点展示的功能是“智能摘要”:
在会议过程中按下“/”,获得一份对目前为止讨论内容的总结。
一方面,如有中途加入会议或暂离后又回来的成员,也可以不用打断会议进程,迅速了解情况。
另一方面,如果会议进行时间较长,也可以通过此功能对之前内容做整体回顾,及时跟上节奏。
当然,斜杠-输入文字,只是新型人机交互的其中一种表现形式,其内核在于将AI与工作流程的有机整合。
过去,当人们需要一段文字会去搜索或去问ChatgpT、需要一张图片会去打开PS又或者Midjourney。
钉钉想做的,是让人们不必打断当前工作流程,在适当的时间适当的地点,用最简单的动作按需调动AI能力。
比如当被拉入一个新群,经常遇到之前的消息太多看不过来。
此时AI就可以主动跳出来,提醒用户查看智能摘要,而不是手动去爬楼。
此时的交互是“顺手点击自动显示在消息流中的按钮”,而不是去寻找在固定位置的按钮。
即使抛开所有图形界面,靠语音依然能自由调动AI能力,所以接入阿里千问大模型的不光有钉钉,还有天猫精灵……
归根结底是这一波大语言模型带来的通用性,让人类不再需要去一堆菜单和按钮中找功能,甚至不需要知道都有什么功能——
只要有描述需求的地方,AI就会让功能自己找人。
对于为什么要发布一条“斜杠”,钉钉总裁叶军也给出这样的看法:
这里潜藏着一条逻辑,AIGC可能催生人机交互方式的大变化,可能以后不再需要功能、菜单、导航这些移动互联网下习以为常的方式。
钉钉并不是这场AI革命中走向极简的个例,从这段时间的各种产品发布、预告中都能观察到这样的趋势。
微软新版Office概念演示中,似乎因为有了Copilot的AI,顶部那一堆菜单栏还变清爽了不少。
另外OpenAI参与投资的“AI原生代码编辑器”Cursor,外观形态上也和传统编辑器没什么大的改变。
其实这个问题,OpenAI的CEO Sam Altman老早就开始了思考。
刚好在去年这个时候,GPT3.5模型已训练完成,但ChatGPT产品还没立项之时,他开始向广大网友征集“用自然语言告诉计算机你想要什么,然后计算机就去做”这种新人机交互界面的名字。
现在看来似乎他的选择就是“Chat”,但名字其实已经不再重要,重要的是新交互界面的本质已经确定:
告诉计算机你想要什么。
计算机在一定程度上回归到了它刚诞生时的样子,今天的“/”就等于昨天的命令提示符“>”。
AI也成为操作系统级别的存在。只不过这一次,人类不再需要学习系统命令,也不需要学习编程语言。
如同二进制被汇编语言取代,汇编语言又被高级编程语言取代,人与机器的交流方式越来越偏向人,机器越来越理解人。
终于到了这一刻,机器学会了人类的语言。所以“斜杠”,就是生成式AI带来的最初UI形态,也极有可能是最终极产品形态。
就像手机触摸屏刚出来时,人们不会知道它会很快干掉了主流的功能按键一样。
△网友在1984年的IBM计算机上跑ChatGPT客户端
想法就是创造力,人人都是AI应用的开发者
产品开发的时代正在发生巨大改变:有需求、会描述需求、有方法把需求告诉AI,AI就能自动执行任务。
套用GPT中的“T”——谷歌Transformer原论文标题Attention is All You Need的句式来说:
Need is all you need.
只要有需求,人人都是AI的应用开发者。
而开发AI应用,就是简单地向AI解释清楚你要干什么。
这份神奇的体验,在几个星期前还只有ChatGPT插件的开发者才能感受到。
而钉钉这样的生产力工具入场,代表每个人都可以把自己的工作流程定制成智能应用。毕竟有6亿用户都能用钉钉。
如上传手绘表格就秒变小程序。
在多轮对话中,还可轻松要求AI对应用做修改。
过去经常说AI算法落地难,主要就难在针对一个场景开发好后没法低成本迁移,而AI公司又没那么多人力精力去一个个了解各行各业的分散化场景,导致AI只能解决很小一部分问题。
通用大模型的能力+低门js槛的交互,让AI应用开发者变成天天接触这些场景的人们自己。
量子位智库把生成式AI带来的发展划分为三个时期:
首先是培育探索期,核心是底层算力基建和大模型等基座打造和完善。
接着就是应用蓬勃期,在基建和底座基础上,会有各种各样的应用来解决不同场景和细分垂直领域的需求,会是一个全新的生态级开发机遇。
最后在应用市场繁荣之后,就会进入整体加速期,把生成式AI带来的红利推向最高潮。
其中,最繁荣也最具生态空间的就是应用蓬勃期。量子位智库预测:从2025年开始,由于行业生态完善,应用层的蓬勃发展将带动AIGC产业年复合增长率超过70%,到2030年市场规模超过万亿。
而目前,AI发展链条里在大模型层面的竞速已经开始,但下游的产品和应用会如何,却还没给出更多尝试。
有意思的是,因为钉钉的出身和场景,可以得天独厚直接思考应用层的终极产品形态,以及能够率先给出样板间展示。
也是通过钉钉这次的斜杠发布,更能生动地展示了我国AIGC产业更大的机会为什么会出现在应用层。
关于底层基座和上层应用的关系,已经被一次次验证了,这次应该也不会例外:光拥有大模型或能调用大模型还不够,还需要与应用形成闭环生态,形成创新增长的飞轮。
所以只有准确把握AI时代的交互模式,应用于大量的应用场景,才能让AI能力在反馈中不断提升、应用层不断创新,形成新的增长飞轮。
至少,这波AI新浪潮中的第一个超级应用,一定符合这样的范式。
悬而未决的就是:这第一个超级应用会是谁?会以怎样的产品形态出现在我们面前?钉钉式的斜杠,是大道至简的终极产品形态了吗?