(CWW)ChatGPT等人工智能语言模型的出现虽然尚未对人们的生产方式带来根本性变革,但有可能改变人们与计算机的互动方式,推动从用户创作到人工智能创作的转型,发展潜力与应用空间巨大。与此同时,ChatGPT带来技术层面、市场层面、规范层面、国际竞争层面的多重风险挑战。人工智能技术的发展和应用,将对人类经济社会发展带来深刻影响,我国人工智能技术发展也面临新的机遇和挑战。浙江大学光华法学院教授程乐在《国家治理》撰文指出:促进我国人工智能高效安全发展,应积极引导,促进价值观念再成型;积极研发新兴应用场景,占据市场优势地位;确保算法优势;统筹发展和安全;明确战略定位,提供宏观指导;做好风险评估,确保企业合规。
ChatGPT代表生成式人工智能技术及其商业应用的爆发,引发产业和行业大变革
(相关资料图)
2022年11月30日,美国人工智能公司OpenAI推出基于深度学习的大语言模型ChatGPT,可实现交互式问答、创作、编程等复杂功能,备受市场关注。据报道,ChatGPT上线两个月,全球日活用户就已突破1亿,成为历史上用户增长最快的应用程序。2023年2月1日,OpenAI在其官网主页宣布,将试点ChatGPT付费订阅版ChatGPT Plus,每月收费20美元。由此可见,随着企业内部成本压力加大,技术可用度日趋成熟,人工智能产业正加速从前沿技术探索向商业化落地转型。ChatGPT的应用前景包括对话式机器人、智能创作、编程机器人等;此外,其在教育、学术、客服等领域的应用也在逐渐落地。
ChatGPT的基本模式是人工智能生成内容(AIGC),专注于生成语言文本,并一定程度上替代现有搜索引擎功能。与以往的对话式人工智能(如微软小冰)相比,ChatGPT核心能力包括:对问题的理解能力大幅提升,可以实现连续多轮对话;结果的准确性大幅提升,同时可以主动承认错误、发现无法回答的问题;具备识别非法与偏见的机制,针对不合理提问进行提示,并拒绝回答;理解用户需求并创造内容,甚至可以协助进行代码编写。虽然目前ChatGPT无法给人们的生产方式带来根本性变革,但有可能改变人们与计算机的互动方式,推动从专家生成内容(PGC)、用户生成内容(UGC)到人工智能生成内容(AIGC)的转型。
全球著名信息技术研究与顾问咨询公司高德纳(Gartner)将人工智能生成内容(后文统一用AIGC)列为最有商业前景的人工智能技术,预计AIGC行业将在2—5年内将进入成熟期,发展潜力与应用空间巨大。ChatGPT的商业化服务探索、AIGC赛道的投资成为当前关注焦点。
AIGC领域的总体态势表现为:国外头部机构引领技术和商业应用,国内整体进度落后2—3年,尤其是基础技术研发方面。此外,除科技巨头积极布局AIGC行业外,科技创业公司的机会成本也显著增加。目前,国外多家生成式人工智能创业公司获得大笔融资且拥有较高估值。ChatGPT具备强大的交互和信息检索能力,对谷歌、百度等传统搜索引擎公司构成潜在替代风险,倒逼搜索引擎行业进行技术升级。用户可以直接在ChatGPT以提问形式获得期待答复,比起传统在搜索引擎人工浏览整合答案的效率大大提升。目前,各大搜索引擎企业正在加速将AIGC嵌入其网站中,例如微软将ChatGPT应用于其搜索引擎必应(Bing)中,百度于3月推出人工智能聊天机器人文心一言,并整合到其搜索引擎中。当前AIGC领域领先的国外公司主要包括OpenAI、Stability AI、Midjourney、Jasper等,其中OpenAI技术积累最强,发布了多款AIGC底层算法。国内公司如阿里、网易、百度、腾讯、字节等均在部署推出AIGC的应用产品。
基于此,当前一种观点认为ChatGPT是科技史上的里程碑事件、颠覆性成果,会刺激基于人工智能的商业模式爆发式发展,进而引发产业和行业大变革。另一种声音则认为ChatGPT只是近年来持续发展的人工智能技术的一次成功的商业化应用,距离真正的人工智能还有很长的路,甚至可能并非在正确的道路上。总体而言,ChatGPT的横空出世,利好国内外算力与存储(芯片、计算机等)相关基础设施发展以及数据、算法等AIGC商业化应用,但仍不能忽视其所带来的潜在道德和社会危险。
ChatGPT带来的风险挑战
OpenAI首席执行官Altman曾在推特承认,真正的强人工智能(Artificial General Intelligence,AGI)可能在未来十年内实现。所以,当前必须极其认真地对待其所带来的网络安全等一系列风险。
技术层面的风险
从技术层面而言,人工智能语言模型GPT的出现和升级意味着语言人工智能和人工智能整体技术水平的显著进步。但若人工智能基础设施不及预期,大模型训练就无法完成或者达不到预期效果。当前AIGC技术仍有局限,模型仍需持续迭代优化,技术发展可能存在不及预期风险,具体包括算力支持不及预期、数据质量不及预期等。尤其是我国在AIGC领域仍处于发展初期,技术迭代速度较慢,基础技术研发领域创新性供给不足。ChatGPT目前仍存在很多局限性,需进行持续技术优化。例如,ChatGPT可能生成不正确或荒谬的信息,抑或是正确但无用的废话,也可能会产生违反伦理道德的答案。由于其所基于的训练数据库仅截至2021年(而非基于实时数据),也会产生回答已经过时的现象。
市场层面的风险
从市场层面而言,新一代人工智能语言模型的升级推动AIGC的发展,极大拓展了市场规模。根据高德纳(Gartner)预测,到2025年AIGC产生的数据将占所有数据的10%,2030年AIGC市场规模将超过万亿人民币。目前,因为多重原因,各国类似于ChatGPT的技术发展不完善、不平衡,应用不及预期。若ChatGPT等技术发展不及预期,AIGC渗透率未能如期提升、应用场景受限,理论上存在的潜在市场规模就无法充分释放。对于我国而言,国内企业以及国内外企业对于同一市场的开发与分配之间的不均衡可能会导致蜂拥而上的相关企业最后陷入无效竞争或者恶性竞争的状态,以及投入与产出的极不对称。
规范层面的风险
ChatGPT带来的规范层面的风险挑战,主要包括以下几个方面:
第一,人工智能驱动网络犯罪风险。当前,ChatGPT使得网络犯罪分子更容易进行低级别的网络攻击。ChatGPT可以产生多种语言的钓鱼邮件,即使不懂英文或高级代码的犯罪分子也可以轻易达成犯罪目的。ChatGPT可以被要求创建恶意软件来检测敏感的用户数据,还可以入侵计算机系统或电子邮件账户以获取重要信息。国外科技媒体Bleeping Computer的网络安全研究员Ax Sharma曾让ChatGPT写了一封令人信服的钓鱼邮件,并创建了JavaScript来窃取信用卡号码。然而,ChatGPT也许只是人工智能驱动网络犯罪的开始。芬兰一篇题为《人工智能驱动的网络攻击的安全威胁》的研究论文认为,未来五年,人工智能的迭代确实将改变网络安全攻击者和防御者的模式。
第二,知识产权与隐私保护风险。由于ChatGPT是以训练数据模式为基础的,所以它不具备原创性思维和创造性反应的能力,因此ChatGPT生成的文本可能导致抄袭,此外版权归属与深伪技术也为知识产权保护带来困境。由于对抄袭的担忧,ChatGPT已经在美国纽约和西雅图的学校被禁止使用。此外,ChatGPT引发了关于用于训练和改进的个人数据的隐私和安全问题,它保留了用户个人数据和敏感信息,一旦数据被滥用,会造成隐私泄露风险。简单地说,所有与ChatGPT的对话都可以被存储,并由人类培训师审查,以检查和改进人工智能模型。人工智能可能会生产违反常规、违背法律和道德的内容,或帮助人类以作弊等形式完成违反常规、违背法律和道德的行为。由于 AIGC 发展处于早期,政策监管仍不明确,利用 ChatGPT 生成的内容可能存在侵犯其他内容知识产权等规范层面的风险。与任何能够产生类似人类文本的技术一样,ChatGPT对网络安全和隐私也会产生消极影响,尤其是风险因素的存在可能会改变网民对于网络世界的认知,进而改变甚至颠覆网络安全系统。网民应用ChatGPT主要可能触及的规范风险包括:
错误信息风险:ChatGPT改变了传统的网络搜索方式与传播方式。虽然大型语言模型难免会产生错误信息,但只有当错误信息被广泛传播、阅读并相信才会产生伤害。ChatGPT在网络环境下具有大规模且廉价生成文本的能力,若被恶意滥用,势必会使得虚假信息在网络世界广泛传播。
深伪技术风险:基于大数据自然语言处理模型,ChatGPT通过深伪技术产生的文本与人类书写的文本没有区别。这可以用于在线模仿个人。而深伪文本的广泛传播会导致人们对于网络世界信息传播与人际交流的不信任。
数据泄漏风险:ChatGPT基于大型网络文本数据库进行了预训练,因此它可能包含敏感信息或偏见。如果模型与包含敏感信息的数据(例如个人数据,财务数据或健康数据)一起使用,这可能会导致隐私漏洞。
第三,政策监管漏洞。当前AIGC处于发展初期,相关政策规范处于滞后和监管不明的状态。首先在技术层面,监管机构面临算法不透明、技术障碍等问题,进一步增加了监管难度。其次,在法律规范层面,当前算法与人工智能领域相关法律规范仍处于缺位状态,监管机构面临采取行动缺乏对应法律依据的现实困境。
国际竞争局面的挑战
第一,技术封锁挑战。目前ChatGPT没有对中国用户开放使用,无法用国内手机号进行注册,国内用户想要使用ChatGPT存在诸多限制。科技虽然无国界,但是科技公司有国籍。而ChatGPT未对中国用户开放,实则也是这些年中美科技博弈的缩影,是美国实行对华技术封锁的体现。OpenAI公司目前掌握着AIGC底层算法和核心技术,也就占领了国际社会该领域的技术话语权。
第二,国家安全风险。根据路透社2月13日的报告,由于ChatGPT对国家安全的影响,美国立法者已经着手相关立法工作。对于我国而言,一方面,由于OpenAI公司本身的政治立场,ChatGPT在回答政治问题,尤其是中美问题时,存在明显的亲美贬中的倾向;另一方面,恶意行为者、其他非国家行为者,对中国有敌意的国家行为者可能会利用这些系统,故意训练或生成错误的,甚至是诋毁我国的信息。
从ChatGPT看人工智能生成渊源和现实影响
从“奇点”到“爆点”的推动要素。从数年前甚嚣尘上的人工智能“奇点论”至如今对话交互式人工智能应用成功与全社会层面进行交互,人工智能从“奇点”走向“爆点”的事实已露端倪。然而所谓“爆点”,爆于何点却需要更严谨的要素与趋势研判才能佐证。依目前来看,近期的人工智能爆点源自于接近性门槛降低带来的应用用户群体急速扩张与对行业既有价值规则的冲击,更深一层则源自于机器学习产生以来,以多重语料库为学习材料不断打磨锻炼而形成的语言交互及逻辑模型。人工智能与语言交互领域的突破源自于对于相应要素的长期积累与培育打磨。以上效果的最终呈现自互联网发明伊始便开始沉淀,并由硬件与算力的提升及互联网共享数据内容的海量增殖而最终得以完善。
束羁于预设的功能范畴。虽然以ChatGPT为代表的交互式人工智能应用已展现了令人瞠目的智能性与逻辑编排能力,但其展现却仍滞留于“高于一般,低于前沿”的发展阶段,且将长久处于该阶段。导致这一结果的原因有二:
其一,机器学习的基础材料与模型机理皆是由人力完成,语言作为人力交互的最基本表达方式也是最简单的呈现,其表现方式在机器易学的同时也易为大众所接受,但无论其对基础材料的重新编排如何精妙,其高度远无法超过语料库本身所呈现的逻辑最高点,这也是由语言作为表达工具的逻辑功能所限。
其二,位于前沿的科学研究与发现皆为人力突破极限所衍生的新高度与新事物,其中除科学技术与发现技巧之外,大部分创新成果需要对新事物发现进行符合人类知性与感性逻辑的选择。大部分技术选择并不一定最科学,却最符合人的感性与认知,而机器目前无法代替人类完成这一选择。哪怕机器能够代替人类选择,人类也会出于主观能动性,对于机器筛选结果进行再次审核监督,从而进行知性与感性的纠正。
赋值社会效果有待突破。人工智能赋值社会的技术应用周期较长,从开发到各行业落实应用常常需要缓慢的过程。而如今飞快提速的对话式人工智能是社会层面全盘接触人工智能的开始。对话交互的方式提升人们获取信息的效率,减少了人与人沟通过程中的思想负担与理性压制,俨然成为一种无思想压力的新社交体现。而广范围的应用却也使得获取信息的途径减少,在人工智能本身尚不能保证其内容准确度及与人类价值观念的符合度时,这种单一来源的交互问答剥夺了人与人交互并验证思想与内容对错是非的路径,易产生负面效果,此为途径上的缺失。
社会面的全接触效果也源于营销与宣传带来的眼球吸引效应。美国谷歌和微软等大型科技企业参与相关竞争,更吸引着全球热切的目光。但是,直至目前,公开的对话式人工智能应用仍存在严重缺陷。虽然人工智能通过读取大量数据,可以给出像模像样的答案,但也存在很多致命性错误或缺陷。很难说人工智能真正理解了问题和自己用于作答的词汇的含义,此为内容上的缺失。通过梳理ChatGPT等对话人工智能出现的诸多错误,就可以发现机器要达到真正的智能所面临的核心技术课题仍未解决,从内容和途径上都尚无法完成赋值社会的目标追求。
人工智能未来发展变化趋势
加速推动基础研究。就目前的发展趋势看,未来人工智能将持续、深度赋能科学研究活动,为科研活动提供新的、革命性的基础性操作平台与方法,推动科研活动由传统的研究模式,扩展至智能式研究模式,从而大幅提高科学研究效率,甚至颠覆当前主流科研方法。社会大众对人工智能应用层面的全盘接触始于ChatGPT,而各专业领域与人工智能的对接融合却早已产生显著成效。如天文学领域利用数据训练卷积神经网络,通过给定一个引力透镜信息估算暗物质能量比例参数。化学领域在人工智能导入后实现了高速合成反应的高效率实操,其效率与精确度远高于手工提取设计。另有诸如医学、生物学等领域的人工智能前沿应用已逐渐解决包括缩减临床试验监测周期、快速有效分析与提取遗传数据并绘图等损力耗时的繁琐工作。人工智能的作用机理决定了它很难在某特定领域超越最先进的人力,却可能在长时间的算力与模型积累之下,超越大部分的人力范畴。但明显可见的是,通过数量级与效率的叠加无法完成的工作,人工智能也无法解决,就如同人类决策的复杂与知性无法复制。
对于价值观念的颠覆性远超过技术本身的颠覆性。机器学习提供了不同以往的研发与沟通效率,却并非人工智能带来颠覆科技的象征。此处并非否定人工智能在应用层面产生了对社会逻辑与产业伦理各层面的颠覆效果,而是人工智能对于技术研发的颠覆性远不如对社会层面价值观念的颠覆性来得更为明显与直接。交互式人工智能是人类社会认识和熟悉人工智能的一扇窗口,从这扇窗口中我们窥见了其超过一般人群的表达能力、逻辑思维能力、记忆与组织能力、管理与领导能力,使之从一般人的视角与立场出发明显在与人力的比较中处于优势地位。但这也正是由于人类社会长期积累的语言逻辑知识的数量级叠加带来的赋能。细读之下,ChatGPT严谨逻辑内容下的空洞说明与缺乏内涵深度的思想罗列在深度思维层面显现出了其薄弱性,更遑论对于具有争议性的问题及新兴科学发现的更新效率上,ChatGPT明显弱于科学前沿的开拓者。由此可知,技术所带来的颠覆性主要源于其大幅度介入社会生活所带来的冲击。
人工智能的社会意义与市场意义。人工智能目前呈现的效果具有积极的社会意义与市场意义。在社会层面,广泛的接受度及其对社会民众带来的冲击与震撼,可让人类与其他社会主体重新认识人工智能对于社会的影响力与未来趋势,对于提升接受度,从而刺激开发主体与实施主体进行更进一步的开发与完善具有积极意义,进而影响市场层面。市场意义带来的应用效果与研发效果叠加目前已见端倪,包括我国头部企业在内的互联网平台与资源企业正在积极投入到交互式人工智能的开发与应用当中,不久之后将带动更大范围与更深层面的技术开发与市场联动。
成就智能型研发的有效工具。目前为止的主流科研模式仍基于实验操作方法,执行问题提出、方法设计、模型创建的基本规程,最终解决既定问题。智能型科研模式则强调对科研大数据的智能化处理与操作,获取数据之中的潜在规律、发现其中的异常、智能构建规律模型等,或是通过自动化、持续性的工具操作来解放科研人员体力与精力。人工智能对科学研究的意义,不仅限于辅助性的获得新科学发现、新数据规律,更重要的是,它愈发成为一种新型的基础性科研平台,或是通过为整个科学研究提供革命性研究工具,来提高整个科学研究活动效率。
我国人工智能发展面临的机遇与挑战
社会面与市场面接受度不同。任何创新都将在一定周期内处于低接受度的实验阶段,这个周期的长短取决于社会层面的接收程度与技术本身融入社会需求的效果。而此次ChatGPT却是先融入社会范畴之后,在一定领域产生了融入后剥离的逆向效果。如近期多家权威期刊对于以人工智能交互表达而生成的文章内容持排斥意见,并引为禁止刊载的理由。各级学校、教育机关也频频表示对学生依靠ChatGPT完成作业、报告等情况加以制约。这类逆剥离现象源于人工智能作为工具过度深入介入人类社会行为,从而对既有行为效果产生了扭曲。如同技术的创新研发终将服务于人类社会一样,在效果上扭曲人类社会既有规则并引发负面影响的人工智能应用方法自然会受到社会排斥。而社会的排斥并不直接引起市场层面的排斥,因为社会面产生斥力的原因便是由于不同立场人群间一部分人产生需求,一部分人抵制需求。需求存在,则市场面供给就可能持续,是否保持市场面的供给则需要规则与制度依据社会选择进行制约。
基础研究与产业链优势。人工智能所能带来的机械操作效率积累,为基础技术的研发带来了巨大的利好条件,将有望使大部分研究人员从枯燥且易错的基础操作当中解放出来,完成更多的前沿设计工作。我国目前产业链优势明显,研发资源与人力积累丰厚,却因时间轴上晚于西方,在基础研究上处于劣势地位。人工智能应用于各研究领域,将有望在基础研究积累上进一步解放资源,提升创新与创造能力,为进一步的产业积累与前沿突破提供有利条件。
西方国家的先发优势影响。通过对本次语言交互人工智能应用爆发的研判,可见目前西方在技术积累与应用场景开发上对比我国处于优势地位。美国开发的ChatGPT,采用美西方掌握控制的语言文档资料数据库(大数据)训练引导产生的结论,暴露了其意识形态的倾向性、归属性、强制性。同时,开源促成了技术模型的接近性。我国对于人工智能跟进速度与效率始终保持高度发展状态,多年来形成的技术市场与产业密度决定我国的优势在于对于新兴应用的落地执行与基于市场反馈的多元优化。多元场景落地基础条件中包括资本、技术、执行与市场接受度等方面,持续发展互联网经济、数字经济的我国,兼有稳步推进的条件与广泛的用户积累。
确保技术本身与应用环境的安全性。2010年开始并持续到现在的人工智能浪潮并不是人类思考逻辑,而是由让计算机自己归纳出数据的各种类型的机器学习来引领。随着相当于计算机大脑的半导体性能越来越高以及互联网普及,可以收集全世界的数据,被称为“深层学习”的可以识别复杂类型的软件技术问世等要素全部得以实现。由于机器学习逐渐到达能力提升临界点,目前的人工智能应用尚未脱出现有规则控制,短期未来也不会。然而人工智能介于技术开发与产业应用的爆发临界却是不争的事实。鉴于国内外安全形势,在我国总体国家安全观政策框架下,未来应用于各社会及产业全景的人工智能是否可控,将是判别一款应用是否可推进的基础条件。
促进我国人工智能发展的对策建议
积极快速引导,促进价值观念再成型。人类决策的复杂与知性无法复制。监督学习是未来主动左右人工智能服务内容与价值倾向的主要手段。积极赋予人工智能人性价值判断,结合网络语料对交互式人工智能进行有效的人工监督学习,通过用户反馈强化学习,导入人类社会的需要与价值判断,将避免其产生社会负面影响。同时,根据不同行业对于人工智能体验的需要,针对各行业影响效果,推动细化规则,有效监督落地,是达成细节监管的必要条件。
积极研发新兴应用场景,占据市场优势地位。人工智能技术所涉及的应用场景繁杂,目前各行业均已导入了有效的机器学习机制,形成了可推动的应用场景。基于我国产业链整体优势与基础数据提供源的体量优势,比之交互式泛娱乐效果的人工智能应用,我国有望在西方占有交互式人工智能探索主动权的大环境下应用和推动包括主要产业领域在内的人工智能应用模式落地,呈现与西方不同的服务于基础产业与前沿研究的深层发展模式。同时,需始终保持审慎态度,控制细分领域颠覆性效果肆意膨胀。
确保算法优势。当前我国缺乏核心算法,过度依赖开源,几乎93%的国内研究者使用人工智能开源软件包。虽然我国也有少数学者做出了原创性研究成果,但比之西方在实践阶段的扩展尚有明显不足。日前,西方包括谷歌在内的人工智能研究主体纷纷宣布裁员,许多知名的开源开发者遭到解雇,这或将为我国加速积累、实现超越提供有利条件。但也应当注意,开源部分的切割裁员更将带来开源资源和开源社区活跃度的下降,需慎防开源算法被西方国家利用成为钳制我国人工智能学习发展的工具。
统筹发展和安全。在发展中规范,在规范中发展,保证企业发展在法治轨道上运行。一方面,积极鼓励企业通过自身的发展推动经济社会发展,对于企业的正当权益应该通过立法的形式予以确认,对企业有可能的违规违法行为予以及时纠正处理;另一方面,政策往往起到引领经济社会发展的作用,可以通过政策的形式对企业发展的方向予以指引。人工智能的应用涉及网络安全、数据安全、个人隐私等,一方面我们可以在现有法律规范的框架内予以规范;另一方面对于企业发展的新业态若无法通过现有法律予以规范的,要及时立法,确保有法可依、依法行政。
明确战略定位,提供宏观指导。一方面,人工智能技术的应用促进社会发展、节约社会开支、提高运作效率,因此国家总体上应该鼓励人工智能技术发展与应用,保护企业积极性;另一方面应该给企业的发展以宏观指导,知悉商业逐利的本质以及市场营销的本性,与国外企业积极竞争引领权,避免国内产业重复建设、恶性竞争。
做好风险评估,确保企业合规。在企业自身发展过程中,为了有效降低各种风险,要考虑使用ChatGPT模型的潜在后果并采取措施最大程度地降低滥用风险:一是限制对ChatGPT模型的访问,监管其使用情况并查看数据,然后再将其提供给模型以过滤或删除敏感信息;二是使用安全和私人的计算环境并正确处理数据,以防止数据泄露或未经授权访问数据;三是定期监管和审核该模型的性能和正在处理的数据,可以揭示并防止滥用或操纵。
结语
强化人工智能对各产业及各行业的支撑作用,对我国未来发展具有重大意义,而基于我国坚实的产业与技术基础,人工智能的研发溢出效果也将在不久后显现。目前,社会面对人工智能的认知还有不足,由于对话式交互方式的出现,社会与产业层面对人工智能的追逐产生了更加狂热的倾向。由于人工智能无法做到领导前沿与指明方向的功能,因此数量级与效率的叠加无法完成的工作,需由宏观决策加以引导。位于“爆点”的人工智能应用无法对新兴技术与产业领域进行超前研判,因此宏观的理性认知与发展决策变得至关重要。