编程客栈()8月2日 消息:二十多年来,谷歌一直提供优质的网络索引服务。现在这家公司正试图让人工智能理解人类语言的细微差别,以便提供更好的搜索体验。
那么互联网搜索的未来会是什么样的?谷歌设想它看起来编程更像是与朋友的一次随意交谈。最近,该公司宣布了一种名为 MUM 的新人工智能系统,它代表多任务统一模型。MUM 旨在在全球范围内了解人类语言的细微差别,这可以帮助用户更轻松地找到他们搜索的信息,或允许用户提出更抽象的问题。
【资料图】
谷歌已经在一项独立任务中使用 MUM 来了解人们搜索COVID 疫苗的不同方式,当然这项新技术尚未成为谷歌搜索系统的一部分。尽管目前还不确定功能何时会应用在实时搜索中,但谷歌团队正在积极开发其他一次性任务完善 MUM系统。
以下是关于 MUM 是什么,以及它有什么不同等知识点的介绍。
MUM解决疫苗名称搜索问题
早些时候,新冠疫苗刚上市的时候,谷歌搜索副总裁 Pandu Nayak 及其同事设计了一种“体验”,当用户搜索的时候,向人们提供有关 COVID 疫苗的信息,内容包括——从哪里获得、工作原理以及在哪里可以购买疫苗。
这种体验将所有这些重要的相关信息拼凑在一起,并将其展示在搜索结果第一页的顶部。想要实现这样的效果,需要团队对其进行编程,以便这样的内容仅在查询 COVID 疫苗时才会弹出。而这可能会成为一个问题,因为全球各地的人们可能以不同的方式和不同的名称提及 COVID 疫苗。
去年,该团队花了数百个小时梳理资源,以确定COVID疫苗各种不同名称。但现在,则有了MUM系统。Nayak表示:“我们能够用MUM建立一个非常简单的实验,在几秒钟内就能够用50种不同的语言为17种不同的疫苗产生800多个名字。”“我们有很多语言任务需要解决,无论是分类、排名、信息提取,还是一大堆其他任务。在短期内,我们希望使用MUM来改善这些问题。这并不是说它会带来新的功能或新的体验,而是说,能够让现有的功能和体验会更好。”
在Google I/O 上亮相
在春季的 Google I/O 开发者大会上,Google 高级副总裁 Prabhakar Raghavan 揭开了MUM 的面纱。
这项新技术是基于机器学习的搜索的自然进化,谷歌在过去十年中一直在完善和改进这一项技术。谷歌自夸称,MUM 能够获得对世界的深度知识,理解并生成语言,并同时训练75种语言。另外,还有内部试验,测试它是否可以是多模式的,也就是说,能够同时理解不同形式的信息,如文本、图像和视频。
所有这些复杂性都可以通过会议上的一个简单示例说明。假设你问谷歌,“我已经爬过亚当斯山,现在想在明年秋天去爬富士山,我应该做哪些不同的准备?”
大多数人在网上搜索信息的时候是不会输入这样的句子的。Raghavan 在 I/O 上解释道“这是一个你会随便问朋友的问题,但当下的搜索引擎无法直接回答这样的问题,因为它无法理解这种对话和语言的细微差别。”
但理想情况下,MUM 则会理解你想要比较两座山峰的区别,也会理解想要爬这两座山需要做的准备可能包括针对地形的健身训练和适合秋季天气的徒步装备。它将能够剖析你的问题并将其分解为一组查询,了解问题的各个方面,然后将其重新组合在一起。用户可以点击了解更多与问题的各个方面相关的搜索结果,也可以获得原始查询整体的解释。
MUM 工程师的长期目标就是让用户可以获得这样的搜索体验,不过实现这一目标所需的时间尚不清楚。从中期来看,谷歌的工程师正在训练 M编程UM 识别文字和图像之间的关系,并且进展顺利。Nayak 称,当他们要求 MUM 为他们输入的一段新文本生成图像时,比如“西伯利亚哈士奇”,它确实“做得非常出色”。
搜索简史
自1998年成立以来,谷歌一直在不断地绘制网络地图,收集大量的内容,并创建索引来组织所有信息。
你可以把谷歌搜索索引想象成一本书的索引。它会告诉你某个特定单词出现的所有页面。除了互联网,还有两个重要的区别。第一,一本书可能有300到1000页,与网络上数万亿的页面相比,这不算什么。第二个重要的区别是,有了书后的索引,你一次只能查找一个单词,而在网络上,你能查找单词的组合。“基于这种规模和组合,我们每天都会收到来自世界各地的数十亿次查询,”Nayak说。“值得注意的是,我们每天获得的15% 的搜索是以前从未见过的。查询流中有令人难以置信的新奇之处。”
Nayak 补充说,部分新奇的内容是由于拼错单词,而部分原因是世界在不断变化,人们要求新的(有时是非常具体的)事物。
为了尽可能把所有可能的网络信息精简化,并且与你的查询信息是相关的。谷歌使用一种算法,根据新鲜度和位置等因素,以及不同页面之间的链接方式,将它认为最有用的页面排在顶部
Nayak说道,“到目前为止,最重要的一类因素与语言理解有关,语言理解确实是搜索的核心,因为你需要了解查询的含义和文档的含义,以及这两者如何相互匹配。”
当然,软件无法像人类那样真正理解语言,包括它所有的细微差别。但是程序员可以开发各种策略,尽量接近我们理解语言的方式。
就在16年前,谷歌建立了同义词系统的第一个版本,它解释了不同的单词在不同的上下文中具有不同的含义。因此,当您谈论笔记本电脑的亮度时,“change”可以表示“adjust”。如果不能理解这一点,由于单词选择的变化,许多相关页面将被排除在搜索结果之外。
机器学习进化
大约六年前,谷歌推出了其第一个基于机器学习的搜索版本。然后,基于深度学习社区围绕自然语言算法开展的大量研究,它继续对其进行改进,这些算法可以查看单词用于理解其含义的上下文,并找出上下文的哪些部分需要注意。
2019年,谷歌推出了用于搜索的BERT架构。它的训练算法实际上是一系列“填空”练习。你可以用一个常用短语,屏蔽掉随机单词,然后让网络预测这些单词是什么。它也被称为掩码语言模型。
对于像“你能在药房为某人买药”之类的查询,以前搜索者会得到一个关于在药房取药的结果。而BERT 架构则能理解,它不仅是拿一张处方,还能理解到这是为朋友或家人开处方。Nayak 说道,“我们能够得出一个相关性更高的结果”。
展望未来,MUM 不仅能够像 BERT 这样理解语言,还能够生成语言。相比之下,MUM 比 BERT 功能更强大得多,(谷歌说它的功能大约是 BERT 的1000倍)。
MUM在谷歌提供的所有不同语言的公共网络语料库的高质量子集上接受训练。搜索团队会删除低质量内容、成人内容、露骨内容、仇恨言论,因此 MUM 学习的语言在某种意义上是更为积极的。
但 Nayak 承认,像 MUM 这样的大型语言模型肯定存在巨大的挑战需要团队努力解决。“例如,一个是偏见问题。因为这是从网络语料库中训练出来的,所以人们担心它是否反映或加强了网络中存在的偏见。Nayak希望,它是在语料库的高质量子集上训练的,这一事实将消除一些最严重的偏见。
注:文章资料来自popsci,原文链接:https://www.popsci.com/technology/google-mum-ai/