首页 > 热点 > > 正文

每日速讯:趣AI | 播客的未来是人工智能?

2022-11-10 15:51:43    来源:站长之家    

编程客栈() 11月10日 消息:数据显示,目前每个月大约有22000个新播客推出。根据 Podcast Industry Insights 的数据,目前苹果播客(Apple Podcasts)目录中有近250万播客(超过7100万集)。

“现在,许多播客甚至不在大平台上播放。他们直接面向听众,销售优质内容,并取得巨大成功,”安迪泰勒说,他曾在BBC电台工作,是总部位于加的夫的R&D咨询公司Bwlb的创始人。

这还不包括越来越多的播客类内容,无论是由品牌为推广而创建的,还是由活动制作人创建的,例如,希望按需提供演讲。每一段内容都需要制作和分发,无论是音频专业人员还是学习这门手艺的人。因此,他们越能自动化大量生产,就越能专注于内容。


(资料图)

M Works Mastering公司的首席工程师、波士顿伯克利音乐学院的教授 Jonathan Wyner 解释说:“不同地区音频发布已经出现爆炸式增长。在这样的背景下,变得更加多才多艺成为了创作者真正的动机和必要条件。”

人工智能的崛起

人工智能(AI)——可以自动化处理一些人类任务——是处理海量播客内容的关键。它不仅可以加快生产速度,还可以优化播客内容,为未来的音频体验奠定基础。

“人工智能基本上有助于处理重复性任务,以加快播客的工作流程,”Nomono的研究工程师Manos C编程hourdakis解释说,他开发了基于人工智能的播客工具。“例如,通js过使用AI,你不必听完一整段播客来找到出错的地方,然后再手动替换或删除。你当然可以这样做,但人工智能效率更高。”

此外,还有一些只有人工智能才能完成的琐事,比如消除噪音或增强对话。“没有人工智能,高质量的对话增强是不可能的,”Chourdakis说。"至少不可能在合理的时间范围内使用传统工具。"

非常适合“初级”任务

人工智能在播客中的应用与制作任务一样多种多样。有些直接内置到播客平台中。当创作者将他们的播客上传到托管平台Podcast.co时,系统会自动“监听”音频文件,并规范声级。

Podcast.co平台的联合创始人Mike Cunsolo表示:“任何能帮助减少工作中重复性操作的工具都是一件好事。”。Cunsolo还经营着与企业品牌合作的播客制作公司Cue和播客社区 Matchmaker.fm(将播客制作人与嘉宾联系起来)。“你永远需要人类的专业知识,但很快机器就可以学会理解是什么让播客变得有趣,并减少任务时间。”

解决方案提供商Descript将人工智能应用于播客工程的许多方面,包括噪声消除和回声控制。其中一个比较“麻木”的杂务描述可以处理的是室内音调。

Descript的业务和企业发展主管Jay LeBoeuf表示:“有时制作人需要在播客中插入数字静音。可能是在编辑之间,或者是为了拉长句子之间的间距。但这听起来非常不自然。”

如果制作人在录制播客时没有捕捉到室内音调,他们可能不得不回去获取。或者他们可以在录音中听取,在需要的地方复制粘贴,然后编辑结果,使其自然混合。

或者计算机可以处理。Descript基于AI的房间音调生成器分析录音,识别房间音调,并在需要的地方自动合成。这样的技术不仅省去了繁琐的工作,而且提供了更大的生产灵活性。

Nomono 的 Chourdakis 表示: “人工智能将允许我们使用更便宜的硬件、声音更差的房间和更嘈杂的地点,同时仍能获得良好的效果。”。

基于人工智能的新功能

人工智能还为播客创新打开了大门——创造新的解决方案,提高播客和听众的水平。例如,Epidemic Audio Reference(EAR)工具帮助播客根据他们喜欢的歌曲找到无版权音乐。

Chourdakis 表示:”假设你正在寻找开场或结尾音乐,并想到了一首特定的歌曲,但它受版权保护。”。“系统在引擎盖下使用人工智能来帮助你找到类似的东西。”“该系统在使用人工智能来帮助你找到类似的作品。”

在Bwlb,Taylor的团队开发了Accordion,这是一种基于人工智能的解决方案,可以录制播客并以不同的长度再现。

Taylor说:“我们生活的每一部分都在变得更智能——智能家居、智能冰箱。”。“人们也希望从播客体验中获得更多控制和便利。”

当Taylor为BBC拍摄纪录片时,他被要求在不同的平台上播放更短的版本。这个过程总是手动的。Accordion将软件算法应用于播客内容,以智能地创建不同长度的版本。Taylor说:“它不会加快任何速度,但它可以让用户控制内容的持续时间,而不会失去音调结构或可听性。”

关注身临其境的故事讲述

播客使用AI工具越多,就变得越好。换言之,他们获取的数据越多,学到的php就越多。

Nomono的对话增强算法基于语音记录的大数据集,这些数据集教人工智能工具如何产生更好的声音。“播客不应该需要先进的音频知识来制作高质量的音频,”Chourdakis说。“通过自动化其中一些任务,他们可以把更多的时间专注于讲述精彩的故事,,而不用花时间处理乏味的任务上。”

在未来,他们可以进化得更快,创造一种新的沉浸式空间播客类型。例如,Nomono的技术支持基于对象的音频制作,它允许制作者将声音“放置”在3D 场景中,或者创建可以为听众量身定制的动态版本。

Descript的LeBoeuf表示:“媒体制作现在正进入一个阶段,只要你敢想象,它就会实现。你不再需要一个昂贵的工作室或几十年的培训来实现你的目标。”

注:本文内容参考自unite.ai。

[责任编辑:editor]

相关新闻

为你推荐