如何用Python总结音频和视频文件

理解如何使用AssemblyAI API的自动章节功能总结音频文件

图片由凯利SikkemaUnsplash

简介

文本摘要是一套应用于自然语言处理(NLP)背景下的技术,能够以保留关键信息的方式缩短原始文本的抄写。

文本摘要在需要的情况下很有用更容易而且可能更快地使用大块数据。此外,这样的应用程序可以应用在我们需要处理音频文件的上下文中。这意味着第一步将是在文本摘要之前执行Speech to Text,然后将该输出作为将执行摘要任务的服务的输入。

在今天的文章中,我们将探索如何使用直观和非常容易使用的API来总结音频和视频文件。

用一个简单的API总结音频文件

我们将执行音频综述使用AssemblyAI API提供的自动章节功能摘要随着时间的推移用于先前使用语音到文本API转录的音频文件。

在本教程中,我们将使用拜登于2021年4月28日在美国国会发表的演讲作为音频文件。

您需要做的第一件事(特别是如果您计划跟随本教程)是获取API密钥(免费)。

导入请求库并定义请求头-来源:作者

现在我们需要做的第二件事是将音频文件上传到AssemblyAI的托管服务中,它将返回给我们一个链接,我们将使用它来执行后续请求,以便执行实际的转录和摘要。

上传我们的音频文件到AssemblyAI的API托管服务,以便检索回URL -来源:作者

上面的调用返回上传url,它实际上是我们上传的音频文件的宿主。现在我们已经完成了这些工作,我们可以继续并获得音频文件的转录以及由AssemblyAI API算法生成的摘要章节。

使用AssemblyAI API执行语音到文本和摘要-来源:作者

在上面的调用中,注意我们必须设置auto_chapters真正的以便指示API对转录后的文本执行摘要。

口译的响应

前一个API调用的响应如下所示:

输出包含转录文本以及提取的章节(摘要)的输入音频文件-来源:作者

在返回的输出中,可以在文本键,而汇编ai生成的摘要章节关键。对于每个提取的章节,响应还将包括开始和结束时间戳以及总结这基本上包括几个句子,总结特定时间的音频和标题

完整代码

本教程用于将音频文件上传到AssemblyAI API、执行语音到文本和摘要的完整代码可以在下面找到。

我们教程的完整代码-来源:作者

最终的想法

在今天的简短指南中,我们讨论了如何使用AssemblyAI API特性对音频或视频文件执行摘要汽车的章节.作为本教程的一部分,我们只介绍了他们API提供的功能的一小部分,所以一定要检查他们的官方文档如果您想查看他们提供的产品的完整列表。

成为一员阅读Medium上的所有故事。你的会员费直接支持我和你阅读的其他作家。你还可以完全访问Medium上的所有故事。

| Python开发人员

Baidu
map