前言
最近Google旗下的AI笔记工具NotebookLM推出了一项创新功能——文字一键转播客,这个功能迅速引起了广泛关注。这个功能具备将用户上传的任意资料转换成双人对话的播客,非常逼真它为内容创作与分享带来了全新的体验。
不过目前 NotebookLM 这个功能只支持转换成英文播客,如果你想使用这个功能并且生成中文播客怎么操作?可以用扣子Coze官方提供的模版来实现这个功能,非常简单仅需 3 分钟。
不知道扣子Coze平台的可以看之前的文章《教你 5 分钟搭建 AI 应用到微信服务号》
使用
进入扣子Coze主页(https://www.coze.cn/)找到「模版」的「营销创作」选择「文章转播客」。
官方已经出了这个工作流了,直接使用即可,以我之前的文章《教你 5 分钟搭建 AI 应用到微信服务号》为例,输入文字链接则会自动生成封面和音频。
封面图:
播客:由于无法上传音频内容,如需听音频可以前往《教你 3 分钟实现 NotebookLM 的AI播客功能》去听
如果你只需要使用这就已经完事了,接下来我带大家来分析下具体这个工作流的实现思路。
拆解
我们首先在使用页面的右边区域对这个工作流进行复制到自己的空间
复制之后切换到工作空间的资源库,可以看到多了一个工作流和图片流
我们先来看看工作流,复杂度一般,一共9个节点
- 插件节点x4(链接读取x1,声音生成x2,合并音频x1)
- 大模型节点x2(生成封面描述和摘要x1,生成播客对话内容x1)
- 代码节点x2(解析对话内容x1,合并音频数组x1)
- 图片流节点x1(生成封面x1)
梳理逻辑:
- 通过链接读取内容
- 生成封面
- 通过内容总结摘要和图片提示词
- 生成封面图片
- 生成播客
- 生成对话文本
- 解析对话文本
- 生成男声音频
- 生成女声音频
- 合并音频数组
- 合并音频文件
分析
我们可以看到上面一共分为两个并行的流程,第一个是生成封面,第二个是生成播客。接下来,我带大家来详细分析。
第一步,通过链接获取内容,使用的「链接读取」插件的 LinkReaderPlugin。
输入 url 即可返回网页内容
生成封面
接下来将返回的内容会分别给到两个不同的分支去处理,我们先从简单的封面来看,一共就两步:
- 通过内容生成图片提示词和文字摘要
- 通过生成的图片提示词生成封面图片
我们再来看看图片流详情,在这里告诉大家一个快速切换到图片流的小技巧,可以在节点卡片右上角三个点进入图片流详情,(同样也支持查看插件详情)。
图片流相对简单很多,通过提示词生成图片以及生成完图片后通过画板布局输出对应图片(如果你想改变封面的布局样式直接编辑画布即可)。
生成播客
看完封面制作流程后我们再来看看生成播客流程,通过内容生成对话文案内容,然后再进行文案进行男女内容拆分
拆分完成之后,在用「中文文本转语音」插件分别进行男声女声的批量音频生成,再把音频地址合成音频数据
「音频处理工具」插件详情,目前默认有4种声音(两种不同的女声和两种不同的男声),如果想要替换声音可以换个不同的API即可。
最后再将合并好的数组参数使用「音频处理工具」的 merge_audios 合并成一个音频
「音频处理工具」插件详情,它不仅支持多个音频合并,还支持为音频添加背景音。
到这里整个工作流就分析结束了!
最后
今天我们拆解了AI播客工作流,整体来看扣子Coze的工作流可玩性非常高在工作流中使用大模型和各种插件能组满足不同需求的业务场景,当然如果你觉得这个功能不错还可以在此工作流上完善这个AI播客功能。