首页 > 教程攻略 > ai资讯 >播客,下一个 AI 涌入的赛道

播客,下一个 AI 涌入的赛道

来源:互联网 时间:2026-06-09 14:43:06
今年三月,Suno V3 突然冒出来,像是 AI 圈的一声惊雷。不仅叫醒了万物,也让那句“人人都能成为音乐家”的口号突然变得接地气起来——大众对生成式 AI 的热情,被彻底点燃了。 播客,下一个 AI 涌入的赛道 这一下,石头激起了千层浪。生产端这边,有人抢前抓点,赶紧套壳 Suno 先跑一步;也有人闷头搞自研模型,一夜之间,上百款 AI 音乐生成工具冒了出来。消费端就更热闹了,几十万人涌进网易云音乐、QQ 音乐这些平台,注册成为“音乐人”,创作和发布乐此不疲。 翻翻社交媒体,到处都是这样的帖子:“这套工作流,批量产出优质 AI 歌曲”,“秒过音乐人申请教程”,“分享我用 AI 音乐赚来的创作收益”……说实话,AI 现在搞出来的音乐,离“如听仙乐耳暂明”还差得远。有些内容也是真多,供过于求,听多了难免觉得腻味。但得承认,它生成的质量评分,已经远超大众的平均水平。在某些场景下的应用价值和创造性价值,绝对不该被忽视。 面对来势汹汹的 AI 音乐,网易云、QQ音乐这些平台也没闲着,专门开放了 AI 音乐专区,积极应对。 这一两年,AI 的火从文字烧到图片,又烧到视频、音乐……现在,轮到播客了。 其实用 AI 做播客这件事,这几年一直有人在摸索。但最近大家的热情,被谷歌一款产品的新功能彻底点燃了。 **NotebookLM**,一款 2023 年 9 月上线的 AI 笔记产品,靠着最新的文本生成播客功能突然走红。这可不是简单的 TTS(文本转语音),它能把你上传的任何资料,都转化成轻松愉快的双人对话播客,效果逼真到让人怀疑是不是真人在聊。 Andrej Karpathy 大佬就认为,NotebookLM 是当前非常引人注目的产品形态,甚至有几分当年 ChatGPT 的英姿。墨问西东的创始人老池也感叹,NotebookLM 是新一代的笔记产品,AI 生成的内容质量确实不错。 其实,谷歌之前还捣鼓过一个叫 **Illuminate** 的东西,专门把学术论文和书籍生成通俗易懂的播客形式,尤其在计算机科学领域做了大量优化。这个产品最早亮相于今年五月的 Google I/O 大会,现在已经对公众开放访问了。如果想要自定义生成,还得申请一下,不过审核速度倒挺快。 犹记得当年没毕业的时候,啃那些难啃的人工智能领域论文,还得跟着李沐老师的视频一点一点学。现在呢?两位配合默契的 AI 老师,就能把你需要的要点娓娓道来。 AI 播客在国内没有大规模爆发,说到底还是缺那么个像样的中文产品——但这只是时间问题。几个月前,有团队就尝试开发 Agent 来实现类似效果,整个流程不算复杂,但如果想达到稳定逼真的效果,还是需要一些工程上的优化手段。大致思路是:把文件里的纯文本提取出来,喂给大模型,让它分段处理并结构化输出,然后分别用 TTS 合成,最后再拼起来。 这里面,关键的三部分包括: 1. **提示词技巧**:需要把输入文本转化成既好懂又有干货的双人对话内容,直接决定内容价值,控制不好就容易泛泛而谈,或者听着太干巴。 2. **底层模型能力**:包括指令遵循和结构化输出能力,要是没严格按 JSON 格式输出,语音合成就无法启动。 3. **语音合成技术**:TTS 的效果直接影响最终体验。只有用上逼真的中文模型,才能让人有听下去的欲望。

相关下载