喜马拉雅联合彩云小梦打造首个讲故事的AI电台,从创作到演播均由AI完成

本文转自:中国网科技
近日 , 国内知名AI续写应用彩云小梦入驻喜马拉雅 , 由其AI续写的小说故事将由喜马拉雅AI主播“喜小道”演播并发布在喜马拉雅平台 。AI续写和AI演播的跨界合作与强强联合 , 使得音频作品从文本到有声 , 均由AI完成创作 。听友们将可以在喜马拉雅上听到由AI创作并演播的脑洞大开的故事 , 感受科技的力量 。
当前 , 以互联网、大数据、人工智能(AI)等为代表的现代信息技术日新月异 , AI技术也越来越成熟 , 并正在深入地运用到我们生活的各个方面 。在内容创作领域 , 如音频内容的创作 , 以往都是先由真人作者创作出文本(文章/小说/诗歌等等) , 再经真人主播演播而成 。
现在 , 就文本的创作而言 , 国内知名AI续写应用“彩云小梦”已经可以实现小说故事的AI创作 。彩云小梦是基于大规模语言模型自研的自然语言处理模型 , 是一个能够进行各种类型文本创作的人工智能:只需要给彩云小梦一个1-1000字的开头 , 它就能为你续写出后面的故事 。2021年9月 , 彩云小梦在苹果商店上线 , 获评当月月度最佳应用 。彩云小梦此次官方入驻喜马拉雅 , 其专辑节目中的作品均由AI续写创作而成 。
喜马拉雅联合彩云小梦打造首个讲故事的AI电台,从创作到演播均由AI完成
文章图片

文章图片

而将文本通过AI智能技术有声化 , 则是喜马拉雅的强项 。在音频领域 , 将文本转换为语音的技术统称为TTS技术(Text-to-speech , 语音合成) , 喜马拉雅音频算法团队自研的TTS框架目前已处于行业领先水平 , 其TTS前端文本处理分析模块已经能够高精度、全自动地对文本进行多音字识别、韵律预测和风格分类 , 并已开发出可以实现多情感、多风格、多语种声音的TTS技术模型 , 不仅可以演绎不同情绪的文字 , 还可以自动区分旁白、对白 , 并支持英文 , 极大地丰富了TTS能表达的情感和韵律 。
喜马拉雅此次与彩云小梦续写AI合作的AI主播“喜小道”就是基于喜马拉雅自研的TTS框架 , 并采集头部主播“喜道公子”的真声打造而成 。在此次合作中 , 彩云小梦入驻为喜马拉雅旗下网文创作平台奇迹文学的写手 , 同时将其作品经“喜小道”有声化后 , 发布在喜马拉雅平台 。AI续写和AI演播的跨界合作与强强联合 , 使得音频作品从文本到有声化的创作 , 均由AI完成 , 登录喜马拉雅搜索“彩云小梦”即可收听由AI创作和AI演播的小说故事 。
除AI主播“喜小道” , 目前 , TTS技术已经支持喜马拉雅在相声评书、电子书、新闻等领域实现了突破 , 能够高效地将新闻、书籍和文章中的大量文字信息转为音频 , 这些TTS内容在上线后也获得了较大的收听量 。比如 , 2021年 , 喜马拉雅用TTS技术完美还原单田芳先生的声音 , 并首次将单田芳先生的AI合成音应用于风格各异的书籍 , 用单式评书腔调 , 全新演绎听众耳熟能详的经典之作 , 至今 , 喜马拉雅上已有80多部运用还原自单田芳先生声音制作的专辑 。同时 , 随着众多主流媒体入驻喜马拉雅 , 媒体们纷纷借助喜马拉雅TTS技术加速制作新闻类音频节目 , 让听众有了更多的渠道听到更权威的新闻 。值得一提的是 , 运用TTS技术重现单田芳声音版本的《毛氏三兄弟》和历史类作品 , 其声音完播率远超过普通人声作品 , 这也为未来出版物大量有声化提供了新的解决方案 。
喜马拉雅联合彩云小梦打造首个讲故事的AI电台,从创作到演播均由AI完成
文章图片

文章图片

随着AI技术的发展与成熟 , 其丰富的知识图谱、自生成以及涌现性的特征 , 为内容创作带来变革:提升内容创作效率的同时 , 也让内容本身变得多样而丰富 。在喜马拉雅平台上 , 已逐渐形成UGC、PGC、PUGC的音频内容和创作者生态 。喜马拉雅在TTS技术领域的深耕 , 也带动着音频行业以语音合成技术为基础的AIGC内容的产出 , 这将进一步丰富喜马拉雅原有的UGC+PGC+PUGC的音频生态 , 除真人主播外 , AI主播的出现也让喜马拉雅创作者生态变得更加多元 。