语音合成的用途-Kefei的记事本

https://www.ruanyifeng.com/blog/2020/04/weekly-issue-104.html

谷歌2018年发表了一篇论文，只需要5秒的真人语音，就可以提取语音特征，然后任何文本都可以转成该人的语音。

https://google.github.io/tacotron/publications/speaker_adaptation/

上面的链接有这种技术合成的很多语音示例，大家可以去听一下，很惊人。

这种技术要是推广开来，其实挺危险的。我知道一件真人真事，一个同事有一天接到诈骗电话，声称他的小孩被绑架了，要求支付赎金。当然他没有上当，但是如果那些骗子用了谷歌的这种技术，电话里播放一段他儿子的合成语音，恐怕就很容易相信了。

我还想到一个用途。以后人死了，他的声音还活着，结合人工智能，就可以跟死去的人进行虚拟对话了。

美国作家菲利普·迪克写过一本科幻小说《尤比克》（Ubik）。他想象在未来世界，人死后还可以继续以脑电波的形式"存活"一段时间。人们将死去亲友的身体冷冻保存在亡灵馆，活人通过脑电波装置与亡灵的脑电波"对话"。

我觉得，现有的技术已经可以实现这个预言了。一个人的生理特征、行为习惯、写过的文章、说过的话，都可以输入计算机生成模型（英语叫做 avatar），得到一模一样的外貌、语音、思考方式、一举一动。其他人跟这个 avatar 互动，好像跟本人互动一样。

这种模型可以商品化，就像上面说的，人们会愿意购买过世亲人的 avatar，让亲人还活在我们身边。某些名人的 avatar 肯定具有巨大的销路，喜爱偶像的青少年以后不会去听演唱会，而是购买偶像的 avatar，想听什么歌就让它唱给你听。电商平台也会推出排行榜，本周最畅销的 avatar 是谁、又有哪些新进榜等等。

目录CONTENT

语音合成的用途

评论区