侧边栏壁纸
博主头像
Kefei的记事本博主等级

好脑瓜不如烂笔头

  • 累计撰写 219 篇文章
  • 累计创建 11 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

语音合成的用途

Administrator
2024-12-19 / 0 评论 / 0 点赞 / 4 阅读 / 1536 字

https://www.ruanyifeng.com/blog/2020/04/weekly-issue-104.html

谷歌2018年发表了一篇论文,只需要5秒的真人语音,就可以提取语音特征,然后任何文本都可以转成该人的语音。

https://google.github.io/tacotron/publications/speaker_adaptation/

上面的链接有这种技术合成的很多语音示例,大家可以去听一下,很惊人。

这种技术要是推广开来,其实挺危险的。我知道一件真人真事,一个同事有一天接到诈骗电话,声称他的小孩被绑架了,要求支付赎金。当然他没有上当,但是如果那些骗子用了谷歌的这种技术,电话里播放一段他儿子的合成语音,恐怕就很容易相信了。

我还想到一个用途。以后人死了,他的声音还活着,结合人工智能,就可以跟死去的人进行虚拟对话了。

美国作家菲利普·迪克写过一本科幻小说《尤比克》(Ubik)。他想象在未来世界,人死后还可以继续以脑电波的形式"存活"一段时间。人们将死去亲友的身体冷冻保存在亡灵馆,活人通过脑电波装置与亡灵的脑电波"对话"。

我觉得,现有的技术已经可以实现这个预言了。一个人的生理特征、行为习惯、写过的文章、说过的话,都可以输入计算机生成模型(英语叫做 avatar),得到一模一样的外貌、语音、思考方式、一举一动。其他人跟这个 avatar 互动,好像跟本人互动一样。

这种模型可以商品化,就像上面说的,人们会愿意购买过世亲人的 avatar,让亲人还活在我们身边。某些名人的 avatar 肯定具有巨大的销路,喜爱偶像的青少年以后不会去听演唱会,而是购买偶像的 avatar,想听什么歌就让它唱给你听。电商平台也会推出排行榜,本周最畅销的 avatar 是谁、又有哪些新进榜等等。

0

评论区