首页 人工智能

AI语音真假面:你的“声音DNA”可能会被复制

 

如果有一种技术可以一秒复制或模仿你讲话,你会感到惊喜还是惊恐?

进入2019年,AI技术的应用落地越来越多样化。科大讯飞、搜狗等技术公司相继发布了语音合成技术的应用。通过AI手段,用户可以一秒变声社会名人或者其他想模仿的声音。

互联网技术在悄无声息地改变我们的生活,对人工智能企业来说,语音识别技术的广泛应用已不是难事。但背后的伦理道德和安全隐患,或将成为伴随AI技术发展不容忽视的一个问题。

实时变声技术受AI公司热捧 一秒可换声

“嗨,大家好,今天非常开心,来到科大讯飞新品发布会,一直好喜欢科大讯飞哦……”

这是发生在科大讯飞2019新品发布会上的一幕,科大讯飞董事长刘庆峰通过技术,现场模拟了单田芳、林志玲和罗永浩的声音来做开场白。尤其当罗永浩声音响起的时候,不少人以为老罗到了现场。

“你看到的是刘庆峰,但听到的是老罗的声音。”台上的刘庆峰表示,这是公司最新的实时变声技术。据悉,这项新的语音合成技术只需要1分钟的声音样本,就可以模仿任何人说话。

不止科大讯飞,也是在近期,搜狗CEO王小川在一场大会上展示了搜狗变声功能,通过手机软件,王小川模拟了高晓松和东北妹子的声音,引得现场连连发笑。他随后展示了歌曲中的声音替换,据介绍,系统先用14分钟对他的语音做了训练,然后把音色做迁移。

这是搜狗最新的语音合成技术,可以实现把任何人的声音转化成特定声音,秒变林志玲、马云的声音都可以。王小川表示,这不只是一个简单的语音合成,可以把语音语调情感做迁移。

目前,在搜狗输入法中,用户可以将自己的声音自由变换成喜欢的声音,在微信、QQ、陌陌等主要社交场景均可使用。搜狗提供了明星、卡通人物、游戏 IP、方言等几个类别供19种特定声音。

王小川

王小川

其实,语音合成早就不是新技术,之前,我们见到更多的是将文字转化为声音,比如在导航、转写、智能音箱、Siri等智能语音助手等方面的应用,并不是真人在说话。

今年,很多AI公司发力语音合成在变声、语音cos等场景下的应用,将真人发出的声音转化成特定声音。

百度也有相关技术的落地应用,今年5月初,在中央电视台公益节目《等着我》中,百度大脑基于智能语音技术,合成了已故老兵的声音,帮助分别64年的老战友实现“重逢”。

据介绍,该技术使用百度端到端语音风格分离和建模方案,使用多组神经网络对语音的不同维度,例如音色、情感、风格等,进行独立的编码建模,从而指导最终合成。

这些AI技术落地应用的背后,一方面体现了AI技术应用的进展,和为社会带来的普惠价值理念。比如搜狗将语音变声技术、AI合成主播技术等与行业结合,在媒体、教育、内容制作、旅游等场景结合,将会带来更大的价值想象空间。

另一方面,未来可能存在的技术漏洞、技术滥用等风险也不容忽视。有网友就指出“小心被用于电信诈骗”“以后可能会收到‘马云’的电话”……

一音频领域业内人士认为,对于音频作为交互方式的工具型产品应该是有用的,但对于音频作为内容载体的线上音频平台,正面意义有待观察。

因此,对企业来说,在不断寻求技术突破和商业价值的同时,也应该树立对技术安全的责任心。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多