本站7月12日消息,据媒体报道,微软公司近期成功研发了一款名为VALL-E2的革命性AI语音生成技术,该技术的问世标志着AI语音合成领域的一个重大突破。仅需短短三秒钟的音频样本,VALL-E2便能以前所未有的精确度与自然度,复现出说话者的独特声线,其表现几乎达到了以假乱真的人类水准。
科学家表示,这是AI语音首次达到人类水平,由于太过危险,无法向公众发布。
鉴于当前AI语音诈骗案件频发,该技术若落入不法分子之手,可能加剧此类犯罪的风险,诈骗者能够轻易克隆他人声音,进行高度逼真的电话诈骗,诱导受害者进行财务交易,造成巨大经济损失。
与此同时,VALL-E2技术的快速发展也对传统声音演员行业构成了挑战。声音演员们担心,随着AI语音合成技术的日益成熟,他们的声音可能被轻易复制并用于各种场合,而他们所应得的经济补偿却难以得到合理保障,这无疑对他们的职业生涯构成了潜在威胁。
尽管VALL-E2 AI语音生成器不会对公众开放,但也证明了AI在这方面的技术进步,以及未来在合适的时候可以应用,包括教育学习、娱乐、新闻、聊天机器人等。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:goldenhorseconnect@gmail.com