ai软件 迅雷下载中文版免费搜狗“变声”声音响彻会场:AI第一大厂,Google还没做到

5月25日,成都,“高晓松”声音响彻会场,欢迎听众参会:

大家好,欢迎来到极客公园2019年现场和你们一起分享人和机器的共创未来。

但实际站在表演中央的人,却是王小川。

王小川,搜狗CEO,成都七中顶尖校友,中国互联网进程里最知名的川娃子,中学时代就打响了IT天才名气,后来又在历史际会造就出一方天地。

目前,因一场活动,王小川带着一项世界领先的科技继续重返上海,没错,就是那一声“高晓松”的欢迎。

由于它在秒秒钟经过手机App前,还是王小川的原声。

搜狗“变声”,颠覆性进展

通过计算机合成某一个人的“声音”,自然在AI江湖里算不上哪个。

但即使真正实现“千人千声”也能瞬间“迁移”,并且在小小手机上实现,那确实得竖大拇指。

因为全球AI第一大厂,Google,也还没做到。

就在一年一度亮肌肉的GoogleI/O上,也有“变声”方面的进展演示,但表现的是一种语料输入到另一种语义输出的“平行迁移”。

更AI的方法来说,onetoone,从指定A到指定B.

但像王小川展示,无论说话者是谁,无论说哪个,不用考虑说话人的特征(如王小川的“川普”),最后无法将“任意说话人”音色实时高逼真度变换到“指定说话人”音色,则是Anytoone.

该过程中,不光是输入输出两端的映射关系差异,更是科技推动难度上指数级提高。

由于核心难题在于,每一个人的音高、音色和语言节奏都不尽相似,正就像世上没有两片同样的叶子一样,世上也没有两个完全相似的说话人。

如何将“千人千声”通过科技处理,变为同一种指定声音,同时还不丢失原说话人的语言习惯?

离不启动现真正技术的语音表征学习和迁移学习的突破,简要来说三步:

首先,使用表征学习科技学习到源端说话人语音的音效、内容和韵律(演讲节奏、情感语气等信息)三大特点。

其次,将学习到的源端说话人音色特性替换成目标说话人。

免费移动充值话费软件 迅雷下载_ai软件 迅雷下载中文版免费_dj打碟软件中文手机版下载

最终,基于新的语音变声技术,使用内容(源端)、韵律(源端)、音色(目标端)三类特征,合成最终生成变声音频。

然而大会现场,王小川的“说”到高晓松的“声”,实际历程了这种的过程。

虽然,这样一短句,实现背后还有数千层深度学习网络的拼命。

如表征学习使用,上图图示,A部分对目标音色语料进行声纹特点编码,提取说话人的音色embedding。

B和C分别从输入音频中学习内容和韵律embedding,通过“说话人归一化”模块对内容embedding进行统一规整,去除音色信息,通过对音频特征的压缩编码及特性抽取ai软件 迅雷下载中文版免费,学习表征韵律的风格特点。

而语音变声,基于表征学习受到的特点,通过Attention和Decoder模块进行聚类特征编码,并运用WaveRNN神经网络声码器恢复成波形,最终受到具有目标音色的音频。

其实,最具现实含义也最具科技挑战的抑或落地。

这只是搜狗突破称得上颠覆性的理由——这是中国首次将这么难度的变声能力落实到消费级产品中。

以及还不是自家用工具专门定义成为的终端软件,而是融会贯通到小小“搜狗输入法”App中。

通过App,无论安卓还是iOS,无论哪个品牌、何种价位的手机,都能实现“变声”,实时迁移成“表情语音包”。

今后应用自然不止于此。

语音届的“换脸”术

之前,Deepfakes带动的“换脸”已经实现了风靡,哔哩哔哩就出现了不少杨幂出演的《射雕英雄传》,惟妙惟肖,真假难辨。

但相比换脸的道德难题和法律危机,“变声”却能立竿见影创造价值。

凡有音频处,皆能让AI变声发挥效用。

包括在线教育、景点导游、电商广告之类场景的音频制作。

一个有口音的同学,一个普通话不标准的地方导游,以及各类流量奶生。

特别是名气待丰的流量偶像们,雇佣一个熟练掌握“换脸”和“变声”技术的AI团队,就完全能靠脸吃饭,人在家中坐,钱源源不断来。

然而,只要有音频的需求,变声就能减少成本、提高强度。

免费移动充值话费软件 迅雷下载_ai软件 迅雷下载中文版免费_dj打碟软件中文手机版下载

王小川还想以此应用说明,我们正在身处一个如何的技术时代。

跟技术结合,人类能够更强悍。不要自大心怀碾压排斥,而是接受科技的转型和重建,成为新人类,真正人与机器协同,变得更强悍,创造更美丽的今后。

搜狗CEO毫无问题想实现这种的今后。

AlphaGo洗礼ai软件 迅雷下载中文版免费,搜狗进化

在活动上,王小川也再度从AlphaGo讲起。

他觉得这是这个时代的文艺振兴、启蒙运动,让我们开始换另外的全球观看待技术和将来。

针对他自己,这种进化更是明显。

在AlphaGo之后,他就是“机器必胜”的坚信支持者。而AlphaGo获胜后,搜狗CEO更是直接为此开辟了三天“狗胜节”的带薪假。

这些人都说搜狗会借势,但少有人知道王小川的遗憾。

由于在AlphaGo宣布挑战李世石之时,王小川就抱怨过,搜狗内部虽然也仔细探讨过深度学习下围棋的或许性和可行性。

但之后不少项目师觉得应该太多资源、小公司更该务实……最终没有真正展开,直到AlphaGo在Nature上的论文发表,才慨叹思路和技术所见略同。

这让搜狗CEO学到一课:光有务实主义不够,工程师也得展示出敢想敢上的“浪漫主义”那一面。

然而“狗胜节”与其说是纪念,不如说警醒。

这只是搜狗蜕变和进化的开始。

之前搜狗是产品力突出的形象,从浏览器、搜索到输入法,江湖享有名声,特别是输入法,在中国成为“国民应用”。

但目前,搜狗的旗帜也愈发越多出现在中国AI的“华山论剑”中。

中国CoQA机器阅读理解比赛获胜;

世界MegaFace百万级人脸识别竞赛中夺冠;

WMT2017机器翻译顶级评测大赛中英和英中第一;

国际顶尖口语机器翻译竞赛IWSLT决赛第一;

免费移动充值话费软件 迅雷下载_ai软件 迅雷下载中文版免费_dj打碟软件中文手机版下载

《基于模态注意力的端到端音视觉语音识别》中标国际顶尖学术大会ICASSP;

……

另外,还有人工智能应用领域的助推性变革。

包括全球首个AI合成主播上岗新华社、CCTV,以及今天获得突破的“千人千声”变声落地输入法。

还必须提到的是,这只其实王小川和百度将自己的科技色彩更鲜明地亮起来而已。

针对技术、AI的投入,更早之前能够从两件公益大于其它的“投资”事件中窥见一斑。

清华学子的年度AI“华山论剑”——智能体峰会,创办21年的搜狗连续赞助15年,至今都是王小川必会参与的活动。

另一件也跟清华有关。2016年,搜狗向清华捐资1.8万元用于设立“清华学校天工智能计算研究院”,集中研究AI等前沿领域科技。

值得一提的是,最近发表于中国顶会的端到端音视觉语音识别论文,正是百度和北大天工研究院的联手之作。

中国AI创新缩影

最终,也是之后借搜狗重新认知美国AI的演进现状和将来了。

谈论中国AI的之后,恐怕你永远会有这种的印象:中国应用有优势,但基础研究方面差异太大。

但从搜狗“变声”突破和应用来看,一种越来越显著的态势正在展示。

图灵奖唯一华裔得主、清华姚班创始人姚期智教授更是有确切概况,在接受《人民晚报》采访时,姚院士这样说:

国内的人工智能在应用上绝对是杰出的,相对来讲对于算法基础研究没有这么强,但是针对这个难题从大量的看法来看,我还是比较乐观的。

姚期智教授觉得,AI正在变得热门,受到越来越多注重,也有越来越人才投身其中,基础算法和理论研究也都被更集中攻坚。

我认为我们今天没这么强,但是之后的几年我们无法追上。

然而结合王小川和百度的种种努力以及结果,姚期智教授之言,并非纯粹乐观而已。

虽要戒骄戒躁,但也没必要妄自菲薄。

目前局势,我们期望更多创新诞生,既要有自信、也要给细心,同时也要予以更多关注,不吝给每一次突破献上掌声。

0

添加微信

转载原创文章请注明,转载自设计培训_平面设计_品牌设计_美工学习_视觉设计_小白UI设计师,原文地址:http://zfbbb.com/?id=5067

上一篇:人工智能ai炒股软件 海外金融机构率先发展和利用人工智能在股票市场中进行相关投资

下一篇:ai软件打字为什么打斜微信输入法APP“微信键盘”体积惊人为148MB