京东数科AI主播上岗,仅需几小时就可以合成新角色
admin
2021-01-06 17:03:41
0

原标题:京东数科AI主播上岗,仅需几小时就可以合成新角色

“大家好,我是小妮,诞生于京东数字科技集团AI实验室。用你们人类的话说,我是AI主播。没错,来自虚拟世界的我喊你上课啦!”字正腔圆、细腻逼真的AI主播近日亮相于京东数科产业AI公开课。这是京东数科自主研发的AI虚拟数字人产品首次出现在公众面前。据介绍,京东数科融合了2D和3D技术,将传统方法与深度学习结合,仅需使用一段几分钟的人物视频数据,经过几小时训练就可以合成出写实风格的AI虚拟数字人。

京东数科AI主播上岗,仅需几小时就可以合成新角色

京东数科自主研发的AI主播

为了研发出写实逼真的AI虚拟数字人,京东数科AI实验室在文字转语音、3D人脸建模、语音转视频等方面进行了一系列技术创新。

为了顺利实现文字到语音的转化,京东数科自研了轻量级对抗语音合成技术,通过结合深度神经网络在多人数据上进行个性化建模,达到音色丰富、特色鲜明的语音合成效果,甚至可以模拟人的呼吸和停顿,听感酷似真人。高效轻量的对抗神经网络大幅提升了合成速度,合成1秒音频只需0.07秒,合成时延仅为业界水平的1/3,充分支持多场景实时语音合成。

在语音生成视频的阶段,为了使AI主播形象更加逼真,京东数科AI实验室利用对抗生成网络来还原更真实的表情,通过3D模型运动追踪技术来确保AI主播在说话时口型准确、表情细腻、头部运动自然。一般来说,2D类的模型往往能生成更细腻的画质,而3D方向的模型操控能力更佳;京东数科的技术人员打通了这种模式上的壁垒,在2D和3D模型之上各取所长,将最新的深度学习技术与传统的优化技术和特征提取技术相结合,使语音、图像、视频这些模态间的语义打通成为可能。从实际效果来看,AI虚拟数字人能够模仿不同人的说话习惯,学到如何用点头、眨眼这些细微动作对发言中的重要内容加以强调。为了在口型匹配方面达到完美效果,京东数科AI实验室利用大量语音数据,并特意设计了鲁棒的语音特征,使其可以被不同音色、语言和语速的合成语音所驱动,且都能保持准确、连贯的口型。

最终,京东数科开发出了高度还原真人形象的AI虚拟数字人,在AI算法的驱动下,只需输入文本内容,“小妮”就能根据语义实时进行主持,且表情、动作和语音表达非常自然逼真。

除了AI主播,AI虚拟数字人还可以在多场景中落地生根。比如,在重复性很高的智能客服场景中,人工客服具有人工成本高、质量参差不齐等缺点,用AI虚拟数字人代替人工客服,可大幅提升整体客服效率和服务体验。再比如,在招聘场景中,对于公司介绍、薪资福利、入职流程介绍、招聘者基础信息确认等环节信息重复度高,这时就可使用AI虚拟数字人替代HR进行交互回答,有效节省人力,提升公司的科技感。

京东数科AI实验室首席科学家薄列峰表示:“AI主播小妮的推出,是京东数科在多模态AI技术领域一次成功的落地应用。除了在客服、招聘等领域的应用之外,我们还将服务内容创造者,通过AI虚拟数字人技术,把静态图文内容转化为由‘真人’讲解的短视频,满足用户对多样化呈现形式的需求,增强用户黏性和社区活跃度。”

—————————

(市场有风险,投资需谨慎。本文信息仅供参考,据此投资交易风险自担。)

相关内容

热门资讯

插上科学的翅膀飞作文800字 插上科学的翅膀飞作文范文800字(精选60篇)  在现实生活或工作学习中,大家最不陌生的就是作文了吧...
神奇的百变魔衣作文800字 神奇的百变魔衣作文800字  时光飞逝,一转眼就到了2035年,这时的我已经成为了一名举世闻名的科学...
一张老照片作文600字 一张老照片作文600字(精选29篇)  无论在学习、工作或是生活中,大家对作文都再熟悉不过了吧,作文...
关于跑步比赛的作文 关于跑步比赛的作文(精选8篇)  在日常学习、工作或生活中,大家总免不了要接触或使用作文吧,借助作文...
中秋晚会作文 中秋晚会作文八月十五那天,学校举行了篝火晚会,令全校同学精神振奋。吃完晚饭之后,我们就开始了猜谜活动...
我爱我的校园作文 我爱我的校园作文(精选10篇)  在平凡的学习、工作、生活中,大家总少不了接触作文吧,作文是一种言语...
太空嘻哈鸭作文 太空嘻哈鸭作文  在学习、工作或生活中,大家都跟作文打过交道吧,借助作文可以提高我们的语言组织能力。...
我的朋友作文500字 我的朋友作文500字三篇  朋友一生一起走,那些日子不再有。以下是小编为大家整理分享的我的朋友作文5...
老师作文 老师作文800字(通用5篇)  在平凡的学习、工作、生活中,大家都写过作文吧,作文是通过文字来表达一...