李威克挑战N小黑,虚拟人真实自然天花板之争的背后

原创 收藏 评论
举报 2021-12-27

文 | 曾响铃

来源 | 科技向令说(xiangling0815)

1992年,科幻作家尼尔·斯蒂芬森在《雪崩》里提及了两个概念,“Metaverse(元宇宙)”与“Avatar(化身)”。

今天,市场为这两个概念,都“疯”了一般。

元宇宙,自不必说。

“Avatar(化身)”也同样迸发出惊人的爆发力。

从爱酱到A Soul、从阿凡达到柳夜熙、从数字孪生黄仁勋到小扎,从艾灵到华智冰、夏语冰,虚拟人正在以前所未有的速度走红、出圈,迎来井喷式爆发。

近期,虚拟人产业界又爆出惊天大消息——继上次真假难辨,被认为是虚拟人技术天花板的每经AI主播N小黑走红刚一周,小冰公司又联合北影世纪(北京)教育咨询集团旗下的数字人类公司,打造了表现力更胜一筹的数字孪生CEO李威克。

“我原以为‘N小黑’已经天下无敌了,没想到此人比他还要‘勇猛’。”一场虚拟人之间真实自然度的天花板对决再度拉开。

而当这些虚拟人在不断追求技术的极致表现时,或许一个商业爆发的虚拟人时代就离我们不远了?!

看似差不多的虚拟人,也有“三教九流”?

数字孪生CEO李威克是首个登场于影视和数字营销赛道的数字孪生虚拟人,其真实自然度甚至要比N小黑要更胜一筹。

1.png

数字孪生CEO李威克

此前,N小黑上线直播了70多天,竟无一人发觉站在台前的是一个虚拟主播。

甚至,还有人发问“节目24小时都在做,半夜也直播,你们得给主播多少加班费?”

2.png

数字孪生主播N小黑

而直到N小黑在节目中“自爆身份”之后,大家才恍然大悟,直呼“没想到,如今的虚拟人已经真实到真假难辨的程度”。

谁曾想,长江后浪推前浪啊!

如今,数字孪生CEO李威克在面容、表情、肢体动作等表现上甚至比N小黑都更真实自然,近乎本尊出镜,不断挑战着N小黑的地位。

不过,话又说回来,究竟什么是数字孪生虚拟人?如此强大!

值得一提的是,当前柳夜熙大火,身为影视和营销跨界老炮的李威克,为何会选择数字孪生虚拟人来作呈现,而不是CG?

正所谓,外行看热闹,内行看门道。

这里面的“道道”可多着呢。

尽管市面上的虚拟人角色很多,但是其背后的技术支持实则都不尽相同。

当前大火的Ayayi、柳夜熙等实际都是动作捕捉结合中之人实拍,用CG换脸加特效呈现出来的形象,而撒贝宁的虚拟主持搭档“小小撒”、新华社数字记者小诤等,则是通过CG形象建模,声音建模,再加上Audio2Face等机器学习方法驱动的虚拟人。

而AI与CG融合度越高,则虚拟人的真实度、自然度以及自主性也就越高,小冰公司联合每日经济新闻打造的N小黑、N小白,以及数字孪生CEO李威克在深度神经网络渲染技术(XNR)等支持下,呈现出来的效果优势也就更加明显。

由此,数字孪生CEO李威克登场的背后,实则又是一次技术的进阶。

N小黑走红、李威克登场的背后,数字孪生虚拟人为何密集登场?

如今,从N小黑、N小白走红到李威克登场,短短的时间间隔之内,数字孪生虚拟人的登场愈发频繁,一个AI being时代加速而来。

在这一切的背后,核心技术的突破究竟解决了虚拟人产业的哪些问题,使得产业的齿轮能如此加速运转?

回到虚拟人产业的痛点上,我们一一拆解。

首先,我们需要明确的是,创造虚拟人其实并不难,十几年前就有,比如2007年诞生的虚拟偶像“初音未来”,难就难在如何让虚拟人看起来足够的真实自然。

客观来看,对比最新的数字孪生CEO李威克与早前的虚拟人角色,几乎可以说是两个不同的物种。

之所以能拉开这么明显的差距,是因为小冰公司采用的深度神经网络渲染技术(XNR)与CG融合后,能基于深度学习的三维场景表达和对应的神经渲染管线,在特定场景中发挥作用,让数字孪生虚拟人的面容、表情、肢体动作更加真实自然。

同时,这项技术还可以充分利用深度学习,从大量数据中提取数据先验,实现更快速的渲染,降低虚拟人的制作成本。

要知道,做到同等真实自然度的柳夜熙,一个月更新一条,其1-2分钟内容成本就已经逾百万,从成本上来看很难持续。而过往的电影CG制作也大多存在这样的问题,成本高且周期长。

如今,在技术的迭代下,这一限制也逐渐被消解。

其次,虚拟人的自主性也非常重要。此前的虚拟人大多缺乏自主性,可落地的场景也少,往往需要提前“彩排”或“人工牵引”,才能完成一系列产业化的操作流程。

就虚拟主播而言,能否实现不用人工干预的、端到端的生成实时流媒体,是一个重要的应用考量。

小冰公司的N小黑、N小白与其他虚拟主播的不同就在于其自主性。

在N小黑、N小白“工作”期间,从金融资讯的文本生成,到通过预训练的虚拟主播实现音画同步播报,再结合同步场景动态绘制,最终生成完整的直播推流,这些全部都是由AI完成,完全不需要人工介入。

在全球范围内,这是自动化AI采编播全流程的首次实现,也是虚拟主播自主性的一次重大突破。

由此,当数字孪生虚拟人越来越接近于人的“自主性”,更自主也就更有用,能发挥出人的劳动价值,产业驱动或许将迎来更多的数字孪生虚拟人的出现,也是可以预见的。

最后,虚拟人的制作周期问题,也很重要。

为什么以前的数字孪生虚拟人没办法密集登场?先来看一个例子。

“黄仁勋”背后的英伟达团队,为了实现“黄仁勋”短短15秒的的亮相演示,由数十位工程师花费了几个月的时间进行AI与CG的融合创造,其中的训练周期、后期优化达到了数月之久。

这就是为什么有的数字孪生虚拟人只能“昙花一现”,因为真的太久了。

如今,这个问题终于得到了解决。通过小冰框架小样本学习技术,N小黑、N小白两个虚拟主播只需要一周的训练周期即可完成。

对比来看,这一问题的破解大幅降低了虚拟人的制作门槛,周期长、成本高的问题逐一解决,故而小冰公司CEO李笛表示:“一个永不疲倦、安全可靠、稳定输出的AI Being时代已经到来。”

数字孪生虚拟人的商业潜力

数字孪生虚拟人加速而来,而数字孪生虚拟人的市场能否如期而至?其背后的问题是,虚拟人能带来多大的商业价值?

昨天在保时捷中国的微信朋友圈信息流广告中,虚拟人Ayayi出镜,引发新一轮朋友圈的热评。

3.png

这一次是Ayayi,下一次又将是谁?虚拟人的营销话题度持续高涨。

同时,以数字孪生CEO李威克登场为代表,影视工业和营销行业都同时盯上了数字孪生虚拟人,并选择了AI与CG融合的道路。

那么,在数字孪生虚拟人的背后,实则正在孕育出一个庞大的市场。

其中,李威克也是小冰公司基于深度神经网络渲染融合CG呈现出来的最新成果。由此可见,技术正在带给这个市场无限的商业可能性。

从数字孪生虚拟人层面来看,区别于现实的本尊,数字孪生虚拟人具备比本尊更多的可能性,比如语言能力。

在现实生活中,一个人所能掌握的语言是有限的,但数字孪生虚拟人不同,得益于AI的自然语言处理能力,能轻松学习不同语言,实现多语种的输出。

这个功能目前已在实测,未来或许我们无法掌握多门语言,但是我们的数字孪生虚拟人却能轻轻松松的掌握70国语言都并非难事,只要历经简单的数据采集、训练、渲染和驱动。

从产业应用层面来看,数字孪生虚拟人在技术的支持下,具备了更多可迁移应用的可能性。在每日经济新闻里,小冰公司将虚拟人打造成为了365*24小时主播。而面向其他场景或行业,底层的技术经过迁移结合其他行业的知识体系,便能继续创造等同于行业专家的数据孪生虚拟人。

现在,小冰公司正依托全球承载交互量最大的完备人工智能框架之一“小冰框架”在自然语言处理、计算机语音、计算机视觉及人工智能内容生成等技术方面持续迭代,从而夯实技术基础,打通数字孪生虚拟人应用于各行各业的服务路径。

可以预见,未来的数字孪生虚拟人不仅更真实自然,接近本尊,还将更强大且专业,超越本尊。

那么,当一个数字孪生虚拟人具备这些成熟的条件和能力,其商业潜力或许也将是难以估量的。

而如今,不管是李威克的登场,还是N小黑的走红,两者竞争虚拟人真实自然度天花板的背后,就已经预示着虚拟人日趋成熟,正在迎来商业爆发的前奏。

*本文图片均来源于网络

*此内容为【科技向令说】原创,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

【完】

曾响铃

1钛媒体、品途、人人都是产品经理等多家创投、科技网站年度十大作者;

2虎啸奖评委;

3作家:【移动互联网+ 新常态下的商业机会】等畅销书作者;

4《中国经营报》《商界》《商界评论》《销售与市场》等近十家报刊、杂志特约评论员;

5钛媒体、36kr、虎嗅、界面、澎湃新闻等近80家专栏作者;

6“脑艺人”(脑力手艺人)概念提出者,现演变为“自媒体”,成为一个行业;

7腾讯全媒派荣誉导师、多家科技智能公司传播顾问。



本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
本文系作者授权数英发表,内容为作者独立观点,不代表数英立场。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本内容为作者独立观点,不代表数英立场。
本文禁止转载,侵权必究。
本文系数英原创,未经允许不得转载。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    DIGITALING
    登录后参与评论

    评论

    文明发言,无意义评论将很快被删除,异常行为可能被禁言
    800

    推荐评论

    暂无评论哦,快来评论一下吧!

    全部评论(0条)