网上已经有很多关于数字虚拟人(以下简称虚拟人)形象为什么是女性的讨论,有科学家认为,从直觉上看,早期虚拟人呈现并不完善,女性第一视觉能够让虚拟人更人性化,更亲近。还有人说因为大部分虚拟人设计都是技术男,所以虚拟人的形象更多的是女性。还有人说好看的女性形象在现实中男女都喜欢等等。
事实上虚拟人的产生是交叉融合了各类学科,包括计算机图形学、机器视觉、社会学、心理学、人工智能、虚拟现实、人体学、艺术、认知科学等领域。
虚拟人的演进其实和生物进化一样,就像细胞没有性别,虚拟人的底层架构同样没有性别。也必然会发展到在某一个领域,或者某个阶段让人们感觉到虚拟人的角色呈现大部分是女性的感觉。
首先虚拟人创建过程中在底层架构上的数据建模是覆盖男女性别、和不同肤色的人的。
以下的插图来自早期虚拟人建模相关的论文:
虚拟人建模与表情动画的研究插图
虚拟人表情复现技术研究插图
智能虚拟环境中的虚拟人情感仿真研究插图
研究方向包括虚拟人的形体动画、3D头部构建、面部设计、表情动画和复制等研究分析。
我们看到从面部模拟、表情管理以及情感仿真等相关研究,其背后并没有区分性别。
但是当虚拟人一个最重要的目标是要和现实中的人实现互动。随着虚拟人的架构、设计、情感、外观等不断进化,当不同的技术集合起来,当不同理念的科学家、设计者、艺术家参与进来,自然造就了千姿百态的虚拟人形象。
百度数字人平台“曦灵”上打造的AI手语主播、航天局火星车数字人祝融号、百度虚拟代言人希加加、百度APP代言人龚俊数字人其展现不仅仅是数字人,还包括数字物等。
可以看到从底层设计之初上,虚拟人在建模、创建的过程中,完全是集合了不同性别和不同肤色的人脸和情绪等采集。我们在咨询了微软、百度等虚拟人专家,从事实和实际操作角度来讲,不管是小冰,还是百度,男女虚拟人的研发比例也是接近一半一半的,大家为什么从外界的观感会是觉得女性更多?
有专家认为,从科幻、影视等创造的AI形象会模糊大家的感官,让大家认为女性偏多。但是如果我们再往游戏领域看,包括早期的魂斗罗、街机等角色和声音还是男性为主。但是现在二次元文化下,好像女性特征又偏多,所以在不同历史阶段,数字人的角色可能会发生偏差。总体而言,在商业领域,根据行业不同、职业不同,虚拟人在构造过程中还是呈现多样化的。
但是在目前的服务领域,一旦商业价值出现,虚拟人就会向着高价值的方向演进。也就是这些领域,女性虚拟人出现的比较多。这是因为女性化特点具有一些先天优势,包括具有人机交互过程中的丰富的情感性,从而进一步提升人机交互效率。
比如数字客服等。如下图,百度推出的服务型数字人。服务型数字人包括数字员工、虚拟员工、虚拟业务员等,可以帮助金融、运营商、政府、零售等行业提供基于数字人的新一代客户服务能力,解决排队长、回应慢、人力成本大等问题。
比如不久前,万科集团推出一个虚拟人形象崔筱盼,是基于小冰框架的虚拟人类之一,形象干练,颜值也很高。
(数字虚拟人崔筱盼)
崔筱盼入职了万科集团财务部,经过有效的训练,具备了实际的工作能力,负责催办预付应收逾期单据的工作,由于她是纯粹的人工智能,负责催办的核销率达到了91.44%。可以说是颜值和AI结合的典范。
当然,如果女性指的是“美”,那么虚拟人必然是朝着女性发展。我们知道作为一个工程师,最大的成就就是不断的创新和挑战。包括虚拟人设计也是如此,如果有两个虚拟人物设计,一个是光头、素衣、面无表情的大汉。一个是长发飘飘、唐装宋衣、喜怒哀乐表情丰富的女性,是想,哪个工作能带来价值感和成就? 当然是后者了。
从创新角度看,越来越细腻的虚拟人展现也要求虚拟人创作设备的不断迭代和相关知识的融合。因为实现虚拟人除了硬件需要越来越强的算力之外,还需要很强的数字制作能力和渲染相关的专业能力,以及包括对人体结构、表情对应、声学相关的专业能力。
比如人眼对于立体的感受90%大部分是来自光影效果。现实中长发飘飘的头发在阳光照射下会产生非常美丽的展示,这是因为光在细微之处会产生奇怪的效果,光的衍射效果可能让你看到光,而不是细发。从不同角度看到的头发细节是不同的。但是要通过机器实现逼真的渲染效果,最大的挑战是解决光的物理现象,如何实现光影效果下的逼真显示。
比如经典的虚拟形象“最终幻想”,早期头发的渲染生成花费了三年的时间。当然现在随着实时光线追踪技术的成熟,和GPU的迭代,渲染时间不仅大幅度减少,而且渲染效果也更加的逼真。
写在这里,我们看到虚拟人的演进方向其实跟性别并没有什么关系。我们在引申到生物界,如果虚拟角色是鸟呢?我想大部分虚拟鸟的角色都是雄性的。
(在自然界中,大部分雄性的鸟更鲜艳)
如果是虚拟狮子呢,我想雄性狮子在设计过程中更具挑战,因为雄狮颈部需要设计明显的鬃毛。
最后,虚拟人技术发展速度会怎么样,一方面是硬件包括GPU等算力工具的不断升级,一方面是工程师对于架构和设计的不断挑战。 未来把现实人体的高度逼真的数字化技术到底会导致什么样的新发展或者带来怎样的新问题,目前还不得而知。但是目前能看到的是,因为人类是具备基础情感和复杂情感的碳基生物,人类的行为也具有非确定性和复杂性等特点,让人机交互时间一长,人们对于虚拟人所表现的互动能力会急剧下降,表现了情感空洞、呆滞、单调等特点。
当然我们能看到的是基于硅基的虚拟人进化还是远远快于基于碳基生物的人类。
我们人类这些情感和行为的演进是经历了漫长的岁月。仅仅是古猿人从打造尖尖的、圆圆的、椭圆的、长条的带有规则和定性的具体化的石器演进到山顶洞人把小砾石、动物的牙齿、骨头磨制到相同的大小串在一起当做“装饰品”,就经历了数十万年。
《美的历程》插图
而对简单的石器进行加工还不能称之为现代人,只有真正的对形体的光滑规整、对色彩的感受以及对事物的同一性有了最早的朦胧理解、爱好和运用,只有对“装饰品”进行自觉加工的所谓精神生产、意识形态的产物出现,也就真正产生了—图腾,人才真正称之为人。
虚拟人未来能不能实现精神生产和意识?值得人类去思考!
好文章,需要你的鼓励
如果大家正在考虑升级自己的x86服务器机群——目前确实有不少企业、超大规模基础设施运营商和云服务商都在持币参与讨论——那么好消息是,英特尔和AMD均已推出其有史以来最强大的串行计算引擎。
成立于1920年的NFL是美国最受欢迎的体育联盟,由32个特许经营球队组成,这些球队每年都会在世界上最大的年度体育赛事——超级碗中展开角逐。思科一直是NFL的官方企业网络合作伙伴和官方网络安全合作伙伴,为联盟及其运营提供连接和保护。每个NFL体育场的回放控制室都采用了思科的技术,并通过思科网络连接到纽约的Art McNally Gameday中心。几乎所有的联盟官方合作伙伴和三分之二的NFL体育场都采用了思科技术,包括举办超级碗 LX的李维斯体育场(Levi's Stadium)和举办超级碗LXI的 SoFi 体育场(SoFi Stadium)。
大约有70%的企业正在使用ChatGPT进行软件开发活动,65%的企业正在聘用MSP来推动很多他们的生成式AI计划。投入资金最多的生成式AI用例是客户服务聊天机器人,有53%的企业表示,这是他们的首要的生成式AI优先事项,而最常见的生成式AI用例则是IT测试自动化。
目前AI的发展还处于早期阶段,青云坚信算力不仅是无限的,也是跨领域的。青云将持续与合作伙伴形成合力,为人工智能发展添砖加瓦。