在刚刚过去的CES 2024期间,没有参展的苹果放出了Vision Pro一系列消息,为这个1月添了不少彩头。
苹果Vision Pro是2024年备受全球关注的一款产品,也是苹果2024年的一款拳头产品,随之而来的,还有元宇宙的复兴。
准确来说,这次应该将元宇宙换成另外两个词,MR和空间计算。
MR、空间计算,外加生成式AI,让人们对2024年的科技发展有了空前的期待。
在这样的大趋势下,王智武决定顺势而为,对元境科技进行一次全面的战略升级,公司名字也由元境科技更名为智境云创。
将数字人装进“盒子”里
王智武是2016年进入虚拟数字人这个行业的,自2019年起,他开始思考如何将虚拟数字人做集成化,这也就有了2021年创立的元境科技。
也是在2021年,Facebook更名为Meta,元宇宙一时成了那一年的科技热词。
王智武在2024年1月18日的发布会上回忆称,“第一次听到元宇宙这个词的时候,我不是特别喜欢,甚至当时都不知道什么是元宇宙。”
他认为,元宇宙这个概念还是太宽泛了,一个让他记忆深刻的例子是,元宇宙火起来的时候,王智武家门口的超市管理人员,将超市的名字都改成了元宇宙超市。
尽管如此,元境科技成立之初,王智武还是将品牌名称定为“元境”,“我们希望自己可以在元宇宙里做很多事情。”
真正从业务落地来看,元境科技做得最成功的,是他们的核心业务——虚拟数字人。
伴随着元宇宙概念席卷全球,虚拟身份成了迈入元宇宙的第一步,元境科技在过去两年里,也在不断推动虚拟数字人进入各种应用场景。
据官方数据显示,元境科技的虚拟数字人已经为腾讯、华为、匹克、外研在线、沪上阿姨等上百家品牌提供了虚拟数字人服务,打造出了一个又一个虚拟数字人。
不过,元境科技2022年提供的虚拟数字人服务,仍以服务B端用户为主。
2023年4月,随着AIGC和大模型的浪潮来袭,元境科技正式对外发布了元享智能云平台,这是元境科技过去两年里对外提供虚拟数字人服务的数字内容创作平台,集成了NLP、AIGC,以及预训练大模型在内的技术,可以实现虚拟数字人生成、绑定、驱动、应用一站式构建。
与此同时,元境科技也开始尝试进入To C领域。
Crush相机就是元境科技这时面向C端推出的一款产品。
Crush相机本质上是一款支持双人共创的AI写真微信小程序,当两人身处异地时,可以在这款应用上上传照片、选择风格、邀请合拍,从而实现同框合影。
据王智武透露,“我们接下来会在这款应用上上线更多好玩的玩法,未来也会将虚拟数字人与Crush结合起来。”
元境科技另一个已经在结合虚拟数字人的应用,是“魔境”。
“我们当时定义魔境这个产品的时候,是希望每个人桌面上都可以有一个陪聊虚拟数字人,于是就有了这款可以放在桌面上的轻薄产品。”王智武如是说。
实际上,魔境看上去更像是一个电子相册,不同的是,这款产品基于Wav2lip实现了视频唇形合成,通过视频文件进行语音驱动生成唇形,从而让相册中的照片“活了起来”。
元境科技就这样将虚拟数字人相关技术一边从商用领域下沉到消费市场,一边将虚拟数字人应用到更多有趣的硬件产品中。
虚拟数字人逐渐走入到了更多产品、更多应用场景中,元境科技也有了新的打算。
AI、MR与元宇宙的文艺复兴
2024年1月18日,元境科技在北京E9创新工场举办了一场发布会,发布会上,元境科技正式更名为智境云创,这家公司由此也进入到了一个新的发展阶段。
对于新品牌的含义,智境云创CEO王智武解释称:
“智”指的是人工智能,我们要从元宇宙时代跨入到人工智能时代,未来我们将在人工智能领域做更多技术突破和应用;
“境”一方面依然指“人货场”,另一方面也指我们要突破境界,在技术、服务、应用推动公司再上一个高度;
“云”指的是云计算、数据要素,我们希望可以基于元享平台,基于算力调度做一些好玩的应用;
“创”指的是创新。
智境云创的品牌升级,背后伴随的是公司虚拟数字人业务从1.0阶段向2.0阶段的一次跃迁。
在1.0阶段,对于整个行业来说,最重要的是实现虚拟数字人低成本、短周期、批量化制作,为每个人打造一个虚拟身份。
智境元创在过去两年里已经积累了大量的3D数据,并在技术上深入研究了2D拟合3D、动态光场扫描、无标记点视觉捕捉、AI语音驱动等技术,从而让每个人得以快速获得一个虚拟数字人。
王智武在发布会上透露,“在2023年下半年之后,我们开始研究情感共挚和超感体验,希望可以做出有情感的AI应用。”
而这就需要挖掘人工智能,尤其是当下大模型的作用。
在发布会上,王智武还对外发布了智境云创的虚拟数字人领域垂类大模型——智者千问。
这一面向虚拟数字人领域的垂类大模型有三大特性:响应速度快、支持本地私有化、支持调用其它平台接口。
“如果将虚拟数字人接入GPT大模型,它的响应延时普遍在8-12秒,这样的延时基本上谈不上有什么使用体验,即便是接入国内通用大模型,延时依然在3-4秒,而如果是基于我们的智者千问,延时可以控制在0.8秒,做到秒级回复。”
智者千问大模型奠定了智境元创进入人工智能新时代的基础,智境元创在发布会上也正式对外公布了公司如今的“1+4”发展战略和全新的战略版图。
值得注意的是,随着苹果Vision Pro推动的MR和空间计算新一轮热潮的到来,智境元创希望借助AI、MR、空间计算三大趋势,为虚拟数字人,乃至更广泛的数字内容创造出超感体验。
王智武称,“我们希望可以打造出一系列具有沉浸感,可以实时体验、实时协作、实时互动的产品。”
实际上,智境元创基于MR的虚拟数字人解决方案已经上线。
至顶网在现场展示的微软HoloLens设备上体验到了这一虚拟数字人解决方案,戴上HoloLens后,一个身着古装服饰的男子静静呈现在了用户面前,通过手势+语音控制就可以与这位从古代穿越而来的男子交流对话。
2024年,在AI、MR、空间计算热潮推动下,一场元宇宙的文艺复兴就此开启。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。