大模型之家对话虚拟动点刘耀东:以空间计算实现解决物理世界交互

在“震惊世人”的Sora出现后,行业内外对于多模态大模型的讨论也愈发激烈,但也有一种声音表示Sora并不能“理解”物理世界。生成的内容经常出现“穿模”的现象,即图像或场景中物体的相互穿透,以及不符合现实物理属性的动作等问题。
大模型之家对话虚拟动点刘耀东:以空间计算实现解决物理世界交互

从ChatGPT引领生成式人工智能的热潮,到如今多模态大模型的演变。模型的能力从能够理解文本和图像,到够处理语音和视频,再到预测和生成复杂的动作序列仅仅用了一年的时间……

在“震惊世人”的Sora出现后,行业内外对于多模态大模型的讨论也愈发激烈,但也有一种声音表示Sora并不能“理解”物理世界。生成的内容经常出现“穿模”的现象,即图像或场景中物体的相互穿透,以及不符合现实物理属性的动作等问题。

这一点在电商平台体现的也尤为明显,很多数字人直播间随着工作的推进意识到,数字人直播的2D体验已逐渐不能满足日益增长的用户体验需求,行业对更立体、更具沉浸感的技术解决方案的呼声愈发高涨。

而在此现象背后,行业普遍更期待通过空间计算技术,依靠3D图形渲染、实时数据处理、机器学习算法和先进的传感器技术,提供更加丰富和真实的3D体验,模拟物体间的物理交互,从而在一定程度上解决多模态大模型在物理世界理解上的不足。

4月17日,利亚德集团2024年生态合作伙伴大会暨2024年度战略发布会在北京成功举办。期间,虚拟动点作为利亚德集团全资子公司参与并出席,集团CMO,虚拟动点董事长兼CEO刘耀东代表公司向合作伙伴介绍虚拟动点最新技术产品,全面展示公司光学定位捕捉算法、无标记点捕捉算法等多项空间计算算法技术,阐述自研LYDIA动作大模型技术亮点及应用场景。

技术源于累积,利亚德被空间计算选择

在活动上刘耀东再次重申了利亚德·虚拟动点在AI和空间计算领域的“一体三核”战略框架。

大模型之家对话虚拟动点刘耀东:以空间计算实现解决物理世界交互

首先,“一体”指的是公司以空间计算作为战略主体,专注于交互技术的研究和应用,如光学捕捉定位算法、无标记捕捉定位算法等,这些技术是实现虚拟现实和增强现实应用中精准交互的基础。其次,“三核”中的AI大模型利用丰富的空间数据进行训练,以提高动作识别和生成的准确性,增强用户体验。硬件设备作为算法的物理载体,包括边缘计算设备、可穿戴设备等,确保了技术的实践应用。而空间数据则是通过硬件设备收集而来,为AI大模型提供训练所需的关键信息。

“一体三核” 的发展战略在AI大模型、硬件设备、空间数据三个方面实现技术与市场的协同增长?

追溯“一体三核”的历史,刘耀东对大模型之家表示,起初虚拟动点只是利亚德内部设立的一个部门,被称为VR事业部。坦白说,再被称之为VR事业部时,并没有一个明确的技术路线图。我们所有的业务都是基于利亚德的显示技术。

经过多年的研究,虚拟动点发现虚拟现实的核心是解决交互问题。而实现的途径主要是通过光学识别目标点等传统AI技术来实现,这些技术能够识别动作、幅度、角度,以及追踪肢体、手势和眼神。同时,虚拟动点还发现可以能够计算和观察物体的刚体属性,如大小、形状和体积。这些发现最终引导我们提出了一个更先进的概念——空间计算。

刘耀东介绍,公司最初拥有的是光学定位算法。基于此算法后还需要一个载体来固定它,因此开发了边缘计算设备和可穿戴设备,如动作捕捉设备。通过算法和硬件多年的运转,从而积累了大量的数据,形成了算法、算力设备和数据的循环。

大模型之家认为,AI大模型、硬件设备、空间数据这三个核心能力相互依存,共同推动技术进步和市场扩张。算法的创新促进硬件的发展,硬件的应用产生数据,数据的积累和分析进一步优化AI大模型,形成一个闭环的迭代过程。

此外,利亚德虚拟动点还积极与外部合作伙伴建立合作关系,共享资源,推动技术发展和市场应用,构建了一个开放的生态系统。使得利亚德虚拟动点不仅在技术层面实现了深度发展,而且在商业层面上实现了广度拓展,确保了公司在激烈的市场竞争中保持领先地位,并为未来的持续增长奠定了坚实的基础。

聚焦合作,打造专业能力大模型

空间计算技术涉及大量的数据采集、传输、存储和处理,这些操作无一例外都需要强大的算力作为支撑。算力在此层面上的作用是加速数据处理速度,并提升数据处理的精度和效率,确保空间计算的准确性和实时性。

推动空间计算技术创新的过程中,算力是否成为公司研发和应用的主要限制因素之一?

在面对算力市场可能带来的“焦虑”时刘耀东表示,利亚德虚拟动点的模型是针对特定行业的细分领域定制的轻巧模型,而非通用大模型。这种专业化和定制化可以显著降低对算力的需求,因为它们通常更专注于解决特定问题,而不是试图处理所有可能的问题。

大模型之家对话虚拟动点刘耀东:以空间计算实现解决物理世界交互

LYDIA专注于空间计算中动作数据的生成与理解,可生成动作的三维数据,实现相对精准的人物动作生成,常应用于影视领域、游戏、动画、电商、教育、体育、文艺等有空间计算内容生成需求的各种行业场景。

不过,随着业务的扩展、数据量的增加以及模型复杂度的提升,对算力的需求依然会持续增长。在开发新模型或进行复杂的数据分析时,可能仍然需要较高的计算能力。在这一层面,刘耀东表示虚拟动点未来将会更多地依赖于云计算和分布式计算技术,以实现更高效的资源利用和更强大的计算能力。

值得一提的是,刘耀东着重对大模型之家表达了自主可控的云计算能力的重要性,他认为,如果中国能够建立起自主可控的云计算能力,那么即使数据量增大,计算能力也不会成为特别大的难题。

对于企业而言,自主可控的云计算能力同样至关重要。它不仅能够为企业提供一个稳定可靠的数据处理平台,还能够降低运营成本,提高企业的市场响应速度和业务创新能力。在可持续发展的背景下,拥有自主技术的云计算支持,企业能够更好地适应市场变化,实现长期稳定发展。

大模型之家对话虚拟动点刘耀东:以空间计算实现解决物理世界交互
此外,虚拟动点在资源整合和产业链协同方面也迈出了重要步伐。通过与阿里大文娱、元客视界、华锐视界、数字栩生等多家企业的深度合作,帮助虚拟动点在AI、空间计算、大模型等核心技术领域实现更广泛的应用和更快速的创新。

大模型之家认为,与上下游企业的合作有助于构建一个更加紧密和高效的产业链,实现资源共享和优势互补。这种协同效应可以提高整个产业链的竞争力,促进产业生态的健康发展。

写在最后

空间计算、量子计算等高水平现代化技术正以前所未有的速度,重塑着我们的工作、学习和娱乐方式。不再是孤立的算法或硬件,更是通过数据的纽带,编织成一个协同进化的生态系统,不断推动着交互体验的革新。

大模型之家相信专业化模型的不断涌现,将带来一种更加精准、高效的技术应用路径。这些模型为特定行业量身定做的解决方案,专注于解决特定的问题,而不是试图成为一个“万能钥匙”。

在这个数据驱动的时代,算法的迭代优化同样成为了推动技术进步的不竭动力。通过机器学习和深度学习,我们能够不断优化模型,使其更加精准、响应更加迅速。而云计算与分布式计算的结合,更是为数据处理提供了强大的支撑,加速了数据处理的能力,也提升了数据处理的精度和效率。同时,自主可控技术的发展战略,是保障数据安全、推动技术创新的关键。它不仅关乎到一个企业的未来,更是一个国家在全球竞争中保持优势的重要保障。

 

来源:大模型之家

0赞

好文章,需要你的鼓励

2024

04/23

20:04

分享

点赞