2023年10月8日,来自45个国家和地区的12500名运动员在400多个体育项目中经过15天激烈角逐后,杭州亚运会正式闭幕。
作为有史以来数字化程度最高的体育盛会,杭州亚运会选取了一位独特的数字人火炬手,进行了亚运会开幕式的点火仪式。
实际上,作为亚运史上首个数字点火仪式,共有1亿多位数字火炬手参与到了这次火炬接力中,甚至在闭幕仪式上,备受关注的数字火炬手“弄潮儿”再次返场,由远及近地驻足于主火炬前,与观众“比心”互动,直至迈向远方化为漫天星辰。
作为一项全民关注的体育赛事,数字人的形象在潜移默化中深入人心。
据亚运会开闭幕式虚拟AR技术及闭幕式数字火炬手技术服务商,世优科技CEO&创始人纪智辉透露,目前世优科技已经为近千家客户提供了数字人相关服务,累计打造的数字人超1000个。
尤其是在AI的加持下,越来越多数字人开始融入人类世界中。
数字人的催化剂
数字人近年来的商业化历程与人工智能技术息息相关,尤其是AI模型的兴起,为数字人商业化再添一把火。
生成式AI对数字人产业最显著的影响,是研发效率的提升。
纪智辉称,“在生成式AI出现之前,数字人的制造成本高昂,生产周期长,大多数数字人企业都只能做定制化内容,用途也比较单一,主要作为数字代言人、虚拟IP使用。”
高成本、定制化,注定了当时数字人的繁华只能浮于表象,批量应用就这样卡在了批量生产这一工程难题上。
直到生成式AI、大模型的出现,让数字人产业从业者看到了曙光。
2022年11月,ChatGPT面向全球发布,作为随后引发百模大战的导火索,ChatGPT的发布也为数字人的研发、突破批量生产的困境提供了一条新思路。
据纪智辉介绍,基于生成式AI技术的自然语言处理模型、3D表情驱动模型等,可以让数字人的动作、表达更生动、更有表现力,更重要的是,生成式AI的强大语言理解和生成能力,能使数字人更好地理解用户的复杂需求和情感,提供更智能、个性化和精准的交互体验,实现自主自发与他人对话互动,让数字人快速“活起来”。
让数字人照进现实
世优科技当下的主力产品——AI数字人多模态交互系统“世优波塔”,在产品适配上,支持数字大屏、AI数字人一体机、PC端以及H5小程序等多种应用终端形态,同时支持私有化部署等集成方案,在大模型的加持下,增强了数字人的智能性、互动性和真实性,打造出的数字人更具沉浸式、个性化体验。
据官方公开数据显示,基于这一平台构建的数字人的交互准确率达到了98%。
在泸州市举办的“泸州40正当红”晚会上,世优科技打造的虚拟IP酒麒麟“酣酣”,就基于AI数字人多模态交互系统“世优波塔”,以世优AI数字人一体机为载体,与现场观众实时自主智能互动,为“酣酣”IP提供数字人“造人”、“养人”、“用人”全栈式服务,让文化艺术实现真正的零距离传播。
这是数字人在文旅行业中的应用,通过这样的技术应用,智慧文旅正在以更符合当代年轻人喜好的方式,为文旅行业赋予更多新的时代元素。
其实不仅仅是文旅行业, 在大模型的加持下,数字人的应用领域逐步拓展。
据悉,世优科技的数字人产品,正以2.5D、3D等形象,在娱乐、金融、电商、教育、医疗、文旅、商业、政务、科研等多个领域得到应用,形成如虚拟医生、虚拟教师、虚拟导游、虚拟顾问、虚拟办事员、虚拟主播、虚拟偶像、虚拟客服等身份,真正融入到了人类生活中。
不过,纪智辉指出,目前定制化数字人的成本依然比较高,无法普及到普通个人用户,而生成式数字人打造只能套用视觉模板生成,无法让每一位用户按自己的喜好风格打造专属数字人,行业依然需要降本增效,继续深耕。
此外,就行业发展趋势,他也指出,数字人的规模化正在逐步落地中,尤其是在生成式AI与数字人融合发展后,但落地增速已经从前期的高速,逐渐放缓,“如果行业能够突破现在算法、算力、数据的瓶颈,数字人的规模会重新进入到高速发展阶段。”
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。