12月20日,小冰公司公布全新的数字孪生虚拟人技术,并联合每日经济新闻,将首批应用该技术的虚拟主持人,与“每经AI电视”一同正式上线。与其他技术相比,小冰框架不仅将虚拟人的整体自然度提升至与真人难以分辨的程度,还首次实现视频采编播全流程的无人化操作,帮助“每经AI电视”成为全球首个7x24小时不间断播出的AI视频直播产品。
在今天正式公布前,“每经AI电视”已悄然试运行70天。由于两位虚拟主播表现接近真人水平,以至于不少观众一直以为节目是真人录制。事实上,两位虚拟主播的训练数据来自知名财经主播N小黑(N小黑财经)和N小白(每经小白基金),再结合小冰深度神经网络渲染技术(Xiaoice Neural Rendering, XNR),使得包括面容、表情、肢体动作等在内的整体自然度大幅度提升。通过小冰框架小样本学习技术,虚拟人的训练周期从过去的数月缩短为一周,一举解决虚拟人周期长、成本高的难题,有望开启虚拟人在各个场景普及的新时代。
不仅如此,基于小冰框架的整体人工智能技术驱动,双方此次还实现了端到端的AI自动采编播全流程。从金融资讯的AI文本生成,到驱动预训练的虚拟主播,结合同步场景动态绘制,最终生成完整的直播视频推流,全过程不再需要人工参与。对此,小冰公司CEO、前微软亚洲互联网工程院常务副院长李笛表示:“在我们与合作伙伴的共同努力下,一个永不疲倦、安全可靠、稳定输出的AI Being时代已经到来。”
了解小冰数字孪生主播N小黑: https://www.bilibili.com/video/BV1YL411j727?spm_id_from=333.999.0.0
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。