安全可靠!新华三百业灵犀首批通过中国信通院可信要求标准符合性验证
为推动大模型产业向更高的可信标准迈进,中国信通院自2022年启动大模型技术研究和评估以来,根据产业发展不断优化迭代,已形成一套覆盖范围全、评测指标精、需求映射准的大模型评测体系。
近日,在中国信息通信研究院(以下简称“中国信通院”)组织的“大规模预训练模型标准符合性验证”中,紫光股份旗下新华三集团自研的私域大模型百业灵犀(LinSeer)以5级评分通过评测,成为业界首批在模型可信领域获得卓越级(5级)评分的大模型产品。

随着人工智能技术的快速演进,我国AI大模型产业呈现蓬勃发展的态势,通用大模型、行业大模型如雨后春笋般涌现,尽管如此,我国AI技术落地仍面临诸多安全挑战。为推动大模型产业向更高的可信标准迈进,中国信通院自2022年启动大模型技术研究和评估以来,根据产业发展不断优化迭代,已形成一套覆盖范围全、评测指标精、需求映射准的大模型评测体系。目前,中国信通院发布的《大规模预训练模型技术和应用评估方法》系列标准共包含模型开发、模型能力、模型运营、模型应用和可信要求五个部分,在此前组织的大模型标准符合性验证中,新华三百业灵犀(LinSeer)已在“模型开发”和“模型能力”两个模块达到优秀级(4+级)。
为引导产业可持续发展,新华三集团与中国信通院联合其他相关单位共同开展编制《大规模预训练模型技术和应用评估方法 第5部分:可信要求》。此次评估围绕基础软硬件可信、数据可信、模型可信、应用可信四个模块展开了全方位、多维度测评,新华三百业灵犀(LinSeer)在各个模块评测中均表现了出色的技术水准,实力诠释了新华三在大模型领域领先的技术实力。
重点验证大模型基础软硬件的可信性、可靠性及兼容性。百业灵犀(LinSeer)大模型研发及应用基于的软硬件设备具备相关功能可信能力,可支撑模型稳定运行,如建立CPU集群、算力资源调度机制等,同时新华三可以提供CPU和GPU多元化的选择,满足不同市场、不同客户的需求,并通过倡导联接标准化,积极推动服务器内、外部GPU联接标准化和软件生态标准化。
重点验证大模型数据采集可靠性、预处理有效性及使用可控性。百业灵犀(LinSeer)一方面能够保障数据在采集阶段的真实性和完整性,同时通过有效的预处理程序优化数据质量,提高后续模型训练的准确性;另一方面,通过对数据的使用设置严格控制,确保数据在整个处理过程中的可信性和合规性。
重点验证大模型鲁棒性、稳定性、透明性、公平性及可追溯性。经数据集测试,参测大模型能够满足模型鲁棒性要求,且在研发和应用过程中能够记录模型版本信息和详细流程记录日志,满足模型可追溯性要求。
重点验证大模型服务可信和内容可信。百业灵犀(LinSeer)在实际操作环境中表现了超强的可靠性,拥有明确投诉与反馈机制。对所有场景下大模型生成内容进行可信性限制,支持基于用户需要增强,针对所有出入流量和内容进行可信审计和敏感信息拦截,为用户信息和数据可信保驾护航。
新华三集团致力于通过合适的切入场景,合理的模型大小,高效的数据治理、合规的内容安全,以及合用的落地工具加速AIGC应用落地。与通用大模型相比,私域大模型在解决数据可信隐患、缺乏深度行业知识等问题方面更具优势,也更利于帮助政企实现AIGC与实际业务的适配与落地。新华三百业灵犀(LinSeer)是专为数据安全高度敏感的政企用户设计而生的私域大模型,能够为垂直行业和专属地域客户提供安全、订制、独享、生长的智能化服务,全面支持政企用户利用自身数据训练专属模型。在功能层面,百业灵犀(LinSeer)拥有信息抽取、意图理解、文本生成、代码生成等核心能力,通过打造高可靠、高性能、高可信的一体化平台,提供从数据管理、模型训练、模型评估到模型部署的全生命周期服务。
作为国内较早投入AI领域的企业,新华三集团有着长期的技术积累与实践经验。面向未来,新华三将秉持“精耕务实,为时代赋智慧”的理念,聚焦AIGC技术创新,积极探索行业应用场景,以务实理念打造领先的数字化解决方案,通过不断进化的数字大脑加速推进数字化变革的智能化升级,做百行百业最值得信赖的合作伙伴。
0赞好文章,需要你的鼓励
推荐文章
随着人工智能和高性能计算持续推动需求增长,数据中心设计正以同样惊人的速度演进。曾经的高密度机架已成为标准配置,冷却系统在数月而非数年内完成重新设计,项目在各地区的规模和复杂性不断提升。全球工程设计咨询公司Black & White Engineering指出,液冷成为标准配置、极端机架密度管理、工业化规模交付、电网约束下的电力创新、AI驱动运营设计以及可持续性成为核心设计原则,将成为2026年塑造数据中心设计、建设和运营的六大关键趋势。
这项由ByteDance Seed、香港科技大学等机构联合完成的研究提出了"轨迹场"这一创新的4D视频表示方法。研究团队开发的Trace Anything系统能够在单次前向传递中为视频中的每个像素预测连续的三维轨迹,无需光流估计或迭代优化。通过构建大规模合成数据平台和精心设计的训练方案,该方法在轨迹估计基准上实现了最先进性能,同时推理速度比竞争方法快10倍以上,并展现了运动预测、时空融合等多种涌现能力。
Snowflake本周推送的一次更新导致全球范围内的"重大故障",用户长达13小时无法查询数据、文件导入失败并收到错误信息。初步调查显示,最新版本引入了不向后兼容的数据库架构更新,导致版本不匹配错误。此次故障影响了全球23个区域中的10个,包括美国、欧洲和亚洲多个数据中心。这是Snowflake一周内第二次发生事故。
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。