企业需要准确且相关的数据,来驱动应用程序、平台以及旨在实现数字化变革的 AI 智能体。然而,即便数据在表面上看起来"无懈可击",其背后也可能存在隐患。
对数据进行严格审查和压力测试,能够有效防止企业基于错误信息做出决策——而这类问题往往并非源于 AI 本身。
在本期《InformationWeek 播客》中,Phison Electronics 首席技术官 Sebastien Jean 与 Ensemble Health Partners 首席技术官 Grant Veazey 共同探讨了他们在工作中接触到的数据类型、在测试数据时的优先考量事项、是否会使用"残缺数据"进行模拟测试,以及数据可视化的实际价值。
随后,节目中的"问题创意桌游"环节将对两位嘉宾的知识储备和实战经验发起挑战——他们将以临时高管的身份,协助一家虚构企业梳理并优化其数据测试策略。
Q&A
Q1:企业在数据测试中最应该优先考虑哪些因素?
A:根据两位 CTO 的经验,企业在测试数据时应优先关注数据的准确性与相关性。即使数据表面上看起来"完美",也可能存在隐患。因此,需要对数据进行严格审查和压力测试,防止企业基于错误信息做出错误决策,而这类问题往往并非由 AI 本身引起,而是数据质量本身的问题。
Q2:用"残缺数据"进行模拟测试有什么意义?
A:使用"残缺数据"进行模拟测试,是一种主动发现系统漏洞和数据处理缺陷的方法。通过故意引入错误或不完整的数据,企业可以提前识别系统在异常情况下的表现,从而提升数据管道和 AI 智能体的鲁棒性,避免在真实业务场景中因数据问题导致严重后果。
Q3:数据可视化在数据测试中能发挥哪些作用?
A:数据可视化能够帮助技术团队更直观地发现数据中潜在的异常或规律,是数据测试过程中的重要辅助手段。通过图表和可视化工具,CTO 及数据团队可以快速识别数据质量问题,提升决策效率,同时也便于向非技术背景的管理层清晰呈现数据测试的结果与风险点。
好文章,需要你的鼓励
亚马逊现以949美元的价格销售13英寸M5 MacBook Air,相比苹果官方售价1099美元节省150美元。这是2026款M5 MacBook Air入门机型,也是目前可追踪到的最低价之一。与此同时,15英寸入门款已降至历史最低,优惠幅度达199美元。预计在阵亡将士纪念日前后,13英寸多色款将进一步降价,是升级至苹果最新M5芯片机型的绝佳时机。
清华大学等机构提出首个实时双工多模态交互评测基准Omni-DuplexEval,含660个视频、9项任务,揭示当前最佳AI模型综合得分仅39.6分,远低于人类81.8分。
数字医疗专家Newel Health与包装集团Gerresheimer宣布战略合作,旨在帮助制药企业推广临床试验数字技术并开发新型数字医疗设备及混合疗法。合作将整合Newel Health的医疗软件(SaMD)与AI平台,以及Gerresheimer在药物递送和智能包装领域的专长,共同推动个性化医疗规模化落地。双方还将协助制药和生物技术公司构建数字临床终点、真实世界数据基础设施及药械数字组合方案。
上交大与腾讯ARCLab提出SGT方法,通过将图像分割作为生成代理任务,有效打通统一多模态模型中理解与生成两种能力的表示空间,在多个主流评测上取得一致性提升。