随着 77% 的公司已经在使用或探索 AI 技术,超过 80% 的公司将其列为首要任务,企业领导者都渴望从这项技术中获得最大价值。然而,市面上庞大的解决方案数量以及随之而来的营销信息浪潮,使得找到一条清晰的道路变得困难。以下是一些指导方针,帮助你评估 AI 工具的能力,并确定最适合你组织的解决方案。
从问题出发,而不是工具
当媒体赞扬某个特定平台,或者你发现竞争对手正在使用同样的平台时,你自然会想知道自己是否也应该使用。但在研究新系统之前,要先确定企业面临的问题。主要挑战是什么?核心需求是什么?一旦重新调整关注点,就要通过这个视角重新审视你正在考虑的解决方案。
如果 AI 技术能够解决公司一直遇到的明确、可衡量的问题 (例如自动化日常任务或提高团队生产力),那么这个工具就值得探索。如果它与解决你的问题没有直接关联,就继续寻找其他方案。AI 可以非常强大,但它也有局限性。你的目标应该是只将其应用在能够产生最有意义影响的领域。
试点项目和实验预算
当你确定某个系统可能从战略上支持你的需求时,你已经满足了第一个必要条件——但这并不意味着你已经准备好购买。下一步是通过小规模试点项目对技术进行充分测试,以确定其有效性。
最有价值的测试使用的框架与关键绩效指标 (KPI) 相关联。根据 Google Cloud 的说法:"KPI 在生成式 AI 部署中至关重要,原因如下:客观评估性能、与业务目标保持一致、实现数据驱动的调整、提高适应性、促进与利益相关者的清晰沟通,以及展示 AI 项目的投资回报率。它们对于衡量成功和指导 AI 计划的改进至关重要。"
换句话说,你的测试框架可以基于准确性、覆盖范围、风险或任何对你最重要的 KPI。你只需要有明确的 KPI。一旦确定,就组织 5 到 15 人进行测试。两个 7 人团队是理想的测试规模。当这些经验丰富的人员开始测试这些工具时,你就能收集到足够的反馈,以确定这个系统是否值得扩展。
评估数据安全和供应商透明度
当你考虑一个平台时,要记住你不仅要评估技术本身,还要评估背后的公司。对供应商的审查应该不亚于对技术本身的审查。确保只与在数据安全方面保持最高标准的供应商合作。他们应该遵守全球数据保护和 AI 伦理原则标准,平台本身应该通过 SOC 2 Type 1、SOC 2 Type 2、通用数据保护条例 (GDPR) 和 ISO 27001 认证。
此外,要确认供应商在未经明确同意的情况下不会使用你公司的数据进行 AI 训练。视频会议提供商 Zoom 就是一个典型例子,它曾计划收集客户内容用于其 AI 和机器学习模型。尽管他们最终没有执行这些计划,但这一事件应该引起企业和消费者的警惕。
如果你指定一名 AI 负责人负责这个领域,这个人可以管理所有数据安全需求并确保组织合规。这可能感觉是不必要的额外工作,但这是至关重要的。要记住,你的供应商只要发生一次数据泄露,就可能让你失去客户信任——甚至失去客户。
最后的思考
领导者必须采用结构化的方法来评估 AI 解决方案,以从中获得最大价值。首先关注问题解决,其次是测试和试点项目、数据安全以及识别切实的价值。AI 可以非常强大,但只有在经过仔细选择和实施后应用于正确的问题时才能发挥作用。
作者 Arjun Pillai 是 DocketAI 的联合创始人兼首席执行官。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。