根据麦肯锡最新报告,大多数组织表示他们还没有完全准备好以安全负责的方式使用生成式AI。其中一个关键担忧是可解释性——理解AI如何以及为什么做出某些决策。虽然40%的受访者认为这是重大风险,但只有17%正在积极解决这个问题。
总部位于首尔的Datumo最初是一家AI数据标注公司,现在希望帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进他们的模型。周一,这家初创公司获得1550万美元融资,使其总融资额达到约2800万美元,投资方包括Salesforce Ventures、KB Investment、ACVC Partners和SBI Investment等。
Datumo首席执行官David Kim曾是韩国国防发展局的AI研究员,他对数据标注的耗时性质感到沮丧,于是想出了一个新点子:开发一个基于奖励的应用程序,让任何人都能在空闲时间标注数据并赚钱。这家初创公司在韩国科学技术院(KAIST)的创业竞赛中验证了这个想法。Kim与五位KAIST校友于2018年共同创立了Datumo,前身为SelectStar。
甚至在应用程序完全构建之前,Datumo就在竞赛的客户发现阶段获得了数万美元的预合同销售,主要来自KAIST校友领导的企业和初创公司。
在第一年,这家初创公司收入就超过了100万美元,并获得了几个重要合同。如今,该公司的客户包括三星、三星SDS、LG电子、LG CNS、现代、Naver以及首尔电信巨头SK电讯等韩国主要公司。然而,几年前,客户开始要求公司超越简单的数据标注服务。这家成立7年的初创公司现在在韩国拥有超过300个客户,2024年营收约600万美元。
"他们希望我们为他们的AI模型输出打分,或将其与其他输出进行比较,"Datumo联合创始人Michael Hwang告诉TechCrunch。"那时我们意识到:我们实际上已经在做AI模型评估了——甚至自己都没意识到。"Hwang补充说,Datumo在这一领域加倍投入,并发布了韩国首个专注于AI信任和安全的基准数据集。
"我们从数据标注开始,随着大语言模型生态系统的成熟,扩展到预训练数据集和评估领域,"Kim告诉TechCrunch。
Meta最近对数据标注公司Scale AI的143亿美元类收购投资突显了这个市场的重要性。在该交易后不久,AI模型制造商和Meta竞争对手OpenAI停止使用Scale AI的服务。Meta的交易也表明AI训练数据的竞争正在加剧。
Datumo在预训练数据集供应方面与Scale AI等公司有一些相似之处,在AI评估和监控方面与Galileo和Arize AI相似。然而,它通过其许可数据集来区分自己,特别是从出版书籍中抓取的数据,Kim说这些数据提供了丰富的结构化人类推理,但清理起来非常困难。
与同行不同,Datumo还提供一个名为Datumo Eval的全栈评估平台,可以自动生成测试数据和评估,检查不安全、有偏见或错误的响应,无需手动脚本编写,Kim补充说。其标志性产品是一个为非开发人员设计的无代码评估工具,如政策、信任安全和合规团队成员。
当被问及如何吸引Salesforce Ventures等投资者时,Kim解释说,这家初创公司此前在韩国的一次活动中主办了与DeepLearning.AI创始人Andrew Ng的炉边谈话。活动结束后,Kim在LinkedIn上分享了这次会议,引起了Salesforce Ventures的注意。经过几次会议和Zoom通话后,投资者给出了软承诺。Hwang说,整个融资过程耗时约8个月。
新资金将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。这家在首尔拥有150名员工的初创公司还于3月在硅谷建立了业务。
Q&A
Q1:Datumo是什么公司?主要做什么业务?
A:Datumo是一家总部位于首尔的AI数据公司,最初从事AI数据标注服务,现在主要帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进AI模型。公司拥有超过300个客户,包括三星、LG电子、现代等韩国主要企业。
Q2:Datumo如何与Scale AI等竞争对手区别开来?
A:Datumo通过许可数据集来区分自己,特别是从出版书籍中抓取的数据,提供丰富的结构化人类推理。同时提供名为Datumo Eval的全栈评估平台,可自动生成测试数据和评估,并推出无代码评估工具,专为非开发人员如政策、信任安全和合规团队设计。
Q3:Datumo的发展前景如何?融资将用于什么?
A:公司2024年营收约600万美元,新获得的1550万美元融资将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。公司已在硅谷建立业务,展现出国际化发展趋势。
好文章,需要你的鼓励
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
这项由香港中文大学和AWS团队联合开发的研究推出了TALK2MOVE系统,实现了用自然语言精准操作图片中物体的位置、角度和大小。该系统采用强化学习训练方式,通过空间感知奖励机制和智能步骤采样技术,在移动、旋转、缩放三类操作上的准确率显著超越现有方法,同时大幅降低了对昂贵训练数据的依赖,为AI图像编辑领域带来重要突破。
研究人员对Claude、GPT-4、Gemini和Grok等商用AI模型进行测试,发现这些模型能够记忆并完整输出受版权保护的内容。其中越狱后的Claude 3.7 Sonnet能输出95.8%的《哈利波特与魔法石》内容,而Gemini和Grok在无需越狱情况下也能输出超过70%的内容。这一发现可能对正在进行的AI版权诉讼产生重要影响,目前多家AI公司面临超过60项相关法律诉讼。
斯坦福大学等知名机构联合研究发现,企业AI助手在执行组织政策时存在严重"偏科"问题:处理允许请求时成功率超95%,但拒绝违规请求时仅13-40%。研究团队开发的COMPASS评估框架通过8个行业5920个测试问题,揭示了AI助手普遍缺乏"拒绝技能"的问题,并提出了针对性训练解决方案。