根据麦肯锡最新报告,大多数组织表示他们还没有完全准备好以安全负责的方式使用生成式AI。其中一个关键担忧是可解释性——理解AI如何以及为什么做出某些决策。虽然40%的受访者认为这是重大风险,但只有17%正在积极解决这个问题。
总部位于首尔的Datumo最初是一家AI数据标注公司,现在希望帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进他们的模型。周一,这家初创公司获得1550万美元融资,使其总融资额达到约2800万美元,投资方包括Salesforce Ventures、KB Investment、ACVC Partners和SBI Investment等。
Datumo首席执行官David Kim曾是韩国国防发展局的AI研究员,他对数据标注的耗时性质感到沮丧,于是想出了一个新点子:开发一个基于奖励的应用程序,让任何人都能在空闲时间标注数据并赚钱。这家初创公司在韩国科学技术院(KAIST)的创业竞赛中验证了这个想法。Kim与五位KAIST校友于2018年共同创立了Datumo,前身为SelectStar。
甚至在应用程序完全构建之前,Datumo就在竞赛的客户发现阶段获得了数万美元的预合同销售,主要来自KAIST校友领导的企业和初创公司。
在第一年,这家初创公司收入就超过了100万美元,并获得了几个重要合同。如今,该公司的客户包括三星、三星SDS、LG电子、LG CNS、现代、Naver以及首尔电信巨头SK电讯等韩国主要公司。然而,几年前,客户开始要求公司超越简单的数据标注服务。这家成立7年的初创公司现在在韩国拥有超过300个客户,2024年营收约600万美元。
"他们希望我们为他们的AI模型输出打分,或将其与其他输出进行比较,"Datumo联合创始人Michael Hwang告诉TechCrunch。"那时我们意识到:我们实际上已经在做AI模型评估了——甚至自己都没意识到。"Hwang补充说,Datumo在这一领域加倍投入,并发布了韩国首个专注于AI信任和安全的基准数据集。
"我们从数据标注开始,随着大语言模型生态系统的成熟,扩展到预训练数据集和评估领域,"Kim告诉TechCrunch。
Meta最近对数据标注公司Scale AI的143亿美元类收购投资突显了这个市场的重要性。在该交易后不久,AI模型制造商和Meta竞争对手OpenAI停止使用Scale AI的服务。Meta的交易也表明AI训练数据的竞争正在加剧。
Datumo在预训练数据集供应方面与Scale AI等公司有一些相似之处,在AI评估和监控方面与Galileo和Arize AI相似。然而,它通过其许可数据集来区分自己,特别是从出版书籍中抓取的数据,Kim说这些数据提供了丰富的结构化人类推理,但清理起来非常困难。
与同行不同,Datumo还提供一个名为Datumo Eval的全栈评估平台,可以自动生成测试数据和评估,检查不安全、有偏见或错误的响应,无需手动脚本编写,Kim补充说。其标志性产品是一个为非开发人员设计的无代码评估工具,如政策、信任安全和合规团队成员。
当被问及如何吸引Salesforce Ventures等投资者时,Kim解释说,这家初创公司此前在韩国的一次活动中主办了与DeepLearning.AI创始人Andrew Ng的炉边谈话。活动结束后,Kim在LinkedIn上分享了这次会议,引起了Salesforce Ventures的注意。经过几次会议和Zoom通话后,投资者给出了软承诺。Hwang说,整个融资过程耗时约8个月。
新资金将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。这家在首尔拥有150名员工的初创公司还于3月在硅谷建立了业务。
Q&A
Q1:Datumo是什么公司?主要做什么业务?
A:Datumo是一家总部位于首尔的AI数据公司,最初从事AI数据标注服务,现在主要帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进AI模型。公司拥有超过300个客户,包括三星、LG电子、现代等韩国主要企业。
Q2:Datumo如何与Scale AI等竞争对手区别开来?
A:Datumo通过许可数据集来区分自己,特别是从出版书籍中抓取的数据,提供丰富的结构化人类推理。同时提供名为Datumo Eval的全栈评估平台,可自动生成测试数据和评估,并推出无代码评估工具,专为非开发人员如政策、信任安全和合规团队设计。
Q3:Datumo的发展前景如何?融资将用于什么?
A:公司2024年营收约600万美元,新获得的1550万美元融资将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。公司已在硅谷建立业务,展现出国际化发展趋势。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。