根据麦肯锡最新报告,大多数组织表示他们还没有完全准备好以安全负责的方式使用生成式AI。其中一个关键担忧是可解释性——理解AI如何以及为什么做出某些决策。虽然40%的受访者认为这是重大风险,但只有17%正在积极解决这个问题。
总部位于首尔的Datumo最初是一家AI数据标注公司,现在希望帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进他们的模型。周一,这家初创公司获得1550万美元融资,使其总融资额达到约2800万美元,投资方包括Salesforce Ventures、KB Investment、ACVC Partners和SBI Investment等。
Datumo首席执行官David Kim曾是韩国国防发展局的AI研究员,他对数据标注的耗时性质感到沮丧,于是想出了一个新点子:开发一个基于奖励的应用程序,让任何人都能在空闲时间标注数据并赚钱。这家初创公司在韩国科学技术院(KAIST)的创业竞赛中验证了这个想法。Kim与五位KAIST校友于2018年共同创立了Datumo,前身为SelectStar。
甚至在应用程序完全构建之前,Datumo就在竞赛的客户发现阶段获得了数万美元的预合同销售,主要来自KAIST校友领导的企业和初创公司。
在第一年,这家初创公司收入就超过了100万美元,并获得了几个重要合同。如今,该公司的客户包括三星、三星SDS、LG电子、LG CNS、现代、Naver以及首尔电信巨头SK电讯等韩国主要公司。然而,几年前,客户开始要求公司超越简单的数据标注服务。这家成立7年的初创公司现在在韩国拥有超过300个客户,2024年营收约600万美元。
"他们希望我们为他们的AI模型输出打分,或将其与其他输出进行比较,"Datumo联合创始人Michael Hwang告诉TechCrunch。"那时我们意识到:我们实际上已经在做AI模型评估了——甚至自己都没意识到。"Hwang补充说,Datumo在这一领域加倍投入,并发布了韩国首个专注于AI信任和安全的基准数据集。
"我们从数据标注开始,随着大语言模型生态系统的成熟,扩展到预训练数据集和评估领域,"Kim告诉TechCrunch。
Meta最近对数据标注公司Scale AI的143亿美元类收购投资突显了这个市场的重要性。在该交易后不久,AI模型制造商和Meta竞争对手OpenAI停止使用Scale AI的服务。Meta的交易也表明AI训练数据的竞争正在加剧。
Datumo在预训练数据集供应方面与Scale AI等公司有一些相似之处,在AI评估和监控方面与Galileo和Arize AI相似。然而,它通过其许可数据集来区分自己,特别是从出版书籍中抓取的数据,Kim说这些数据提供了丰富的结构化人类推理,但清理起来非常困难。
与同行不同,Datumo还提供一个名为Datumo Eval的全栈评估平台,可以自动生成测试数据和评估,检查不安全、有偏见或错误的响应,无需手动脚本编写,Kim补充说。其标志性产品是一个为非开发人员设计的无代码评估工具,如政策、信任安全和合规团队成员。
当被问及如何吸引Salesforce Ventures等投资者时,Kim解释说,这家初创公司此前在韩国的一次活动中主办了与DeepLearning.AI创始人Andrew Ng的炉边谈话。活动结束后,Kim在LinkedIn上分享了这次会议,引起了Salesforce Ventures的注意。经过几次会议和Zoom通话后,投资者给出了软承诺。Hwang说,整个融资过程耗时约8个月。
新资金将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。这家在首尔拥有150名员工的初创公司还于3月在硅谷建立了业务。
Q&A
Q1:Datumo是什么公司?主要做什么业务?
A:Datumo是一家总部位于首尔的AI数据公司,最初从事AI数据标注服务,现在主要帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进AI模型。公司拥有超过300个客户,包括三星、LG电子、现代等韩国主要企业。
Q2:Datumo如何与Scale AI等竞争对手区别开来?
A:Datumo通过许可数据集来区分自己,特别是从出版书籍中抓取的数据,提供丰富的结构化人类推理。同时提供名为Datumo Eval的全栈评估平台,可自动生成测试数据和评估,并推出无代码评估工具,专为非开发人员如政策、信任安全和合规团队设计。
Q3:Datumo的发展前景如何?融资将用于什么?
A:公司2024年营收约600万美元,新获得的1550万美元融资将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。公司已在硅谷建立业务,展现出国际化发展趋势。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。