根据麦肯锡最新报告,大多数组织表示他们还没有完全准备好以安全负责的方式使用生成式AI。其中一个关键担忧是可解释性——理解AI如何以及为什么做出某些决策。虽然40%的受访者认为这是重大风险,但只有17%正在积极解决这个问题。
总部位于首尔的Datumo最初是一家AI数据标注公司,现在希望帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进他们的模型。周一,这家初创公司获得1550万美元融资,使其总融资额达到约2800万美元,投资方包括Salesforce Ventures、KB Investment、ACVC Partners和SBI Investment等。
Datumo首席执行官David Kim曾是韩国国防发展局的AI研究员,他对数据标注的耗时性质感到沮丧,于是想出了一个新点子:开发一个基于奖励的应用程序,让任何人都能在空闲时间标注数据并赚钱。这家初创公司在韩国科学技术院(KAIST)的创业竞赛中验证了这个想法。Kim与五位KAIST校友于2018年共同创立了Datumo,前身为SelectStar。
甚至在应用程序完全构建之前,Datumo就在竞赛的客户发现阶段获得了数万美元的预合同销售,主要来自KAIST校友领导的企业和初创公司。
在第一年,这家初创公司收入就超过了100万美元,并获得了几个重要合同。如今,该公司的客户包括三星、三星SDS、LG电子、LG CNS、现代、Naver以及首尔电信巨头SK电讯等韩国主要公司。然而,几年前,客户开始要求公司超越简单的数据标注服务。这家成立7年的初创公司现在在韩国拥有超过300个客户,2024年营收约600万美元。
"他们希望我们为他们的AI模型输出打分,或将其与其他输出进行比较,"Datumo联合创始人Michael Hwang告诉TechCrunch。"那时我们意识到:我们实际上已经在做AI模型评估了——甚至自己都没意识到。"Hwang补充说,Datumo在这一领域加倍投入,并发布了韩国首个专注于AI信任和安全的基准数据集。
"我们从数据标注开始,随着大语言模型生态系统的成熟,扩展到预训练数据集和评估领域,"Kim告诉TechCrunch。
Meta最近对数据标注公司Scale AI的143亿美元类收购投资突显了这个市场的重要性。在该交易后不久,AI模型制造商和Meta竞争对手OpenAI停止使用Scale AI的服务。Meta的交易也表明AI训练数据的竞争正在加剧。
Datumo在预训练数据集供应方面与Scale AI等公司有一些相似之处,在AI评估和监控方面与Galileo和Arize AI相似。然而,它通过其许可数据集来区分自己,特别是从出版书籍中抓取的数据,Kim说这些数据提供了丰富的结构化人类推理,但清理起来非常困难。
与同行不同,Datumo还提供一个名为Datumo Eval的全栈评估平台,可以自动生成测试数据和评估,检查不安全、有偏见或错误的响应,无需手动脚本编写,Kim补充说。其标志性产品是一个为非开发人员设计的无代码评估工具,如政策、信任安全和合规团队成员。
当被问及如何吸引Salesforce Ventures等投资者时,Kim解释说,这家初创公司此前在韩国的一次活动中主办了与DeepLearning.AI创始人Andrew Ng的炉边谈话。活动结束后,Kim在LinkedIn上分享了这次会议,引起了Salesforce Ventures的注意。经过几次会议和Zoom通话后,投资者给出了软承诺。Hwang说,整个融资过程耗时约8个月。
新资金将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。这家在首尔拥有150名员工的初创公司还于3月在硅谷建立了业务。
Q&A
Q1:Datumo是什么公司?主要做什么业务?
A:Datumo是一家总部位于首尔的AI数据公司,最初从事AI数据标注服务,现在主要帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进AI模型。公司拥有超过300个客户,包括三星、LG电子、现代等韩国主要企业。
Q2:Datumo如何与Scale AI等竞争对手区别开来?
A:Datumo通过许可数据集来区分自己,特别是从出版书籍中抓取的数据,提供丰富的结构化人类推理。同时提供名为Datumo Eval的全栈评估平台,可自动生成测试数据和评估,并推出无代码评估工具,专为非开发人员如政策、信任安全和合规团队设计。
Q3:Datumo的发展前景如何?融资将用于什么?
A:公司2024年营收约600万美元,新获得的1550万美元融资将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。公司已在硅谷建立业务,展现出国际化发展趋势。
好文章,需要你的鼓励
美国网络安全和基础设施安全局指示联邦机构修补影响思科ASA 5500-X系列防火墙设备的两个零日漏洞CVE-2025-20362和CVE-2025-20333。这些漏洞可绕过VPN身份验证并获取root访问权限,已被黑客积极利用。攻击与国家支持的ArcaneDoor黑客活动有关,黑客通过漏洞安装bootkit恶意软件并操控只读存储器实现持久化。思科已发布补丁,CISA要求机构清点易受攻击系统并在今日前完成修补。
康考迪亚大学研究团队通过对比混合量子-经典神经网络与传统模型在三个基准数据集上的表现,发现量子增强模型在准确率、训练速度和资源效率方面均显著优于传统方法。研究显示混合模型的优势随数据集复杂度提升而增强,在CIFAR100上准确率提升9.44%,训练速度提升5-12倍,且参数更少。该成果为实用化量子增强人工智能铺平道路。
TimeWave是一款功能全面的计时器应用,超越了苹果自带时钟应用的功能。它支持创建流式计时器,让用户可以设置连续的任务计时,帮助专注工作。应用采用简洁的黑白设计,融入了Liquid Glass元素。内置冥想、番茄工作法、20-20-20护眼等多种计时模式,支持实时活动显示和Siri快捷指令。免费版提供基础功能,高级版需付费订阅。
沙特KAUST大学团队开发了专门针对阿拉伯语的AI模型家族"Hala",通过创新的"翻译再调优"技术路线,将高质量英语指令数据转化为450万规模的阿拉伯语语料库,训练出350M到9B参数的多个模型。在阿拉伯语专项测试中,Hala在同规模模型中表现最佳,证明了语言专门化策略的有效性,为阿拉伯语AI发展和其他语言的专门化模型提供了可复制的技术方案。