根据麦肯锡最新报告,大多数组织表示他们还没有完全准备好以安全负责的方式使用生成式AI。其中一个关键担忧是可解释性——理解AI如何以及为什么做出某些决策。虽然40%的受访者认为这是重大风险,但只有17%正在积极解决这个问题。
总部位于首尔的Datumo最初是一家AI数据标注公司,现在希望帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进他们的模型。周一,这家初创公司获得1550万美元融资,使其总融资额达到约2800万美元,投资方包括Salesforce Ventures、KB Investment、ACVC Partners和SBI Investment等。
Datumo首席执行官David Kim曾是韩国国防发展局的AI研究员,他对数据标注的耗时性质感到沮丧,于是想出了一个新点子:开发一个基于奖励的应用程序,让任何人都能在空闲时间标注数据并赚钱。这家初创公司在韩国科学技术院(KAIST)的创业竞赛中验证了这个想法。Kim与五位KAIST校友于2018年共同创立了Datumo,前身为SelectStar。
甚至在应用程序完全构建之前,Datumo就在竞赛的客户发现阶段获得了数万美元的预合同销售,主要来自KAIST校友领导的企业和初创公司。
在第一年,这家初创公司收入就超过了100万美元,并获得了几个重要合同。如今,该公司的客户包括三星、三星SDS、LG电子、LG CNS、现代、Naver以及首尔电信巨头SK电讯等韩国主要公司。然而,几年前,客户开始要求公司超越简单的数据标注服务。这家成立7年的初创公司现在在韩国拥有超过300个客户,2024年营收约600万美元。
"他们希望我们为他们的AI模型输出打分,或将其与其他输出进行比较,"Datumo联合创始人Michael Hwang告诉TechCrunch。"那时我们意识到:我们实际上已经在做AI模型评估了——甚至自己都没意识到。"Hwang补充说,Datumo在这一领域加倍投入,并发布了韩国首个专注于AI信任和安全的基准数据集。
"我们从数据标注开始,随着大语言模型生态系统的成熟,扩展到预训练数据集和评估领域,"Kim告诉TechCrunch。
Meta最近对数据标注公司Scale AI的143亿美元类收购投资突显了这个市场的重要性。在该交易后不久,AI模型制造商和Meta竞争对手OpenAI停止使用Scale AI的服务。Meta的交易也表明AI训练数据的竞争正在加剧。
Datumo在预训练数据集供应方面与Scale AI等公司有一些相似之处,在AI评估和监控方面与Galileo和Arize AI相似。然而,它通过其许可数据集来区分自己,特别是从出版书籍中抓取的数据,Kim说这些数据提供了丰富的结构化人类推理,但清理起来非常困难。
与同行不同,Datumo还提供一个名为Datumo Eval的全栈评估平台,可以自动生成测试数据和评估,检查不安全、有偏见或错误的响应,无需手动脚本编写,Kim补充说。其标志性产品是一个为非开发人员设计的无代码评估工具,如政策、信任安全和合规团队成员。
当被问及如何吸引Salesforce Ventures等投资者时,Kim解释说,这家初创公司此前在韩国的一次活动中主办了与DeepLearning.AI创始人Andrew Ng的炉边谈话。活动结束后,Kim在LinkedIn上分享了这次会议,引起了Salesforce Ventures的注意。经过几次会议和Zoom通话后,投资者给出了软承诺。Hwang说,整个融资过程耗时约8个月。
新资金将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。这家在首尔拥有150名员工的初创公司还于3月在硅谷建立了业务。
Q&A
Q1:Datumo是什么公司?主要做什么业务?
A:Datumo是一家总部位于首尔的AI数据公司,最初从事AI数据标注服务,现在主要帮助企业构建更安全的AI,提供无需技术专业知识的工具和数据来测试、监控和改进AI模型。公司拥有超过300个客户,包括三星、LG电子、现代等韩国主要企业。
Q2:Datumo如何与Scale AI等竞争对手区别开来?
A:Datumo通过许可数据集来区分自己,特别是从出版书籍中抓取的数据,提供丰富的结构化人类推理。同时提供名为Datumo Eval的全栈评估平台,可自动生成测试数据和评估,并推出无代码评估工具,专为非开发人员如政策、信任安全和合规团队设计。
Q3:Datumo的发展前景如何?融资将用于什么?
A:公司2024年营收约600万美元,新获得的1550万美元融资将用于加速研发工作,特别是开发企业AI的自动化评估工具,并扩大在韩国、日本和美国的全球市场运营规模。公司已在硅谷建立业务,展现出国际化发展趋势。
好文章,需要你的鼓励
本文探讨如何使用生成式AI和大语言模型作为倾听者,帮助用户表达内心想法。许多主流AI如ChatGPT、Claude等被设计成用户的"最佳伙伴",或试图提供心理健康建议,但有时用户只想要一个尊重的倾听者。文章提供了有效的提示词技巧,指导AI保持中性、尊重的态度,专注于倾听和理解,而非给出建议或判断。同时提醒用户注意隐私保护和AI的局限性。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
人工通用智能和超级人工智能的出现,可能会创造出一种全新的外星智能形态。传统AI基于人类智能模式构建,但AGI和ASI一旦存在,可能会选择创造完全不同于人类认知方式的新型智能。这种外星人工智能既可能带来突破性进展,如找到癌症治愈方法,也可能存在未知风险。目前尚不确定这种新智能形态是否会超越人类智能,以及我们是否应该追求这一可能改变人类命运的技术突破。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。