数据管理初创公司 Instabase Inc. 今日宣布获得 1 亿美元融资,用于支持其产品开发。
卡塔尔投资局领投了这轮 D 轮融资。现有投资方 Greylock Partners、NEA、Andreessen Horowitz 和 Index Ventures 也参与其中。据彭博社报道,此轮投资后 Instabase 估值为 12.4 亿美元,低于 2023 年上一轮融资时的 20 亿美元估值。
总部位于旧金山的 Instabase 提供一个用于处理非结构化数据 (即无法轻易组织成行和列的数据) 的平台。该平台从商业文件中提取信息,对其进行标准化处理,并使其可供其他应用程序使用。自动化处理不仅为员工节省时间,还能降低数据录入错误的风险。
Instabase 可以从 PDF、幻灯片等多媒体文件、手写笔记的扫描件和其他各种记录中提取数据。如果一个记录包含多个文档,Instabase 会将其拆分以便于处理。该平台支持超过 160 种语言,可处理长达数千页的文档。
用户可以使用自然语言提示来指定他们希望从文件中提取哪些数据点。例如,工作人员可以指示 Instabase 保存收据中列出的产品价格。该平台还能在必要时修改提取的数据,比如将价格四舍五入到最接近的整数。
Instabase 在提取内容之前会扫描文件中的错误。该平台可以对会计电子表格进行二次检查,以识别可能计算错误的部分,并发现其他类型的错误。平台还提供了一个工具,使工作人员可以通过与源文档比对来手动验证数据点。
在导入一组记录后,Instabase 可以自动将它们组织成用户指定的格式。然后通过应用程序编程接口 (API) 使其他系统可以访问这些数据。
除了核心的数据提取功能外,Instabase 还提供了一个聊天机器人,让员工可以使用提示与业务记录进行交互。用户可以要求聊天机器人筛选公司的收益报告,并计算过去五年的复合年增长率。Instabase 会显示其执行计算的步骤说明,以帮助用户验证结果。
具有更高级需求的客户可以构建自己的聊天机器人。例如,零售商可以开发一个基于其知识库信息回答常见产品咨询的聊天机器人。
"随着我们进入 AI 时代,如果企业不能首先利用和学习存在于每个组织中的非结构化数据,就无法实现其 AI 能力,"创始人兼首席执行官 Anant Bhardwaj 表示。
公司将利用最新一轮融资来增强其数据提取、分析和搜索功能。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。