数据管理初创公司 Instabase Inc. 今日宣布获得 1 亿美元融资,用于支持其产品开发。
卡塔尔投资局领投了这轮 D 轮融资。现有投资方 Greylock Partners、NEA、Andreessen Horowitz 和 Index Ventures 也参与其中。据彭博社报道,此轮投资后 Instabase 估值为 12.4 亿美元,低于 2023 年上一轮融资时的 20 亿美元估值。
总部位于旧金山的 Instabase 提供一个用于处理非结构化数据 (即无法轻易组织成行和列的数据) 的平台。该平台从商业文件中提取信息,对其进行标准化处理,并使其可供其他应用程序使用。自动化处理不仅为员工节省时间,还能降低数据录入错误的风险。
Instabase 可以从 PDF、幻灯片等多媒体文件、手写笔记的扫描件和其他各种记录中提取数据。如果一个记录包含多个文档,Instabase 会将其拆分以便于处理。该平台支持超过 160 种语言,可处理长达数千页的文档。
用户可以使用自然语言提示来指定他们希望从文件中提取哪些数据点。例如,工作人员可以指示 Instabase 保存收据中列出的产品价格。该平台还能在必要时修改提取的数据,比如将价格四舍五入到最接近的整数。
Instabase 在提取内容之前会扫描文件中的错误。该平台可以对会计电子表格进行二次检查,以识别可能计算错误的部分,并发现其他类型的错误。平台还提供了一个工具,使工作人员可以通过与源文档比对来手动验证数据点。
在导入一组记录后,Instabase 可以自动将它们组织成用户指定的格式。然后通过应用程序编程接口 (API) 使其他系统可以访问这些数据。
除了核心的数据提取功能外,Instabase 还提供了一个聊天机器人,让员工可以使用提示与业务记录进行交互。用户可以要求聊天机器人筛选公司的收益报告,并计算过去五年的复合年增长率。Instabase 会显示其执行计算的步骤说明,以帮助用户验证结果。
具有更高级需求的客户可以构建自己的聊天机器人。例如,零售商可以开发一个基于其知识库信息回答常见产品咨询的聊天机器人。
"随着我们进入 AI 时代,如果企业不能首先利用和学习存在于每个组织中的非结构化数据,就无法实现其 AI 能力,"创始人兼首席执行官 Anant Bhardwaj 表示。
公司将利用最新一轮融资来增强其数据提取、分析和搜索功能。
好文章,需要你的鼓励
这项研究由新加坡国立大学团队开发的DualParal技术,通过创新的双重并行架构解决了AI视频生成的长度限制问题。该方法同时在时间帧和模型层两个维度实现并行处理,配合分块降噪机制、特征缓存和协调噪声初始化策略,使生成分钟级长视频成为可能。实验表明,在生成1,025帧视频时,DualParal比现有技术减少了高达6.54倍的延迟和1.48倍的内存成本,同时保持了高质量的视频输出,为内容创作者提供了生成更长、更复杂视频叙事的新工具。
SoloSpeech是约翰霍普金斯大学研究团队开发的创新语音处理技术,针对"鸡尾酒会效应"问题提出了全新解决方案。该系统通过级联生成式管道整合压缩、提取、重建和校正过程,实现了高质量目标语音提取。与传统判别式模型相比,SoloSpeech采用无需说话者嵌入的设计,直接利用提示音频的潜在空间信息与混合音频对齐,有效避免特征不匹配问题。在Libri2Mix及多个真实世界数据集上的评测显示,SoloSpeech在清晰度、质量和泛化能力上均达到了领先水平,为语音分离技术开辟了新方向。
这项由北京大学深圳研究生院、伟湾大学、腾讯ARC实验室和兔小贝智能联合研究的Sci-Fi框架,通过创新的对称约束机制,解决了视频帧间插值中的关键问题。研究团队设计了轻量级EF-Net模块,增强结束帧约束力,使其与起始帧形成平衡影响,从而生成更自然流畅的中间过渡帧。实验证明,该方法在各种场景下都优于现有技术,特别适用于电影制作、动画创作和视频编辑领域,显著降低了人力成本。
这项来自西北大学和谷歌的研究突破了传统马尔可夫强化学习的局限,通过贝叶斯自适应RL框架解释了大语言模型中涌现的反思性推理行为。研究团队提出的BARL算法通过维护多个解题策略的后验分布,指导模型何时何地进行反思性探索,在数学推理任务上展现出显著优势,比基线方法减少高达50%的标记使用量,同时提高了准确率。这一研究不仅解释了"为什么反思有用",还提供了实用的指导原则,为AI系统的自适应推理能力开辟了新方向。