FileAI表示,其已准备好通过全新的智能体人工智能平台为会计、数据收集、金融服务、法律和保险行业的工作流自动化提供强大支持,该平台能够自动化数百项人工和重复性任务。
这家初创公司,正式名称为Bluesheets Pte Ltd.,开发了一个智能体AI平台,专门用于收集和理解各种文件类型的业务数据,包括断开连接的数据库、非结构化格式和孤立系统。该平台将这些数据整合在一起,更好地理解数据并推动自动化发展。
FileAI联合创始人兼首席执行官Christian Schneider表示,能够理解和结合这些不同类型的数据至关重要,因为普通企业高达90%的内容都是非结构化的,分散在PDF、Excel文件、Word文档、电子邮件系统、在线资源等各处。由于这些数据如此分散,它成为业务自动化的主要障碍。FileAI通过将这些碎片化信息转换为清洁、可验证和结构化的数据来解决这个问题,让智能体能够理解这些数据。
"我们始终专注于基础——提供尽可能最清洁、最准确的数据,让AI工作流真正实现自动化承诺,"Schneider说。"我们调用确定性行为,消除幻觉,添加引用并验证每个数据点,超越人类准确性。这不仅仅是升级,而是重新定义文件智能的能力。"
FileAI的平台由多个智能体组成,共同执行各种业务任务,包括一个光学字符识别引擎,能够解析、提取、分类和验证合同、发票、财务报表和图像等数据访问文件,以及一个获取和检索智能体,能够定位和比较不同文件类型并验证其中的信息。
该公司还构建了一个类似ChatGPT的AI驱动答案引擎,使员工能够轻松查询其数据文件,以及一个具有强大访问控制的安全文档存储库,任何添加的文档都可以通过AI进行洞察分析。最后,还有一个推理模型,能够创建复杂的AI数据模式来支持工作自动化。
FileAI平台的综合能力支持智能体执行各种工作,如为保险公司提供索赔处理、保单验证和监管报告,为金融服务客户提供交易验证、客户身份验证检查、对账和风险管理。在供应链行业,其模型可以自动化采购和订单管理,而对于法律团队,它能够比较各种法律条款、审查合同并执行合规检查。
直到现在,FileAI一直在与早期采用者低调运营,但在过去一年中,它已经为这些客户创建了超过4亿个AI模式,总共节省了320万小时的工作时间和6000万美元的处理成本。
FileAI产品和工程主管Tim Prugar表示,公司的发展势头源于上述行业的组织面临着尽可能多地自动化工作的巨大压力。"FileAI为他们提供了访问、结构化和处理关键信息的工具,以推动成功的业务成果,而不是被过时的流程和碎片化数据所拖累,"他说。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。