AI驱动的记录应用Granola估值达2.5亿美元,在科技行业创始人和风险投资人中备受欢迎。但一位开发者认为市场需要一款更注重隐私、本地运行的替代产品,采用一次性付费而非订阅模式。这促使了新的Mac应用Talat的诞生。
来自英格兰约克郡的开发者Nick Payne自称是计算机极客,他表示构建本地AI记录工具的想法主要源于一系列巧合。
"我认为Granola很棒,它是Electron应用框架在精心打造下能实现功能的典型例子,"他告诉TechCrunch。"当我第一次尝试时,我惊讶地发现它能在我的Mac上录制系统音频而不录制视频,这在当时是标准的解决方案。这引发了大量研究,让我发现了一个相对较新且文档不完善的苹果API。"
为了更容易地使用该API(Core Audio Taps,允许开发者接入Mac音频流),Payne决定创建一个开源音频库AudioTee。
"在那段时间里,我慢慢组建了一个工具包,但始终没有找到能独立成为产品而非仅仅是酷炫技术演示的东西,"Payne说。"最先进的托管转录模型——Granola等应用使用的同类服务提供商——非常出色,看到自己的语音几乎实时展现在屏幕上确实很酷。但我始终担心这种权衡需要提供的不仅是我的数据,还有我的音频数据;我真实的声音。"
随后他偶然发现了名为FluidAudio的软件工具包,这是一个Swift框架,能在苹果设备上实现完全本地化、低延迟的音频AI。它允许你直接在Mac的神经引擎(苹果专用的AI处理硬件)上运行小型、快速的转录模型。
这一发现让Payne意识到他可以将自己的研究转化为实际产品——一个音频永不离开Mac、转录内容不存储在其他公司服务器的产品。
Talat是Payne与长期朋友兼前同事Mike Franklin共同开发的成果,体现了Payne对音频领域的兴趣。最终产品仅20MB大小,采用一次性购买模式,无需创建账户甚至不会向开发者回传分析数据。也没有持续费用。
虽然一些AI记录工具可能功能更丰富,但Talat提供精简的功能集。当你在Zoom、Teams、Meet等会议应用中时,它会捕获计算机麦克风的音频并实时转录。应用会尝试实时分配发言者,但你可以根据需要重新分配。你还可以记笔记,编辑、删除或拆分转录片段。会议结束后,本地大语言模型会生成包含要点、决策和行动项的摘要。
Talat中的笔记、转录和摘要都支持搜索功能。
除了隐私保护,Payne表示目标是为用户提供更多选择。
"我们注重可配置性,让用户控制数据去向:选择自己的大语言模型,自动导出到笔记应用Obsidian,会议结束时推送数据的webhooks,以及按需提取数据的MCP服务器,"他解释道。MCP服务器是AI工具连接外部数据源的标准化方式。
在底层,AI采用混合方案——"主要通过FluidAudio拼接和抽象化,"Payne指出,他认为FluidAudio承担了大部分繁重工作。对于摘要功能,应用默认使用名为Qwen3-4B-4bit的AI模型,即使在相当普通的硬件上也能运行。
不过,用户可以选择切换到任何云端大语言模型提供商,或在两个Parakeet变体(英伟达开发的语音识别模型)之间选择,或指向Ollama(本地运行AI模型的工具),从而更好地控制体验。未来,Talat将增加对更多内置选项的支持,并集成其他应用,如Google Calendar和Notion。
发布时,拥有M系列Mac电脑(运行苹果自主处理器,从M1开始)的用户可以下载应用,免费试用10小时录制时间后再决定是否购买。
Talat在预发布版本中售价49美元,目前仍在积极开发中。
当应用发布1.0版本时,价格将上涨至99美元。
Payne和Franklin正在自筹资金开发Talat,计划继续将核心产品保持为一次性购买模式。
Q&A
Q1:Talat与Granola等AI记录工具相比有什么不同?
A:Talat最大的区别是完全本地运行,用户的音频数据永不离开Mac,转录内容也不存储在其他公司服务器上。它采用一次性付费模式而非订阅制,仅20MB大小,无需创建账户,也不会收集用户分析数据。
Q2:Talat支持哪些会议软件和AI模型?
A:Talat支持Zoom、Teams、Meet等主流会议应用的音频捕获和实时转录。在AI模型方面,默认使用Qwen3-4B-4bit模型,用户也可以选择任何云端大语言模型提供商、英伟达的Parakeet语音识别模型变体,或通过Ollama运行本地AI模型。
Q3:Talat的价格和试用政策是怎样的?
A:目前预发布版本售价49美元,拥有M系列Mac的用户可以免费试用10小时录制时间。当应用发布1.0正式版本时,价格将上涨至99美元。这是一次性购买,没有订阅费用或持续收费。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。