前Twitter产品主管Kayvon Beykpour周三宣布推出Macroscope,这是一个面向开发者和产品负责人的AI系统,能够总结代码库更新并捕获漏洞等功能。
Beykpour曾将视频直播初创公司Periscope出售给Twitter,如今他担任Macroscope的CEO。该公司于2023年7月成立,联合创始人包括儿时好友Joe Bernstein,以及曾将计算机视觉和机器学习公司Magic Pony Technology出售给Twitter的Rob Bishop。
该公司将其产品描述为"AI驱动的理解引擎",旨在为工程师节省时间。Beykpour表示,目前工程师使用JIRA、Linear和电子表格等各种工具来跟踪工作进度,在会议上花费太多时间而不是专注于开发,Macroscope正是为了解决这个问题而设计的。
"无论是在我们自己创建的初创公司,还是像Twitter这样的大型公司,我都深刻体验过这种痛苦,"Beykpour在接受采访时说道。"试图了解每个人在做什么,特别是当你在像Twitter这样拥有数千名工程师的组织中时,这几乎占据了我作为Twitter产品主管工作的大部分时间,也是我最不喜欢的部分。"
为了解决这些问题,Macroscope的客户首先需要安装其GitHub应用程序,该应用程序可以访问代码库。然后他们可以选择安装其他集成,如Slack应用、Linear应用和JIRA应用。软件随后通过分析代码并记录变更来完成其余工作。
这涉及一个称为代码遍历的过程,使用抽象语法树(AST)——编程代码的结构化表示——来收集关于客户代码库如何工作的重要上下文。然后将这些知识与大语言模型结合使用。
一旦运行起来,工程师可以使用Macroscope在他们的拉取请求中发现需要修复的漏洞,总结拉取请求,获得代码库变更摘要,并提出基于代码研究的问题。与此同时,产品负责人可以使用该软件获得产品更新的实时摘要、生产力见解、关于产品、代码或开发活动的自然语言问题的答案等。这可以帮助他们确定团队在工程资源分配方面的优先级。
"无论你的技术能力如何,你都可以提出自然语言问题,"Beykpour指出。"如果你想了解代码库而不打扰团队中的高级工程师,这可能非常有用。如果你是CEO,想要了解'我们这周完成了什么?',你的选择要么是询问Macroscope,要么去打扰一些队友。其中一个比另一个昂贵得多。"
虽然没有产品能够直接与Macroscope提供的所有功能竞争,但它确实在代码审查领域存在竞争——在这个领域,开发者在实施代码更改之前检查和测试代码更改——竞争对手包括CodeRabbit、Cursor Bugbot、Graphite Diamond、Greptile等工具。不过,该公司表示,在对100多个真实世界漏洞进行内部基准测试时,其产品比次佳工具多发现了5%的漏洞,同时生成的评论减少了75%。
该软件每月每个活跃开发者收费30美元,最少5个席位起,并为大型企业提供企业定价和定制集成。它需要使用GitHub Cloud。在正式发布之前,许多初创公司和大型企业已经在使用该产品,包括XMTP、Things、United Masters、Bilt、Class.com、Seed.com、ParkHub、A24 Labs等。
这家位于旧金山的初创公司拥有20人团队,获得了3000万美元的A轮融资支持,该轮融资于7月完成,由Lightspeed的Michael Mignano领投。其他投资者包括Adverb、Thrive Capital和Google Ventures。迄今为止,Macroscope总共筹集了4000万美元。
Q&A
Q1:Macroscope是什么产品?主要解决什么问题?
A:Macroscope是一个AI驱动的代码理解引擎,主要解决工程师在跟踪代码库更新、发现漏洞和团队协作方面花费过多时间的问题。它能够自动分析代码变更、总结更新内容,让开发者和产品负责人更高效地了解项目进展。
Q2:Macroscope的核心技术原理是什么?
A:Macroscope使用代码遍历技术,通过抽象语法树(AST)来获取代码库的结构化表示,收集代码如何工作的重要上下文信息。然后将这些知识与大语言模型结合,实现代码分析、漏洞检测和自然语言问答等功能。
Q3:使用Macroscope需要多少费用?有什么要求?
A:Macroscope每月每个活跃开发者收费30美元,最少需要购买5个席位。使用该产品需要GitHub Cloud支持,客户需要先安装GitHub应用程序,然后可以选择性地集成Slack、Linear、JIRA等其他工具。
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。