一家名为Songscription的小公司于上周发布了AI驱动的音乐转录模型,能够在几分钟内将歌曲音频文件转换为乐谱。该产品采用免费增值模式,面向专业和业余音乐家群体。
"我们希望让音乐演奏变得更加愉快,"Songscription首席执行官、斯坦福大学MBA/教育硕士项目学生Andrew Carlins告诉TechCrunch。"我们设想未来内布拉斯加州乡村高中的乐队老师能够为学生们想演奏的歌曲获取乐谱,这些乐谱将专门为乐队中的乐器进行编排,并根据每个学生的演奏水平提供个性化版本。"
目前,Songscription可以为多种不同乐器转录音乐,其中钢琴模型最为可靠。未来,公司希望增加不同的转录输出格式(如吉他谱),以及针对整个乐队而非单一乐器的编排。
这类产品对音乐家很有用,他们可以录制正在创作的歌曲,然后上传获取乐谱,从而跳过手动转录的步骤。对于不会读写乐谱的用户,Songscription还会生成钢琴卷帘,显示虚拟钢琴上演奏音乐的数字表示。
用户还可以直接通过YouTube链接自动进行音乐转录。上传文件时需要用户勾选确认框,确认拥有转录该文件的权利,但用户很容易简单勾选后获取受版权保护歌曲的免费乐谱。
"对于音乐学习者而言...既然你被允许听歌曲、用耳朵记下音符并在家中钢琴上演奏(只要不收费表演),使用技术平台来获得先机是否跨越法律界限并不完全明确,尽管我们理解这个领域在不断发展,我们的应用可能进入灰色地带,"Carlins表示。
围绕创意AI工具使用的合法性问题存在争议,尽管最近的法院判决似乎更倾向于科技公司而非艺术家。然而,Songscription并非创造新的AI生成音乐,而是为音乐家提供工具来加速制作吉他谱或乐谱的过程。
"由于我们的平台允许用户编辑乐谱,我们将自己定位为增强型音乐记谱软件,帮助人们加速转录过程,"Carlins说。
Songscription AI模型的底层架构基于联合创始人Tim Beyer与研究员Angela Dai共同发表的论文。
为了获得创建此类AI模型所需的训练数据,Songscription与一些愿意分享或出售钢琴演奏和乐谱的音乐家合作。公司还使用了公共领域乐谱,尽管大部分训练数据是合成的,Carlins表示。在这种情况下,Songscription会将乐谱转换为音频,然后修改文件以模拟带有背景噪音或混响的真实世界条件。
成立仅七个月后,Songscription已从Reach Capital获得种子前融资,并将参与斯坦福StartX加速器项目。
好文章,需要你的鼓励
谷歌Agent Development Kit(ADK)革新了AI应用开发模式,采用事件驱动的运行时架构,将代理、工具和持久化状态整合为统一应用。ADK以Runner为核心,通过事件循环处理用户请求、模型调用和外部工具执行。执行逻辑层管理LLM调用和工具回调,服务层提供会话、文件存储等持久化能力。这种架构支持多步推理、实时反馈和状态管理,为构建超越简单聊天界面的生产级AI应用提供了完整框架。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
苹果在iOS 26中推出全新游戏应用,为iPhone、iPad和Mac用户提供个性化的游戏中心。该应用包含五个主要版块:主页展示最近游戏和推荐内容,Arcade专区提供超过200款无广告游戏,好友功能显示Game Center动态并支持游戏挑战,资料库可浏览已安装游戏并提供筛选选项,搜索功能支持按类别浏览。iOS 26.2版本还增加了游戏手柄导航支持,为游戏玩家提供更便捷的操作体验。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。