一家名为Songscription的小公司于上周发布了AI驱动的音乐转录模型,能够在几分钟内将歌曲音频文件转换为乐谱。该产品采用免费增值模式,面向专业和业余音乐家群体。
"我们希望让音乐演奏变得更加愉快,"Songscription首席执行官、斯坦福大学MBA/教育硕士项目学生Andrew Carlins告诉TechCrunch。"我们设想未来内布拉斯加州乡村高中的乐队老师能够为学生们想演奏的歌曲获取乐谱,这些乐谱将专门为乐队中的乐器进行编排,并根据每个学生的演奏水平提供个性化版本。"
目前,Songscription可以为多种不同乐器转录音乐,其中钢琴模型最为可靠。未来,公司希望增加不同的转录输出格式(如吉他谱),以及针对整个乐队而非单一乐器的编排。
这类产品对音乐家很有用,他们可以录制正在创作的歌曲,然后上传获取乐谱,从而跳过手动转录的步骤。对于不会读写乐谱的用户,Songscription还会生成钢琴卷帘,显示虚拟钢琴上演奏音乐的数字表示。
用户还可以直接通过YouTube链接自动进行音乐转录。上传文件时需要用户勾选确认框,确认拥有转录该文件的权利,但用户很容易简单勾选后获取受版权保护歌曲的免费乐谱。
"对于音乐学习者而言...既然你被允许听歌曲、用耳朵记下音符并在家中钢琴上演奏(只要不收费表演),使用技术平台来获得先机是否跨越法律界限并不完全明确,尽管我们理解这个领域在不断发展,我们的应用可能进入灰色地带,"Carlins表示。
围绕创意AI工具使用的合法性问题存在争议,尽管最近的法院判决似乎更倾向于科技公司而非艺术家。然而,Songscription并非创造新的AI生成音乐,而是为音乐家提供工具来加速制作吉他谱或乐谱的过程。
"由于我们的平台允许用户编辑乐谱,我们将自己定位为增强型音乐记谱软件,帮助人们加速转录过程,"Carlins说。
Songscription AI模型的底层架构基于联合创始人Tim Beyer与研究员Angela Dai共同发表的论文。
为了获得创建此类AI模型所需的训练数据,Songscription与一些愿意分享或出售钢琴演奏和乐谱的音乐家合作。公司还使用了公共领域乐谱,尽管大部分训练数据是合成的,Carlins表示。在这种情况下,Songscription会将乐谱转换为音频,然后修改文件以模拟带有背景噪音或混响的真实世界条件。
成立仅七个月后,Songscription已从Reach Capital获得种子前融资,并将参与斯坦福StartX加速器项目。
好文章,需要你的鼓励
LG电视通过系统更新强制安装微软Copilot快捷方式引发争议。虽然LG承诺将允许用户删除该图标,但仍计划在webOS系统中深度整合Copilot功能。三星等厂商也在推进类似AI功能。专家指出,智能电视内置聊天机器人会增加隐私追踪的复杂性,加剧系统臃肿问题。当前智能电视行业正通过用户追踪和广告实现软件盈利,消费者应关注隐私保护问题。
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
网络安全提供商Palo Alto Networks宣布将把关键内部工作负载迁移至谷歌云平台,交易金额近百亿美元。双方将在AI领域深度合作,Palo Alto Networks将使用谷歌Gemini大语言模型为其产品提供AI能力,包括漏洞检测和网络故障排除等功能。此外,公司还将帮助客户保护基于谷歌Vertex AI平台的工作负载,并深化VM-Series虚拟防火墙与谷歌云的集成。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。