麻省理工学院音乐技术与计算(MTC)研究生项目于2024年秋季学期正式启动,由人文艺术与社会科学学院(SHASS)音乐与戏剧艺术系与工学院(SoE)联合创办。2025年5月13日,该项目举办了首届麻省理工音乐科技研究展,地点设于Edward and Joyce Linde音乐楼的Thomas Tull音乐厅,现场座无虚席,吸引了大批观众前来观摩。
本次展览汇聚了MTC首批五名学生(均曾就读于麻省理工本科阶段),以及多位博士生和教师。整场约90分钟的活动融合了技术演示与现场表演,展示内容涵盖:AI钢琴即兴合奏智能体的实时可视化系统、基于网络噪声通信的声音艺术装置、通过舞蹈动作实时生成音乐的嘻哈舞圈,以及利用脑电图(EEG)信号识别大脑所想象音乐旋律的研究。
"为探索与洞见开辟新空间"
活动开幕致辞由SHASS院长、哲学教授Agustín Rayo,工学院院长、化学工程教授Paula Hammond,以及MTC项目主任、音乐实践教授Eran Egozy共同发表。
Rayo表示:"这个项目的目标很明确——让麻省理工引领全球音乐技术理论与应用的发展。它不仅仅是用技术创作音乐,更是要在AI驱动的世界中,通过跨学科协作,共同塑造表达方式的未来。"
他还提到,Edward and Joyce Linde音乐楼于2025年落成启用,提供了全新的教室、录音棚、排练空间和专属音乐科技实验室,这为研究生项目的顺利推进提供了重要支撑。麻省理工施瓦茨曼计算学院也为该项目提供了有力支持。
Hammond则指出,音乐与工程学本质上拥有共同的根基——两者都依赖数学精度,都受既定结构、节奏与频率的影响,也都需要扎实的技术能力与创造性想象的结合。"只有在麻省理工,才能将顶尖技术人才与顶尖音乐人才汇聚一堂,创造出独一无二的协作机会。"
Egozy将本次活动称为"音乐会与学术研讨会的和谐融合",并感慨道:"看到学生们在短短一年内取得的成果,真的令人叹为观止。这届学生向我们证明,在高度集中的时间里,完全可以在学习能力和研究能力上实现巨大飞跃。"
学生研究成果亮点
MTC学生Claire Southard(本科2025届,硕士2026届)开发了一套机器学习模型,能够从脑电图信号中识别出被试者所想象的音符。
Southard介绍道:"每年都有音乐家因帕金森病、肌张力障碍等运动障碍,或因受伤而无法继续演奏。我的研究探索了一种解决方案——通过解读大脑活动,直接将音乐家试图演奏的音乐转化为实际输出,彻底绕过对运动控制的依赖。我训练了机器学习模型来预测用户脑电信号中隐藏的音乐内容,实验结果显示,许多预测结果都能被辨认为用户所想象的曲目。我希望这项研究能让更多音乐家不受身体条件限制,重新回到音乐表演的舞台上。"
Southard坦言,在加入MTC之前,她对这个项目能带给自己的广度与深度并没有充分的预期。"这个项目让我看到了STEM与艺术交叉地带的无限可能。进入项目之初,我甚至不确定什么叫'音乐科技'。通过课程学习、研究实践和与各方人士的交流,我发现这个领域远比想象中宽广、迷人得多。"
另一位MTC学生、2026年SHASS高级学位典礼学生代表Mariano Salcedo(本科2025届,硕士2026届)展示了一款自定义网页应用,任何人都可以通过该应用,根据实时流媒体音乐生成独特的动态视觉效果。他利用自组织系统的复杂视觉行为构建算法,实现了音画之间的美学协同。
在学位典礼致辞中,Salcedo表达了对MTC乃至整个麻省理工社区的感激之情,并呼吁道:"当下这个时代,需要我们走在以人为本、充满人文关怀的技术道路上。这意味着我们不仅要问'能建造什么',还要问'会影响谁''惠及谁',以及'谁会被排除在外'。"
音乐科技在麻省理工蓬勃发展
麻省理工音乐与戏剧艺术系及电气工程与计算机科学系(EECS)副教授Anna Huang是全球领先的人机协作音乐创作研究者,也是麻省理工媒体实验室的校友。她在题为"寻找人机交互中的共鸣"的主题演讲中,进一步深化了Southard和Salcedo的观点,强调在所有AI相关工作中,必须以人类音乐家为核心,同时积极纳入世界各地的多元音乐文化。
Huang在演讲中说道:"能够同时身处麻省理工音乐系和EECS,我感到非常荣幸。在这里,我们与才华横溢的音乐家共同设计,走进录音棚,每周尝试新的可能。技术随着创作过程不断成长,两者相互推动,始终处于前沿探索的边缘。这里是我最有归属感的地方。"
她还介绍了即将于秋季学期开设的新课程——21M.369/569《调谐注意力:动作、声音与AI中的创作实践》,该课程将由她与新任戏剧艺术教授Grisha Coleman联合授课,聚焦声音与动作实践如何启发计算系统的构建,内容涵盖即兴创作、身体感知、动作捕捉技术、生成式建模及人类反馈学习算法等多个维度。
展望未来
MTC项目的发展势头十分强劲。Egozy透露,项目在2026-27学年从逾百名申请者中录取了10名硕士生,且招生范围已从麻省理工本科毕业生拓展至其他高校的毕业生,将为项目注入更多元的背景与视角。与此同时,MTA与EECS的三位共同教师——Mark Rau、Paris Smaragdis(硕士1997届,博士2001届)和Huang——也正通过EECS招募新的音乐科技博士生。
Egozy总结道:"尽管学生们背景各异,但有一个共同点:不仅对音乐有着深厚的热爱,更渴望以温暖、人道主义的方式,借助技术让这份热情走得更远。"
项目展示清单
Rachel Loh(音乐技术与计算Quanta研究员):"面向人机即兴创作的音乐模型内部状态可视化"
Noble Harasha(音乐技术与计算Quanta研究员):"将主观感知与集体感官感知建模为反馈驱动网络中的模拟噪声通信"
Z Chen(音乐技术与计算Quanta研究员):"生成式音乐作为社会编舞的催化剂"
Nithya Shikarpur:"移动无人机:以人声、生成式模型与循环为媒介的印度斯坦音乐即兴表演"
Mariano Salcedo(Alex Rigopulos 1992届音乐技术与计算研究员):"面向交互式音乐可视化的神经细胞自动机"
Claire Southard(John Piscitello音乐技术与计算研究员):"想象音乐的神经解码"
Stephen Brade、Suwan Kim、Valerie Chen:"鲸鱼与大提琴的对话:大提琴与基于鲸鱼歌声训练的实时扩散模型之间的音乐交流"
Q&A
Q1:麻省理工音乐技术与计算研究生项目是什么时候成立的,主要培养方向是什么?
A:麻省理工音乐技术与计算(MTC)研究生项目于2024年秋季正式启动,由人文艺术与社会科学学院与工学院联合创办。项目聚焦于音乐与技术的交叉领域,涵盖AI音乐创作、脑机接口、生成式音乐系统等方向,致力于培养兼具音乐素养与工程能力的复合型人才,并在AI驱动的时代共同探索音乐表达的未来形态。
Q2:Claire Southard的脑电图音乐解码研究具体是怎么实现的?
A:Claire Southard训练了机器学习模型,通过分析用户佩戴脑电图(EEG)设备时产生的脑部信号,预测其正在脑海中想象的音乐内容。实验结果显示,许多预测曲目都能被识别为用户所想象的旋律。这项研究的核心意义在于,它完全绕过了对运动控制的依赖,有望帮助因帕金森病、肌张力障碍或肢体损伤而无法演奏的音乐家,重新通过"意念"来进行音乐创作与表演。
Q3:Anna Huang秋季新课程"调谐注意力"主要教什么内容?
A:该课程全称为《调谐注意力:动作、声音与AI中的创作实践》(21M.369/569),由Anna Huang与戏剧艺术教授Grisha Coleman联合授课。课程探讨声音与动作实践如何启发计算系统的设计思路,聚焦人类与AI之间的关系,内容涵盖即兴音乐创作、身体感知、动作捕捉技术、生成式建模,以及基于人类反馈的可解释性学习算法等,旨在将艺术实践与前沿AI技术深度融合。
好文章,需要你的鼓励
"影子AI"是指员工在未经公司批准的情况下使用AI工具办公。虽然ChatGPT等工具能提升效率,但将内部文件、客户数据或源代码输入未授权平台,可能导致企业数据失控。IBM报告显示,20%的企业存在未授权AI工具,63%尚无AI治理政策。专家建议,一味封禁效果有限,企业应明确哪些工具可用、哪些数据禁止上传,员工也应主动核查AI输出内容,避免将敏感信息粘贴至公共AI平台。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
Hirebotics联合Fanuc发布首款基于无代码Beacon平台的防爆协作喷涂机器人Cobot Painter。该方案适用于金属制造商,无需专用喷涂房或复杂编程,可在现有人工喷涂环境中数日内完成部署。操作人员通过平板或手机的"点击示教"功能即可引导机器人完成路径学习,实现液体涂料、粉末涂装等高精度重复作业,帮助制造商将涂装业务收回自主管理。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。