快速且经济的诊断是有效医疗保健的基石,然而每年仍有数百万人因为高昂的医疗成本和冗长的诊断程序而失去生命。
华盛顿大学保罗·G·艾伦计算机科学与工程学院的教授 Shyam Gollakota 正在直面这一关键问题,他利用无处不在的智能手机开发突破性的诊断工具,有望改变医疗保健的可及性,特别是在中低收入国家。
Gollakota 表示:"我们的理念是利用技术来积极影响全球人民,医疗保健就是其中一个领域。智能手机已被用来实现这一理念,为改善中低收入国家人民的生活开发出基于智能手机的经济实惠的医疗保健工具。"
他的努力为他赢得了享有盛誉的 2024 年 Infosys 奖,表彰他在移动系统、机器学习和移动医疗领域的开创性工作。奖项包括一枚纯金奖牌、荣誉证书和 10 万美元奖金。此外,他将参加新的 Infosys 奖驻地计划,在他选择的印度研究机构与研究人员合作一个月。
Gollakota 最具影响力的发明之一是一款用于检测睡眠呼吸暂停的智能手机应用程序。睡眠呼吸暂停是一种与高血压、中风和糖尿病相关的严重睡眠障碍。传统诊断成本高昂,但 Gollakota 的应用程序将智能手机转变为主动声纳系统。通过发射和分析反射声信号,应用程序的算法可以识别睡眠呼吸暂停事件。这个解决方案的优点在于其可及性——任何带有麦克风和扬声器的设备都可以使用它,潜在受益人群可达数百万。
俄勒冈州立大学校长、评审团主席 Jayathi Y. Murthy 说:"Shyam 的研究不局限于正式的边界。它跨越多个工程领域来解决社会问题,并渗透到中低收入国家。"
除了睡眠呼吸暂停,Gollakota 的团队还在使用智能手机检测血栓。通过利用手机的振动电机和摄像头,他们可以追踪铜颗粒的微小运动,并计算凝血酶原时间 (PT) 和国际标准化比值 (INR),这些是血液凝固的重要指标。
针对另一个全球健康问题——据世界卫生组织统计,影响全球 5.3% 人口的听力损失,Gollakota 还开发了可以筛查听力障碍的低成本无线耳机。
这些耳机结合复杂的无线感应算法,可以检测到耳蜗(负责将声波转换为电脉冲的内耳器官)发出的微弱声音。及早发现,特别是在新生儿中,对于减轻听力损失的长期影响至关重要。
Gollakota 的创新精神不仅限于医疗保健。受科幻小说的启发,他致力于为现实世界的问题创造实用解决方案。他在环境反向散射技术方面的工作,通过反射环境信号实现无电池无线通信,对节能和无线技术的未来具有重要意义。这项创新已在手机、相机、水下 Wi-Fi 和电力线网络等多个领域得到应用。
"我只是去解决那些尚未解决或没有得到足够关注的问题,"Gollakota 在班加罗尔的颁奖典礼上说。
Gollakota 的问题解决方法也体现在他在利用人工智能增强人类听觉感知方面的开创性工作中,这项技术允许对声场进行编程,使用户能够根据语义描述专注于特定声音或过滤掉不需要的噪音。这项对人类大脑来说都具有挑战性的复杂任务,为改善各种环境中的听觉体验开启了激动人心的可能性。
他的卓越成就获得了广泛认可,包括入选《麻省理工科技评论》35 岁以下 35 位创新者名单,两次入选《福布斯》30 岁以下 30 人榜单。他还获得了美国国家科学基金会职业奖。
16 年前设立 Infosys 奖以表彰 40 岁以下科学家开创性研究的 Infosys 科学基金会主席 Kris Gopalakrishnan 称赞获奖者:"今年的获奖者展示了非凡的奉献精神和创造力,为解决关键的全球挑战做出了贡献。他们的成就突出显示了科学生态系统的实力,并重申了我们的信念,即科学正在通向创造更美好、更可持续未来的正确道路上。"
好文章,需要你的鼓励
北京交通大学与西蒙弗雷泽大学联合研发的混合神经-MPM方法实现了实时交互式流体模拟。该方法巧妙结合神经物理学与传统数值求解器,在低时空分辨率下运行神经网络并设置保障机制自动切换到MPM,显著降低计算延迟同时保持高保真度。团队还设计了基于扩散模型的控制器,支持用户通过简单草图直观控制流体行为,为游戏、VR和设计领域提供了实用解决方案。
这项研究介绍了EgoZero,一种创新的机器人学习系统,能够仅通过Project Aria智能眼镜捕获的人类示范数据,训练出零样本迁移的机器人操作策略。研究团队提出了一种形态无关的状态-动作表示方法,使用点集来统一人类和机器人数据,并开发了从原始视觉输入中提取准确3D表示的技术。在没有任何机器人训练数据的情况下,EgoZero在7种真实世界操作任务上实现了70%的成功率,展示了强大的泛化能力,为解决机器人学习中的数据瓶颈问题提供了新思路。
FLAME-MoE是卡内基梅隆大学团队开发的首个全透明混合专家语言模型研究平台,包含7个规模从3800万到17亿活跃参数的模型。它采用每层64位专家、top-8选择和2位共享专家的架构,公开所有训练数据、代码和检查点。实验显示,FLAME-MoE比相同计算量的密集模型提升3.4个百分点,并揭示了三个关键发现:专家逐渐专注于特定词汇子集,专家协同激活保持稀疏多样,路由行为在训练早期就趋于稳定。这一平台为MoE模型的系统研究提供了前所未有的开放基础。
这篇论文介绍了ModernGBERT,一个由维尔茨堡大学研究团队开发的高性能德语编码器模型家族(1.34亿和10亿参数版本)。研究将ModernBERT的创新架构应用于德语,同时通过LLM2Vec方法将德语解码器模型转换为编码器以进行对比研究。在SuperGLEBer和MTEB等基准测试中,ModernGBERT 10亿参数模型不仅超越了之前最先进的德语编码器,还在性能和参数效率方面优于转换后的编码器。研究团队还证明了更大模型能有效利用大规模单语语料库,为德语自然语言处理提供了全透明、高性能的资源。