Qwen2-Audio：多模态AI系统，融合语音对话和音频分析功能

多模态AI系统，融合语音对话和音频分析功能，支持超过8种语言和方言，无需自动语音识别即可进行语音交互，提供音频信息分析和多语言支持。

Qwen2-Audio：多模态AI系统，融合语音对话和音频分析功能，支持超过8种语言和方言，无需自动语音识别即可进行语音交互，提供音频信息分析和多语言支持。

参考文献：
[1] https://qwenlm.github.io/zh/blog/qwen2-audio/

[2] https://huggingface.co/spaces/Qwen/Qwen2-Audio-Instruct-Demo
[3] Qwen2-Audio Technical Repo：https://arxiv.org/pdf/2407.10759
[4] https://github.com/QwenLM/Qwen2-Audio
[5] https://modelscope.cn/organization/qwen?tab=model
[6] https://huggingface.co/collections/Qwen/qwen2-audio-66b628d694096020e0c52ff6

来源：NLP工程化

0赞

好文章，需要你的鼓励

苹果

App Store

塔伦·帕塔克

2026-07-16

苹果在印度恢复银行卡支付功能，距暂停已逾四年

苹果已开始在印度分阶段恢复Apple账户的信用卡支付功能，用户可绑定Visa和Mastercard信用卡及借记卡，用于购买iCloud+、Apple Music订阅及App Store应用。此前，由于印度储备银行于2021年推出新的周期性支付监管框架，苹果于2022年5月暂停了该支付方式。此次恢复标志着苹果在适应各国本地化监管要求方面的持续努力，同时也引发外界对苹果是否将在印度推出Apple Pay的新猜测。

大语言模型

稀疏注意力机制

超长上下文外推

2026-07-16

腾讯混元团队打破AI“记忆瓶颈“：让大模型像人一样拥有超长记忆的新突破

腾讯混元等机构提出HiLS-Attention，通过端到端可学习的分层稀疏注意力机制，让大模型在超长上下文推理中比全量注意力快14倍，同时检索准确率更高。

Bookshop.org

Kobo

ChatGPT

2026-07-16

Bookshop.org确认今年将推出Kobo电子书阅读器支持

Bookshop.org创始人Andy Hunter证实，与Kobo的合作集成将于今年落地。此前该计划历经多次推迟，网页措辞一度从"2026年"改为"未来某时"。Hunter表示，双方已就商业条款达成一致，工程团队正将资源重新投入Kobo支持开发，但尚无具体上线日期。该集成将支持数字版权管理要求，让用户通过Bookshop.org购买电子书，同时支持独立书店。