Qwen2-VL:阿里巴巴云计算团队开发的多模态大型语言模型系列,具备处理各种分辨率和比例的图像、理解超过20分钟视频、操作移动设备和机器人、以及支持多语言文本理解等多项先进功能。



参考文献:
[1] http://github.com/QwenLM/Qwen2-VL
[2] https://huggingface.co/collections/Qwen/qwen2-vl-66cee7455501d7126940800d
[3] https://modelscope.cn/organization/qwen?tab=model
[4] https://qwenlm.github.io/blog/qwen2-vl/
[5] https://huggingface.co/spaces/Qwen/Qwen2-VL
[6] https://help.aliyun.com/zh/model-studio/developer-reference/qwen-vl-api
好文章,需要你的鼓励
这项由英国谢菲尔德大学的山口敦希研究员、森下照史博士、阿琳·维拉维森西奥教授,以及尼古拉奥斯·阿莱特拉斯教授共同完成的研究发表于2025年
前CodeSee创始人Sheena Leven与AI研究员Sean Robinson联合创立Empromptu,为企业提供AI应用构建服务。该平台允许非技术背景的用户通过与AI聊天机器人对话来构建HTML或JavaScript应用。平台还提供LLM工具供用户微调结果,并支持为现有代码库添加AI功能。公司已获得由Precursor Ventures领投的200万美元种子前融资,资金将用于招聘和技术开发。
中国传媒大学和北京大学联合研究团队开发出革命性视频压缩技术GNVC-VD,首次将视频扩散模型应用于压缩领域。该技术在超低码率下实现86%以上的性能提升,同时显著减少画面闪烁问题。通过"智能重建"替代传统"信息减少"理念,为视频处理领域开辟全新发展方向。