经过几年将其开源的 Llama AI 模型仅作为 Connect 大会的一部分后,Meta 正在进行重大革新,主办一场全聚焦生成式 AI 的开发者大会,名为 LlamaCon,定于 4 月 29 日举行。此次活动完全在线进行,您可以在 Meta for Developers Facebook 页面对活动进行实时观看。
LlamaCon 将于美东时间 1PM / 美太时间 10AM 开始,由 Meta 首席产品官 Chris Cox、美 AI 副总裁 Manohar Paluri 以及研究科学家 Angela Fan 发表主题演讲。该主题演讲将介绍公司开源 AI 社区的发展情况、“ Llama 模型与工具集的最新动向”,并预览尚未发布的 AI 功能。
主题演讲之后,于美东时间 1:45PM / 美太时间 10:45AM 安排了一场对话,由 Meta 首席执行官 Mark Zuckerberg 与 Databricks 首席执行官 Ali Ghodsi 围绕“构建 AI 驱动应用程序”展开讨论;紧接着于美东时间 7PM / 美太时间 4PM,Zuckerberg 将与 Microsoft 首席执行官 Satya Nadella 探讨“ AI 的最新趋势”。虽然看来这两场对话均不会用来发布重大新闻,但鉴于 Microsoft 与 Meta 之前有过合作,任何惊喜均有可能出现。
传统上,Meta 并不会等待某个会议才发布 Meta AI 或 Llama 模型的更新。该公司早在 4 月初的一个星期六就推出了全新的 Llama 4 家族模型——这一系列模型在图像理解和文档解析方面表现尤为出色。目前尚不清楚 Meta 是否会为 LlamaCon 保留发布其他新模型或产品。
LlamaCon 将于 4 月 29 日通过 Meta for Developers Facebook 页面进行全程直播,让您能第一时间获取所有详情。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。