在经过为期四个月的有限预览后,Google 现已向更多用户开放其 Veo 2 视频生成模型。该公司已开始向 Gemini Advanced 用户推送这一工具,用户可以利用它生成最多八秒、分辨率为 720p 的视频片段。Google 对该模型解释道:“描述越详细,对最终视频的掌控越强。”
目前,Gemini 仅支持生成 16:9 横屏格式的视频,这意味着它不太适合制作社交媒体视频。话虽如此,Google 提到,通过 Gemini 的分享功能,你可以直接将视频上传至 TikTok 或 YouTube,而通过聊天机器人生成的所有视频都会自动以 MP4 格式保存。相较于之前的版本,Google 表示 Veo 2 对现实物理现象和人体运动的理解更为出色。
如果你想开始使用 Gemini 生成视频片段,则需要订阅 Google 每月 20 美元的 One AI Premium Plan。一旦公司完成 Veo 2 的全面推广,你将可以在网页版和移动端的 Gemini 上使用任何语言生成视频。
另外,Google 正在将 Veo 2 的生成功能引入 Whisk。对于不太了解该应用的用户,Whisk 是 Google Labs 测试平台上提供的一款实验性生成式 AI 应用。它不仅可以通过文本和图像提示生成图片,现在借助于整合了 Veo 2,你还能利用 Whisk 将应用中生成的内容进行动画化处理。
好文章,需要你的鼓励
虽然软件工程师的平均薪酬比运维工程师高出10%以上,且有更多高薪职位晋升机会,但IT运维职业仍有其独特优势。首先,IT岗位入职门槛较低,约62%的运维工程师拥有本科学历,而开发者这一比例为73%。其次,IT工作更加多样化,从服务器故障排除到战略规划都有涉及。此外,IT工程师能更直接地看到工作成果,与最终用户接触更频繁。IT运维还提供更多样的职业发展路径,可转向网络、数据工程、网络安全等领域。最后,相比软件开发,IT运维工作受AI威胁较小。
微软研究院联合多所知名高校开发出SeerAttention-R稀疏注意力框架,专门优化AI推理模型的长序列解码效率。该技术通过自蒸馏学习让AI学会智能筛选重要信息,在保持近乎无损推理准确性的同时,实现了高达9倍的计算加速。系统采用轻量级插件设计,无需重训原模型即可集成,为长文本AI推理应用的普及铺平道路。
CityFibre宣布其专用企业级以太网服务覆盖范围扩大三倍,现可为超过26万家英国企业提供服务。此次扩展基于专用商用以太网平台,由工程合作伙伴Calix提供支持。该公司声称其以太网价格比主要竞争对手便宜20%。此项投资得益于全国范围内10Gbps XGS-PON技术升级,目前已在85%的网络中实施。
哈工大与阿里巴巴团队合作开发了ComfyUI-R1,这是首个专门用于自动化工作流生成的大型推理模型。该模型通过长链推理思维,能够根据用户自然语言指令自动生成可执行的ComfyUI工作流。在7B参数规模下,ComfyUI-R1达到97%格式正确率,在多项评估指标上显著超越GPT-4o等先进模型,为AI内容创作提供了更智能、更易用的解决方案。