AI公司Midjourney发布了其首款视频模型。这一AI视频生成的初步尝试将允许用户为图像制作动画效果,无论是在Midjourney中创建的图像还是从其他来源上传的图像。初始生成结果为5秒钟的视频片段,用户可以选择延长4秒,最多可延长4次。目前视频生成功能仅在网页端可用,需要至少每月10美元的订阅才能使用。
Midjourney是AI生成静态图像领域的早期知名公司之一,尽管其他平台已在人工智能发展讨论中占据前沿地位。谷歌最新的I/O大会推出了多款AI视频生成工具,如文本转视频的Veo 3模型和为电影制作者设计的Flow工具。OpenAI去年发布的Sora也是文本转视频选项,而Adobe最新推出的Firefly视频模型可以根据文本或图像提示创建视频。
虽然在视频领域起步稍晚,但这并未阻止创意工作者对其提出指控,声称其模型训练存在违法行为。事实上,这一视频功能发布紧随一起针对该公司的诉讼。迪士尼和NBC环球上周以版权侵权为由起诉了Midjourney。与任何AI工具一样,滥用的可能性始终存在。不过Midjourney已礼貌地要求人们"请负责任地使用这些技术",相信不会出现问题。
好文章,需要你的鼓励
康奈尔大学研究显示,大语言模型驱动的流量转化率比传统搜索高出近9倍。预计到2028年,更多用户将通过ChatGPT等LLM发现产品信息,而非传统搜索引擎。这种转变正在加速发生。LLM流量表现更像个人推荐而非关键词查询,用户查询长度已达23个词,会话时长超6分钟。品牌需要从SEO转向答案引擎优化AEO,确保在LLM对话中被提及,否则将变得不可见。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
Meta豪掷150亿美元押注AI数据工厂Scale AI,19岁辍学的华裔天才如何用"认知套利"打造138亿美元独角兽?"当80%行业信息都是噪音时,独立判断比技术优势更持久。"
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。