大模型之家2024年7月热力榜:视频生成热潮来袭,多模态赛道再升级
巴黎奥运会上,AI技术的应用成为了赛事的一大亮点。从智能裁判系统到运动员训练辅助,再到赛事直播的个性化推荐,AI技术的融入不仅提升了赛事的公平性和观赏性,也让观众享受到了前所未有的观赛体验。
随着夏日的热浪逐渐升温,人工智能领域也迎来了新一轮的热潮。7月,我们不仅也见证了世界人工智能大会上国产大模型企业引人注目的表现,也迎来了2024年巴黎奥运会的盛大开幕,我国先进的技术实力和创新成果,已经在全球舞台上展现了中国AI的硬实力。
巴黎奥运会上,AI技术的应用成为了赛事的一大亮点。从智能裁判系统到运动员训练辅助,再到赛事直播的个性化推荐,AI技术的融入不仅提升了赛事的公平性和观赏性,也让观众享受到了前所未有的观赛体验。
不止体育,多模态大模型正在以前所未有的态势,重铸着各行各业的发展流程。本月,视频大模型技术迎来了一个显著的集中爆发期,这一现象在快手可灵、生数科技的Vidu以及商汤科技的Vimi等视频大模型中得到了充分体现。不仅展现了AI技术在视频内容创作和处理上的创新应用,也标志着多模态领域的快速发展。
通过AI技术在视频领域的深度融合和创新能力,展示视频大模型技术将在内容创作、个性化表达以及多模态交互等方面发挥更加关键的作用,推动整个行业的技术进步和应用拓展。
在2024年《7月大模型热力榜》中,大模型之家榜单共统计189家大模型及其所属企业,较上月新增11家。其中,百度文心一言再次占据热力榜第一名。多家厂商凭借在多模态领域的表现突破重铸榜单格局。
7月4日,百度创始人、董事长兼首席执行官李彦宏在上海世界人工智能大会-产业发展论坛演讲中指出,不同时代的应用发展路径和模式是不同的。移动互联网时代的成功模式不能简单地复制到人工智能时代,避免掉入“超级应用陷阱”。在AI时代,“超级能干”的应用比只看DAU的”超级应用”更重要。
7月26日,商汤科技日日新大模型亮相巴黎,商汤AI智慧篮球产品将全程参与中国国家篮球队的赛事征程,提供运动数据分析及竞技策略优化支持等。将先进的AI技术融入中国篮球运动,开发中国国家篮球队运动表现分析平台。通过构建场地三维模型和3D动作捕捉算法,能够实时解析每位运动员的运动状态和篮球的运动轨迹,助力提升运动员训练效率,同时为竞技策略提供科学依据。
7月25日,“百川智能”完成A轮融资,总融资金额达50亿元人民币。此前,百川智能已经在2023年10月官宣了A1轮融资,披露了包括阿里、腾讯、小米等科技巨头及多家顶级投资机构在内的名单。在A轮融资中,除了上述机构,百川智能还获得了包括北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等国资背景产业投资基金的投资。据了解,A轮融资完成后,百川智能估值已达200亿元,并将以这一估值开启B轮融资。
7月26日,智谱AI发布了新一代的视频生成模型CogVideoX,该模型通过先进的三维变分自编码器结构和位置编码模块,显著提升了视频生成的质量和效率。并同时推出的全新视频生成模型“清影”(Ying)。这一创新技术不仅将文字转化为视频的时间缩短至前所未有的30秒,还为用户提供了多样化的视频风格选择,标志着AI在视频创作领域迈出了重要一步。
7月27日,国际奥委会主席托马斯·巴赫出席了“阿里廊”(Alibaba Wonder Avenue)的开馆仪式,并高度评价了阿里巴巴对奥运会技术进步的贡献。巴赫主席指出,广泛的阿里巴巴AI技术创新将云上转播带到新高度。
据悉,阿里巴巴在奥运会中应用了包括云转播技术、AI增强技术、智慧助手服务、AI大模型应用、360度直播特效、黑白影像AI彩色修复技术以及碳减排辅助技术等多项人工智能技术,这些技术的综合应用不仅极大地提升了赛事的直播效率和观赛体验,还为奥运会的数字化转型和绿色办赛提供了强有力的技术支撑,展示了人工智能在体育领域应用的广阔前景。
7月31日,360集团创始人周鸿祎在ISC.AI2024第十二届互联网安全大会数字安全峰会上宣布360安全大模型正式免费。他表示:“我们要把大模型拉下神坛,把‘免费’贯彻到底,不仅为个人用户提供免费服务、为中小企业提供免费服务,而且要在行业内,第一个宣布安全大模型免费,让人人都能获得大模型带来的技术红利。”
7月,AI短剧在快手可灵平台上的表现引起了广泛关注。AI技术与短剧结合的创新形式,为观众带来了前所未有的观看体验。快手可灵平台表示,AI短剧的成功是平台技术创新和内容战略的重要里程碑。平台将继续投资于AI技术的研发,以推动短视频行业的持续创新和发展。
7月30日,生数科技推出视频大模型Vidu,无需申请,用户直接用邮箱注册即可上手体验。在基础设施层面,Vidu采用了百度百舸AI异构计算平台,实现大模型开发的“快、稳、省”,带宽有效性95%,千卡混合训练效能达95%,有效训练时长98.8%,助力生数科技短时间低成本开发出「逐鹿世界」的多模态大模型。
商汤科技在WAIC 2024上推出的Vimi,是一款面向C端用户的可控人物视频生成大模型,它通过单张照片即可生成与目标动作一致的一分钟长视频,具备精准的人物表情和肢体动作控制能力,同时能够自动补全头发、服饰和背景,并支持光影变化,为视频创作者提供了一个简单、易用且功能强大的创作工具。
0赞好文章,需要你的鼓励
推荐文章
随着数字化时代的到来,网络安全威胁呈指数级增长。勒索软件、AI驱动的网络攻击和物联网设备漏洞成为主要威胁。企业需要建立全面的风险管理策略,包括风险评估、安全措施实施和持续监控。新兴技术如人工智能、区块链和量子计算为网络安全带来新机遇。组织应重视员工培训、供应链安全、数据治理和事件响应能力建设。
滑铁卢大学研究团队开发出ScholarCopilot,一个革命性的AI学术写作助手。该系统突破传统"先检索后生成"模式,实现写作过程中的动态文献检索和精确引用。基于50万篇arXiv论文训练,引用准确率达40.1%,大幅超越现有方法。在人类专家评估中,引用质量获100%好评,整体表现优于ChatGPT。这项创新为AI辅助学术写作开辟新道路。
AWS Amazon Bedrock负责人Atul Deo正致力于让人工智能软件变得更便宜和更智能。他在12月re:Invent大会前只有六个月时间来证明这一目标的可行性。Deo表示AI领域发展速度前所未有,模型每几周就会改进,但客户只有在经济效益合理时才会部署。为此,AWS推出了提示缓存、智能路由、批处理模式等功能来降低推理成本,同时开发能执行多步骤任务的自主代理软件,将AI应用从聊天机器人转向实际业务流程自动化。
哥伦比亚大学研究团队发布NodeRAG技术,通过异构图结构革新智能问答系统。该方法将文档信息分解为7种节点类型,采用双重搜索机制,在多个权威测试中准确率达89.5%,检索效率提升50%以上,为智能信息检索技术带来重大突破。