Pixellot打造的自动化系统,让你跟电视编辑套件彻底说再见
Pixellot可能是世界上体量最大,但公众知名度却最低的体育广播公司。
这家来自以色列的企业并不像ESPN或者DAZN那样举世闻名,但他们举办的赛事数量同样不逊于任何一家体育媒体巨头。
利用人工智能(AI)与自动化技术,这家公司每月制作约10万小时的体育赛事节目。去年,Pixellot在全球范围内举办了超过22万场现场比赛,涵盖足球、篮球、曲棍球以及手球等多个项目。
以往,这些赛事只供现场观众观看,粉丝们可以身居看台感受场上运动员们的激烈比拼。
Pixellot公司CEO Alon Werber在采访中表示,“我们意识到,注册联赛中多达99%的现场比赛都没能以流媒体或者专业转播的形式呈现在人们面前。”
“因此,我们想到,如果能够实现节目制作、流传输以及发布这整个流程的全面自动化,那么一定会带来巨大的市场空间。”
如今,成立于2014年的Pixellot公司已经在全球6500座体育场安装了其自动化系统,其中40%位于美国本土。
在安装完成之后,Pixellot的摄像头就能够实时直播体育赛事,并提供不同镜头角度与实时统计等附加功能。不过该公司并未满足,他们的终极目标是打造一套无需任何摄像机操作员或者节目制作人员的全自动广播节目生产系统。
Werber表示,“由于很多赛事关注度不高,即使只需要一名工作人员,都有可能严重影响成本效益。另外,很多比赛在手机上看的效果不够好,因为有太多细节可能无法及时跟进,甚至很多比赛根本就不会登陆流媒体平台。”
“目前,我们的大部分系统已经实现了全面自动化。除了比赛规划与调度之外,不再需要任何人力的介入。所有一切都将通过计算机视觉、人工智能以及算法来实现。”
“以一家安装有我们系统的美国高中为例,他们提前规划了新的赛季,接下来的比赛都将自动被制作成实况视频。不需要人力介入,所有制作流程都能够自动完成。”
安装在各类专业与业余比赛中的Pixellot系统
AI方案负责观看Pixellot系统中的各个摄像头,跟踪它们在赛事场地上拍摄到的内容,而后将各段视频片段“拼接”为全景视角。
Werber告诉我们,“接下来,我们会持续跟踪赛场上所有的移动对象,并检测比赛状况。”
“以计算机视觉与算法为基础,我们能够在足球比赛中持续关注每位球员的行动,以及足球的具体运动轨迹。以往的摄像机往往无法快速推进至赛场边角,但现在我们使用的是虚拟全景技术,通过摄像头在整个全景图内划定虚拟区域。至于具体的划定方式,将由预设规则与AI共同判断。”
“我们已经拥有超过50万场比赛的庞大数据库,其中包括20万场足球比赛。随着相关数据总量的不断提升,AI的准确性也在持续改进。我们利用深度学习技术跟踪足球动向,并据此完善摄像机的取景能力。”
这种拍摄与视频制作方式带来前所未有的低廉成本,也让很多以往无力播放赛事节目的机构(特别是足球机构)积极与Pixellot签署合作协议。
该公司最近宣布与IMG ARENA达成合作,负责直播英格兰足球乙级联赛下一赛季的英格兰冠军赛节目。在阿根廷,Pixellot则与当地广播公司La Corte合作,负责为女子足球甲级联赛制作节目。这是阿根迁女子甲级联赛中第一次出现广播公司的身影。
阿根廷布宜诺斯艾利斯,4月6日:河床队的Stephanie Melgareio在阿根廷女子足球甲级联赛第九轮比赛期间带球突入竞技俱乐部队防线
从德国到墨西哥,世界各地都存在着众多半职业甚至是业余级别的联赛,其中也包括美国国内的各大高校与中学。而他们,都是Pixellot公司的潜在客户。
Werber指出,“虽然潜在受众不大,但关注者们的热情却相当高涨。”
“这些观众可能是运动员的父母,可能是当地居民,也可能是运动员的孩子。他们正是我们节目的主要受众。”
当然,Pixellot公司也与足球运动领域的顶级俱乐部合作,包括皇家马德里与拜仁慕尼黑,为教练及球探提供强大的视频分析工具。例如,Pixellot能够快速生成赛事剪辑视频并立即共享,亦可根据需求为单独某位球员制作精彩时刻回顾。
9月5日,Pixellot公司CEO Alon Werber在塔霍公园的Soccerex Europe首日活动中发表演讲
Werber表示,该公司目前的年收入已达“数千万”。他指出,到今年年底,伴随研发资金投入以及面向年轻运动员的更多应用产品的陆续上线,该公司将正式开始盈利。
“这类突破性业务总是需要大量投入,但成功之后开辟出的全新市场同样规模可观。”
虽然Pixellot也开始与传统广播公司合作,帮助其制作复杂度更高、在传统上对人力依赖性更强的节目,但Werber表示真正的全自动节目剪辑与制作方案在短时间内还无法实现。
“当然,我们的AI方案没办法制作出像巴萨对皇马那种世纪之战级别的精彩节目。但我们希望改进现有生产体验,让观众能够尽快看到得分、图像以及画面的放大与缩小功能等等。自动化技术在这些方面表现得都很不错。”
“在我看来,AI驱动型生产方式将在常规业务领域占据越来越高的份额。虽然AI在短时间内还玩不转高专业度的17机位拍摄场景,但其普及度必将不断提升。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。