全球申请生成式AI专利前10位分别是:腾讯、平安保险、百度、中国科学院、IBM、阿里巴巴、三星电子、Alphabet(谷歌母公司)、字节跳动和微软。(排名按照专利数量)
有一个事情会超出你们的认知,ChatGPT作为全球生成式AI赛道的发起者和代言人,OpenAI申请的专利却出奇的少,在2024年第一季度仅公布了6个专利。
该报告给出的解释是,早期的OpenAI是非盈利开源研究机构,所以没太在意专利的事情;另外一个就是,OpenAI正在对一些商业产品进行保密,避免以专利的方式泄露。

由于报告内容太多,下面「AIGC开放社区」将主要介绍与中国有关的内容,关于生成式AI的技术概念、应用趋势、发展趋势等,可以查看原报告。
报告地址:https://www.wipo.int/web-publications/patent-landscape-report-generative-artificial-intelligence-genai/index.html
这个报告内容非常全面,几乎涵盖了生成式AI所有领域的介绍,无论你是AI老手还是刚入门这个赛道的新鸟都非常值得一看。

两件大事推动生成式AI发展
其实生成式AI这个赛道早在2014年中国就已经开始布局。2014年生成式AI的同族专利(相同类似的申请归为同一类型专利)申请数量只有733个,而2023年已经超过14000多个。

在这10年期间有两件重大事情推动了整个行业的发展:1)2017年Transformer架构的出现,这对于文生视频、音频、图像、文本的影响实在太大。
如今海量开闭源项目都是在此架构上再创新。所以,从2017年开始,生成式AI的专利申请速度超过800%。

2)2022年11月OpenAI正式发布ChatGPT,仅2个月的时间用户突破1亿,成为历史上用户增长最快的消费级应用之一。随后,涌现出了Midjourney、Stable Difusion、Runway等一大批生成式AI产品。

这波浪潮不仅再次带动了专利申请,就连科学出版产品也呈井喷式增长,例如,各种技术概念论文、开发书籍等。截止2024年,生成式AI的科学出版物已经占到整个AI领域的6%,并且会持续保持增长。
中国生成式AI专利大幅度领先世界
根据调查数据显示,在2014——2023年期间,中国申请的生成式AI专利达到38210个,排名第一;美国只有6300个排名第二;
韩国4155个;日本3409个;印度1350个;英国714个;德国708个。

此外,自2017年以来,中国每年在生成式AI公布的专利数量,超过所有其他国家的总和,领先全世界。

在这些专利中,图像和视频成为最火赛道有17996个;文本有13494个;语音或音频有13480个;基于分子、基因和蛋白质增长速度最快平均达到78%,有1494个。
所以,生成式AI专利总体可以分为软件、生命科学、文档管理、业务解决方案、工业和制造、交通、安全和电信8大类。

放眼全球,申请顶级生成式AI专利最多的前10组织中,有6家来自中国。分别是腾讯、平安保险集团、百度、中国科学院、阿里巴巴和字节跳动。
如果扩大到前20家,步步高电子、网易、华为、清华大学、浙江大学、中国移动和国家电网也位列其中。

从学术机构的角度来看申请的生成式AI专利,中国科学院排名第一、清华大学第二、浙江大学第三、加州大学、西北大学、东京大学、瑞士苏黎世联邦理工学院、斯坦福大学等名校上榜。总体上,中国和美国的名校占据了多数名额。

从生成式AI科学出版物的角度来看,包括论文、书籍等,中国科学院排名第一、清华大学排名第二、斯坦福大学第三、Alphabet、上海交通大学、麻省理工、浙江大学、哈佛大学、牛津、北大等名校紧随其后。

此外,中国不仅在全球公布的生成式AI专利中所占份额最大,而且还以每年50%的速度保持高速增长。也就是说别的国家想追上我们,很难、很难~

对于联合国这份调查报告,路透社发表了评论文章,认同中国在生成式AI赛道的领先地位。

全球最大财经媒体CNBC表示,中国拥有顶级的学术机构和技术生态,他们正在推出一系列利好消息和资源来加大对生成式AI的投入,以带动数字经济的发展。同时这里有广阔的应用空间、场景化落地,为企业提供了研发动力和商业氛围。

好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。