全球申请生成式AI专利前10位分别是:腾讯、平安保险、百度、中国科学院、IBM、阿里巴巴、三星电子、Alphabet(谷歌母公司)、字节跳动和微软。(排名按照专利数量)
有一个事情会超出你们的认知,ChatGPT作为全球生成式AI赛道的发起者和代言人,OpenAI申请的专利却出奇的少,在2024年第一季度仅公布了6个专利。
该报告给出的解释是,早期的OpenAI是非盈利开源研究机构,所以没太在意专利的事情;另外一个就是,OpenAI正在对一些商业产品进行保密,避免以专利的方式泄露。
由于报告内容太多,下面「AIGC开放社区」将主要介绍与中国有关的内容,关于生成式AI的技术概念、应用趋势、发展趋势等,可以查看原报告。
报告地址:https://www.wipo.int/web-publications/patent-landscape-report-generative-artificial-intelligence-genai/index.html
这个报告内容非常全面,几乎涵盖了生成式AI所有领域的介绍,无论你是AI老手还是刚入门这个赛道的新鸟都非常值得一看。
两件大事推动生成式AI发展
其实生成式AI这个赛道早在2014年中国就已经开始布局。2014年生成式AI的同族专利(相同类似的申请归为同一类型专利)申请数量只有733个,而2023年已经超过14000多个。
在这10年期间有两件重大事情推动了整个行业的发展:1)2017年Transformer架构的出现,这对于文生视频、音频、图像、文本的影响实在太大。
如今海量开闭源项目都是在此架构上再创新。所以,从2017年开始,生成式AI的专利申请速度超过800%。
2)2022年11月OpenAI正式发布ChatGPT,仅2个月的时间用户突破1亿,成为历史上用户增长最快的消费级应用之一。随后,涌现出了Midjourney、Stable Difusion、Runway等一大批生成式AI产品。
这波浪潮不仅再次带动了专利申请,就连科学出版产品也呈井喷式增长,例如,各种技术概念论文、开发书籍等。截止2024年,生成式AI的科学出版物已经占到整个AI领域的6%,并且会持续保持增长。
中国生成式AI专利大幅度领先世界
根据调查数据显示,在2014——2023年期间,中国申请的生成式AI专利达到38210个,排名第一;美国只有6300个排名第二;
韩国4155个;日本3409个;印度1350个;英国714个;德国708个。
此外,自2017年以来,中国每年在生成式AI公布的专利数量,超过所有其他国家的总和,领先全世界。
在这些专利中,图像和视频成为最火赛道有17996个;文本有13494个;语音或音频有13480个;基于分子、基因和蛋白质增长速度最快平均达到78%,有1494个。
所以,生成式AI专利总体可以分为软件、生命科学、文档管理、业务解决方案、工业和制造、交通、安全和电信8大类。
放眼全球,申请顶级生成式AI专利最多的前10组织中,有6家来自中国。分别是腾讯、平安保险集团、百度、中国科学院、阿里巴巴和字节跳动。
如果扩大到前20家,步步高电子、网易、华为、清华大学、浙江大学、中国移动和国家电网也位列其中。
从学术机构的角度来看申请的生成式AI专利,中国科学院排名第一、清华大学第二、浙江大学第三、加州大学、西北大学、东京大学、瑞士苏黎世联邦理工学院、斯坦福大学等名校上榜。总体上,中国和美国的名校占据了多数名额。
从生成式AI科学出版物的角度来看,包括论文、书籍等,中国科学院排名第一、清华大学排名第二、斯坦福大学第三、Alphabet、上海交通大学、麻省理工、浙江大学、哈佛大学、牛津、北大等名校紧随其后。
此外,中国不仅在全球公布的生成式AI专利中所占份额最大,而且还以每年50%的速度保持高速增长。也就是说别的国家想追上我们,很难、很难~
对于联合国这份调查报告,路透社发表了评论文章,认同中国在生成式AI赛道的领先地位。
全球最大财经媒体CNBC表示,中国拥有顶级的学术机构和技术生态,他们正在推出一系列利好消息和资源来加大对生成式AI的投入,以带动数字经济的发展。同时这里有广阔的应用空间、场景化落地,为企业提供了研发动力和商业氛围。
好文章,需要你的鼓励
NVIDIA团队开发的SANA-Sprint技术实现了AI图像生成的重大突破,将传统需要20步的生成过程压缩至1步,在H100上仅需0.1秒即可生成1024×1024高清图像,速度比现有最快模型提升10倍以上。该技术通过创新的混合蒸馏策略,在大幅提升速度的同时保持了图像质量,并支持实时交互应用,为AI绘画从专业工具向大众应用的转变奠定了基础。
初创公司Positron获得5160万美元A轮融资,推出专门针对AI推理的Atlas芯片。该公司声称其芯片在性能功耗比和成本效益方面比英伟达H100高出2-5倍,并已获得Cloudflare等企业客户采用。Positron专注于内存优化设计,无需液体冷却,可直接部署在现有数据中心。公司计划2026年推出支持16万亿参数模型的下一代Titan平台。
北京人工智能研究院团队开发的DiagNote模型通过模仿人类做笔记的习惯,解决了AI在多轮视觉对话中容易"失忆"的问题。该研究构建了专门的MMDiag数据集,设计了双模块协作的AI架构,让机器学会像人类一样通过标记重点区域来保持专注力,为更自然的人机视觉交流奠定了基础。