日本总务省(类似国务院)在官网发布了,2024年(令和6年)生成式AI应用白皮书。
主要查看了日本公民对ChatGPT、Coplilot、Midjourney、Stable Difusion、Gen-2、MusicGen等10多种生成式AI的应用情况,同时对美国、中国、英国和德国的全球主流使用国家进行了横向调查和对比。
结果显示,中国以56.3%的使用率排名第一;美国46.3%排名第二;英国39.8%排名第三;德国34.6%排名第四;日本9.1%第五。在企业对生成式AI的应用方面,中国以71.2%大幅度领先同样排名第一。
这个调查结果与上周美国SAS发布的调查数据一样(点击查看),也就是说中国凭借庞大的“原生数字人口”以及健康、积极的创新技术生态,在生成式AI产品场景化落地和应用方面领先美国、英国、日本等发达国家。
本次调查是以问答形式展开,包括技术概念、市场规模、未来发展预测等多个模块。下面「AIGC开放社区」只介绍主要内容,想查看全部可以去日本总务省官网。
随着ChatGPT、Midjourney等产品的火爆出圈,生成式AI已经像Office一样成为工作、学习、娱乐必不可少的日常工具之一。
当总务省向用户询问生成式AI的使用情况时,中国的使用率为56.3%;美国为46.3%;英国为39.8%;德国为34.6%;日本为9.1%,这相比其他四个国家使用率非常低。
当被问道,为什么不喜欢使用生成式AI时,“我不知道该如何使用”成为回答率最高的答案;
排名第二是,“我的生活中不需要使用这种工具”;第三的是“没有吸引我使用的动力”。
在生成式AI使用业务场景方面,从下方的蓝色选项已经使用的用户回答内容来看。做学术研究是应用第一的场景;第二是总结内容并翻译;第三是对话式聊天机器人,用来获取服装穿搭、旅行建议等。
其他的应用场景包括,获取健康和疾病治疗的建议;用来开发代码等;生成图像和视频等。
总务省又对日本、美国、中国、德国的企业用户进行了应用调查,中国以71.2%的应用率大幅度领先,企业正在积极地制定生成式AI应用策略;美国46.3%排名第二;德国30.1%第三;日本15.7%再次垫底。
在企业应用方面,主要调查了电子邮件、会议记录、文本创建等日常业务场景。美国的总应用率为84.7%排名第一;中国的应用率84.4%排名第二;德国72.7%第三;日本46.8%垫底。
既然使用了生成式AI,那能带来哪些好处和坏处呢?这里只只统计蓝色的绝对答案。
第一,提升企业运营效率并解决劳动力短缺;
第二,能带来灵感,提升创新;
第三,内部数据可能会有泄漏的风险;
第四,大量使用生成式AI,可能会有侵犯知识产权的风险;
第五,如果你不使用生成式AI,那么你的企业将失去竞争力。
日本最大媒体之一日本经济新闻也报道了总务省的这份调查报告,并对日本如此低的生成式AI使用率感到非常惊讶,与中国、美国产生了较大的差距。
这主要是因为,日本人口的老龄化非常严重,原生数字人口一直处于低潮阶段。还有就是日本年轻人对新技术不太感兴趣也不知道该用在哪里,所以,日本需要加强这方面的教育和宣传,从而跟上国际创新技术的发展趋势。
关于日本总务省
日本总务省是由之前的自治省、邮政省和总务厅合并而成。其总部位于东京霞关,是日本中央政府重要机构之一。
日本总务省主要负责广泛的行政事务及公共政策的制定和执行。它在日本的政府架构中扮演着极其关键的角色,涉及到国家的通信、邮政、行政管理、地方自治、选举管理等多个方面。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。