关于政协第十四届全国委员会第二次会议第02025号(工交邮电类287号)提案答复的函
国科提案规〔2024〕第107号
全国工商联:
你们提出的《关于加快推动人工智能大模型产业应用的提案》收悉。经认真研究,现答复如下。
提案针对我国人工智能大模型产业应用存在的问题,提出强化关键技术研发、促进数据安全共享、加强伦理治理规范、强化人才引培等建议,对提升我国生成式人工智能整体竞争力,推动人工智能快速有序健康发展具有重要意义。
科技部持续加强前瞻系统性布局,强化人工智能大模型基础研究和技术研发部署,建立健全人工智能标准体系和伦理规范,强化技术研发和应用规范指引,加快推动人工智能示范应用场景建设,构建人工智能开放创新生态。
一是持续强化人工智能关键核心技术攻关。实施科技创新2030—“新一代人工智能”重大项目,围绕大数据智能、跨媒体智能、群体智能等方向持续开展攻关,聚焦大模型、博弈智能等前沿方向实施一批旗舰研发项目,强化人工智能大模型架构、算力芯片等底层技术攻关力度。在国家重点研发计划中实施智能传感器、智能机器人等重点专项,推进行业关键共性技术研究。国家自然科学基金设立人工智能一级代码项目,加大对人工智能基础理论研究和重大原始创新的支持力度。
二是扎实推进人工智能伦理治理工作。加强人工智能治理专家队伍建设,成立新一代人工智能治理专业委员会,在国家科技伦理委员会中设立人工智能伦理分委员会,强化伦理治理等重大问题的调查研究和决策咨询。发布《新一代人工智能治理准则》和《新一代人工智能伦理规范》,提出规范人工智能研发与应用的基本准则。2023年联合十部门印发《科技伦理审查办法(试行)》,明确人工智能等新兴领域科技活动的伦理审查要求。
三是加快推动人工智能场景创新和应用示范。2022年科技部联合六部门发布《关于加快场景创新 以人工智能高水平应用促进经济高质量发展的指导意见》,鼓励探索场景驱动的人工智能赋能经济社会发展新模式,各地方积极响应,围绕智慧农场、智能矿山、智能工厂、智能供应链等建设近千个应用场景,推动大模型场景应用落地。布局建设北京、上海、深圳、杭州等18个国家新一代人工智能创新发展试验区,推进人工智能示范应用场景建设。依托人工智能优势企业建设一批“国家新一代人工智能开放创新平台”,鼓励推动行业领域数据和模型算法开源开放,构建有利于人工智能科技创新和产业创新的良好生态。
下一步,科技部将强化人工智能科技创新研发部署,加强大模型领域基础研发布局和关键核心技术攻关力度。加快完善伦理规范、安全与标准体系和治理规则,为大模型技术与产业健康有序发展提供更明确、稳定的规则导向。加快通用人工智能模型创新和领域垂直大模型应用迭代演进,支持建设大规模高质量多模态数据集,推动重大成果转化应用,促进人工智能深度赋能产业变革升级,支撑引领新质生产力形成。
感谢你们对科技工作的支持!
科 技 部
2024年8月15日
你们提出的《关于促进国内生成式人工智能产业发展的提案》收悉。经认真研究,现答复如下。
提案分析了我国生成式人工智能发展存在的系列问题,提出强化关键技术研发、促进数据安全共享、加强伦理治理规范、强化人才引培等建议,对提升我国生成式人工智能整体竞争力,推动人工智能快速有序健康发展具有重要意义。
一、关于加强基础理论研究和关键技术研发的建议
科技部全链条部署人工智能基础研究、技术研发和重大攻关任务。实施科技创新2030—“新一代人工智能”重大项目,围绕大数据智能、跨媒体智能、群体智能等方向持续开展攻关,聚焦大模型、博弈智能等前沿方向实施一批旗舰研发项目。在国家重点研发计划中实施智能传感器、智能机器人、智能农机装备、储能与智能电网、智能交通装备技术等重点专项,推进行业关键共性技术研究。国家自然科学基金设立人工智能一级代码项目,加大对人工智能基础理论研究和重大原始创新的支持力度。
下一步,科技部将持续加强前瞻系统性布局,加强人工智能基础研究布局和关键核心技术攻关。部署开展大模型基础原理和新架构探索,持续完善生成式人工智能原创理论体系。强化分布式高效深度学习框架、大规模认知与推理等关键算法研发,加快通用人工智能模型创新和领域垂直大模型应用迭代演进。加大政策引导力度和资金支持力度,强化芯片、算力等领域关键技术攻关。
习近平总书记强调,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。2022年以来,以ChatGPT为代表的生成式人工智能席卷全球,被视作开启通用人工智能时代的钥匙,成为推动科技跨越发展、产业优化升级、生产力整体跃升的驱动力量。我国积极引导生成式人工智能发展,率先出台规范性政策文件,但是我国生成式人工智能整体竞争力与世界领先国家相比尚存在差距。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。