瑞士联邦政府正式发布了其自主研发的人工智能模型SwiGPT,这是一个基于公共数据训练的大语言模型。该模型专门针对瑞士的多语言环境进行了优化,支持德语、法语、意大利语和罗曼什语等瑞士官方语言。
SwiGPT的训练数据完全来源于公共领域,包括政府文件、学术论文、新闻报道和其他开放获取的文本资源。这种做法确保了模型的透明性和合规性,避免了使用受版权保护内容可能带来的法律风险。
瑞士政府表示,开发SwiGPT的主要目的是为公共部门提供一个安全、可控的生成式AI工具,同时保护公民数据隐私。该模型将首先在政府机关内部使用,用于文档处理、多语言翻译和公共服务咨询等场景。
与商用大语言模型不同,SwiGPT完全部署在瑞士境内的服务器上,确保数据不会流出国境。这一做法体现了瑞士对数据主权和信息安全的重视。
瑞士科技部门透露,未来可能会向学术机构和私营企业开放SwiGPT的访问权限,以促进本土AI技术的发展和应用。
Q&A
Q1:SwiGPT是什么?有什么特点?
A:SwiGPT是瑞士政府自主研发的大语言模型,专门针对瑞士多语言环境优化,支持德语、法语、意大利语和罗曼什语等官方语言,完全使用公共数据训练,确保透明性和合规性。
Q2:SwiGPT的训练数据来源是什么?
A:SwiGPT的训练数据完全来源于公共领域,包括政府文件、学术论文、新闻报道和其他开放获取的文本资源,避免了版权风险。
Q3:普通用户能使用SwiGPT吗?
A:目前SwiGPT主要在瑞士政府机关内部使用,用于文档处理、多语言翻译等场景。未来可能会向学术机构和私营企业开放访问权限。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。