瑞士联邦政府正式发布了其自主研发的人工智能模型SwiGPT,这是一个基于公共数据训练的大语言模型。该模型专门针对瑞士的多语言环境进行了优化,支持德语、法语、意大利语和罗曼什语等瑞士官方语言。
SwiGPT的训练数据完全来源于公共领域,包括政府文件、学术论文、新闻报道和其他开放获取的文本资源。这种做法确保了模型的透明性和合规性,避免了使用受版权保护内容可能带来的法律风险。
瑞士政府表示,开发SwiGPT的主要目的是为公共部门提供一个安全、可控的生成式AI工具,同时保护公民数据隐私。该模型将首先在政府机关内部使用,用于文档处理、多语言翻译和公共服务咨询等场景。
与商用大语言模型不同,SwiGPT完全部署在瑞士境内的服务器上,确保数据不会流出国境。这一做法体现了瑞士对数据主权和信息安全的重视。
瑞士科技部门透露,未来可能会向学术机构和私营企业开放SwiGPT的访问权限,以促进本土AI技术的发展和应用。
Q&A
Q1:SwiGPT是什么?有什么特点?
A:SwiGPT是瑞士政府自主研发的大语言模型,专门针对瑞士多语言环境优化,支持德语、法语、意大利语和罗曼什语等官方语言,完全使用公共数据训练,确保透明性和合规性。
Q2:SwiGPT的训练数据来源是什么?
A:SwiGPT的训练数据完全来源于公共领域,包括政府文件、学术论文、新闻报道和其他开放获取的文本资源,避免了版权风险。
Q3:普通用户能使用SwiGPT吗?
A:目前SwiGPT主要在瑞士政府机关内部使用,用于文档处理、多语言翻译等场景。未来可能会向学术机构和私营企业开放访问权限。
好文章,需要你的鼓励
工业升级的关键,或许在于智能本身。“工业+机器人”将成为通向下一阶段工业体系的核心抓手。——黄仁勋。
香港中文大学等机构联合发布TalkVid数据集,包含1244小时高质量说话视频,覆盖7729名不同背景说话者和15种语言。该数据集专门解决现有AI说话视频生成技术的种族、年龄、语言偏见问题。同时发布TalkVid-Bench评估基准,能够检测模型公平性。实验证明使用该数据集训练的模型在各群体上表现均衡,为构建更加公平包容的AI技术奠定基础。
瑞士政府正式发布了自主研发的人工智能模型,该模型完全基于公共数据进行训练。这一举措标志着瑞士在AI技术自主化方面迈出重要一步,旨在减少对外国AI技术的依赖,同时确保数据安全和隐私保护。该模型的推出体现了瑞士对发展本土AI能力的战略重视。
MIT和Jina AI联合开发的jina-code-embeddings代码嵌入模型,通过改造预训练代码生成模型实现高效代码检索。该模型支持自然语言查询代码、技术问答和跨语言代码搜索,尽管参数规模较小(0.5B-1.5B),但在25项基准测试中表现优异,为AI辅助编程和智能开发环境提供了高性价比的基础工具。