根据英国教育大臣 Bridget Phillipson 的观点,在备课和批改作业中运用人工智能 (AI) 将为教师创造更多与学生互动的时间。
Phillipson 在 Bett Show 上表示,科技与教育的结合是一种"令人极为振奋的关系"。目前政府计划利用 AI 节省教师时间,确保学生获得最好的教育,并加强师生之间的联系。她说:"我将把握这个伟大的科技新时代来推动教育系统现代化,支持教师,为全国的孩子们提供优质教育。"
这些发展源于政府的改革计划——到 2028 年确保 75% 的五岁儿童在入学时达到良好的发展水平,以及其 AI 机遇行动计划——政府计划利用 AI 来"革新"公共服务。
科技一直是政府未来规划的重要组成部分。随着大量企业和个人已经在日常生活中使用生成式 AI 等技术,政府需要正确地将其应用于公共部门。
Phillipson 表示,三分之二使用生成式 AI 的教育工作者认为它产生了积极影响。虽然她承认技术应用既有挑战也有益处,但她指出适应和改变是必然的选择。她说:"即使是五年前的世界也已经永远消失了——已经成为一个过时的年代。"
政府已向 16 个开发商发放了 100 万英镑的资金,用于实施帮助教师批改作业和提供个性化学生反馈的技术。这些技术与教育部现有的 Oak National Academy 备课工具一起,将有助于减轻教师的工作负担。
她表示,目标是利用 AI"减少工作量或帮助解决我们面临的招聘和留任危机,使教学重新成为一个激发喜悦而不是让人筋疲力尽的职业"。
了解实施过程
为了帮助学校投资合适的技术,教育部任命了特许教学学院负责人开发 Edtech Evidence Board,评估哪些技术已经在学校发挥作用。最近推出的"为您的学校规划技术"服务旨在帮助学校了解应该购买什么技术以及如何实施。
对于有特殊教育需求的儿童,Phillipson 表示教育技术可以成为学习的"基础",并宣布在 2025 年,课堂辅助技术的使用培训将成为教师培训的必修课程。
她说:"领导者们告诉我们,有效使用这类技术不仅能对学术成绩产生巨大影响,还能提升孩子们在课堂团队中的自信心。"
在许多情况下,技术行业缺乏包容性文化阻碍了来自不同背景和代表性不足群体的人选择这些职业,根据收集的学生缺勤数据,学校也存在同样的问题。
中学现在可以通过"查看教育数据"工具访问学生缺勤数据,以帮助他们了解如何解决缺课问题。Phillipson 表示,一些孩子不上学是因为"归属感危机"。她希望更多的孩子能开始感受到他们"属于"学校,从而提高出勤率。
Phillipson 强调的现有和未来举措旨在为教师创造更多与学生相处的时间,并加强师生之间的"纽带"。
她说:"这可以追溯到人类最早的时期。此后教育领域的一切,所有为支持儿童而提供的一切,都源于教师与学生之间那种深厚而特殊的关系。"
Phillipson 说:"教师塑造价值观,建立归属感,这就是为什么教育技术如此令人兴奋和强大。因为它将帮助开创学习的新时代,并重振师生之间的纽带。"
但业界担心教师需要更多的帮助和教育才能有效使用这些工具——英国特许信息技术学会 (BCS) 引用了自己的研究,其中 19% 的教师对现在或将来使用 AI 没有兴趣。
BCS 教育与公共利益董事总经理 Julia Adamson 表示:"教师们看到了 AI 在改变他们的工作和学生生活方面的机会,从节省备课时间到为每个年轻人提供个性化学习。"
"但他们需要更好的培训和指导来增强对 AI 的信心,确保其使用公平,并减少教育系统中的不平等。"
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。