4月7日,CNN消息,美国伊萨卡学院-战略传播学教授Diane Gayeski,正在使用ChatGPT批改学生的论文。
当Diane收到学生提交的论文时,会将部分内容输入到ChatGPT,然后让其进行评分并给出详细的修改建议。
Diane也会让班里的15位学生同样这么做。在写论文时,建议学生将写完的内容输入到ChatGPT,然后给出详细的修改建议。
Diane告诉CNN:“用ChatGPT来当助教是相当不错的体验,它在修改、提出建议方面相当出色。我也会推荐学生来这么做。”
ChatGPT正在融入教育
根据Tyton Partners在2023年发布的一项调查报告数据显示,全美有超过50%的学生用AI来辅助写论文,而老师也开始转向 ChatGPT、微软CoPilot、Writable、Claude.ai等生成式AI平台,来辅助自己对论文进行评分、撰写反馈、制定课程计划和创建作业等。
例如,ChatGPT可以轻松识别出内容拼写错误、语法问题、标点符号的内容,并提出修改建议。
老师通过ChatGPT制定模拟辩论比赛:通过ChatGPT为每方生成论据和反驳点。学生根据这些材料准备辩论,研究和拓展更多的论点。老师还可以用ChatGPT担任评判的角色。
老师向ChatGPT提出教育需求,包括教学目标、主要内容、希望包含的案例研究,快速生成PPT、讲义、教学视频的剧本等。
这样的实际应用案例还有很多,全球不少名校开始鼓励用ChatGPT进行辅助教学,不仅可以将重复、枯燥的内容实现自动化,还能激发老师的教育灵感。
直接用ChatGPT评分论文引发争议
但直接用ChatGPT对论文进行评分,引发了不少教育家的担忧。
弗吉尼亚大学-商业道德教授Dorothy Leidner指出,如果使用ChatGPT进行一些基础的语法、标点符号、内容架构的检查是没问题的,这可大幅度减少老师的疲劳感,同时提升批改准确率。
但使用ChatGPT对论文进行综合评分,这会降低论文的个性化,很可能会让学生的论文趋于同质化缺少创新精神。尤其是硕士、博士的论文,更应该避免这样情况的发生。
此外,将论文直接输入ChatGPT等产品中,会出现暴露隐私的情况,个人私密信息可能会被大模型搜集。
制定教育行业使用ChatGPT规范
最近,一些学校正在积极制定针对教师和学生的使用ChatGPT等AI产品的使用政策。
约翰·霍普金斯大学教育研究与改革中心的研究员 Alan Reid 表示,他最近与K-12教育工作者合作,通过使用ChatGPT等产品在成绩单上,创建季末个性化学生表现评论。
但在应用方面非常谨慎,需要制定详细、正确的使用标准范围,在课堂上的使用、评分范围以及使用禁忌等。如果老师过度依赖ChatGPT进行学生评分,可能会失去思考、创新的本能。
关于伊萨卡学院
伊萨卡学院成立于1892年,,位于美国纽约州的伊萨卡市。该学校的传媒学院位列全美前5名,致力于培养音乐、商业、传媒和体育等跨学科复合人才。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。