《自然》杂志深度报道清华大学人工智能赋能教育探索实践

10月21日,全球顶尖学术期刊《自然》(Nature)杂志在其官网首页以头条形式刊发了题为“大学正在拥抱AI:学生会变得更聪明还是停止思考?”(Universities are embracing AI: will students get smarter or stop thinking?)的深度专题报道(News Feature)(点击文末“阅读原文”访问报道全文)。该文由《自然》杂志资深编辑海伦·皮尔逊(Helen Pearson)独立撰写,并同步刊登于10月23日出版的《自然》第646卷正刊。

《自然》(Nature)杂志官网首页

文章聚焦探讨生成式人工智能对全球高等教育带来的深刻变革与挑战,在全球范围内选取了清华大学、哈佛大学、麻省理工学院、牛津大学、悉尼大学等近十所世界顶尖高校作为核心案例进行比较分析,其中对清华大学的探索实践给予了最为突出和详尽的呈现。

在报道中,文章开篇即以学校为2025级新生提供AI智能助手作为引入案例,形象地展示了学校将AI融入学生校园生活的积极姿态。随后,文章基于对清华大学在线教育中心主任王帅国的采访,介绍了学校为确保AI科学、高效融入教学而构建的系统性解决方案——“三层解耦架构”。文章详细阐述了该架构如何通过底层接入全球多种先进AI模型、中间层构建包含准确领域知识的“学科知识引擎”、上层支撑多样化教学应用,来克服单一模型依赖、修正AI幻觉,从而为师生提供可靠、灵活的智能支持。文章同时提及,这一由清华牵头研发的系统架构因其设计的先进性和实用性,目前已被国内数百所高校采用,产生了广泛的辐射效应。

作为探讨AI利弊的特稿,文章不仅关注清华的创新实践速度与系统架构设计,更深入呈现了清华在推动技术应用时所秉持的审慎求实的科研态度。文章重点介绍了清华正进行的关于AI助教学习效果的科学研究,引述初步研究发现:使用AI辅导的学生在课后即时测试中表现更优,但长期记忆效果反而可能下降,会存在元认知失衡的风险。这一发现与文中提及的哈佛大学关于AI导师可提升学习效率的研究、MIT关于AI可能导致“认知债务”的研究形成了有益的对话,共同展现了顶尖高校在拥抱AI时的严肃探索与科学反思。

这一深度报道在全球顶尖科学界客观深入地呈现了清华大学在人工智能赋能教育领域的前瞻性布局、系统性实践和深刻反思。这不仅是国际上对清华相关工作的重要认可,更标志着清华在人工智能赋能教育领域的探索实践与前瞻思考,正为全球高等教育的未来发展贡献着独特的“清华智慧”与“清华方案”。

从引领中国慕课建设,到疫情期间支撑全体系在线教学,再到如今积极探索人工智能赋能教育新范式,清华大学始终坚持以前沿信息技术驱动教育教学改革,积极落实国家教育数字化战略部署,为加快建设教育强国、以教育高质量发展支撑中国式现代化贡献力量。

延伸阅读

(以下编译自《自然》杂志深度专题报道,编译工作由清华大学在线教育中心完成。)

大学正在拥抱AI:学生会变得更聪明还是停止思考?

原文作者:Helen Pearson

今年,当新生步入北京的清华大学时,迎接他们的“代表”或许并非人类。这所著名学府的录取通知书中附有一个智能体的邀请码。该智能体旨在回答学生关于课程、社团和校园生活的各种疑问。

在美国哥伦布市的俄亥俄州立大学,学生们今年将必修人工智能课程,作为确保所有毕业生都具备“AI素养”计划的一部分。而在澳大利亚的悉尼大学,学生们则需参加传统的线下考核,以证明他们确实掌握了技能,而没有将其“外包”给AI。

这一切,正是一场席卷全球大学校园巨变浪潮的一部分。全球高校与学生正努力适应以ChatGPT为代表的生成式人工智能工具。这些系统能在数秒内分析复杂信息、回答问题、生成行文流畅的文章——而这些,恰恰构成了大学长期以来教授的核心能力。一项2024年的全球调查显示,86%的大学生在学习中经常使用AI,其他一些调查甚至显示了更高的比例。“我们正目睹学生们成为这些工具的重度用户。”专攻AI与教育研究的密西西比大学研究员马克·沃特金斯(Marc Watkins)指出。

对一些人而言,AI为改进教育、帮助学生适应瞬息万变的世界提供了激动人心的机遇。清华大学和俄亥俄州立大学等高校已将AI融入教学实践——部分研究亦初步表明,AI驱动的工具确能辅助学生学习。一项在哈佛大学物理学本科生中进行的随机对照试验显示,使用定制AI导师的学生相较于仅由人类教师授课的学生,学到了更多知识且用时更少。

但许多教育专家对AI在校园的爆炸式增长深感忧虑:他们担心AI工具因其过于新颖,师生难以有效运用,反而阻碍了学习。教职员工亦担心学生利用AI在作业和考试中“走捷径”,一些研究亦暗示这种心智劳动的“外包”可能会扼杀独立的批判性思维。

同时,一些学者对大学允许甚至鼓励使用AI工具感到愤怒——这些工具大多由商业公司控制,其认知影响未知,且饱受伦理与环境问题的困扰。今年六月,一封反对大学不加批判地采用AI技术的公开信迅速获得了全球逾千名学者的签名。“我们的经费绝不能被浪费在那些几乎不提供回报、并主动剥夺学生技能的盈利性公司身上。”信中写道。

然而,无论热衷者还是怀疑论者,都认同一点:未来已然降临。“全球学生和教职工采用各种生成式AI工具的速度过快,以至于机构政策、教学法和伦理规范都已跟不上。”联合国教科文组织(UNESCO)技术与人工智能教育部门负责人莎菲卡·艾萨克斯(Shafika Isaacs)表示。

人工智能世代

数十年来,大学一直在适应新技术——从计算机、互联网到在线课程。但研究者指出,生成式AI工具带来了根本性的挑战。它们不仅能快速执行大学所教授的核心任务,而且其传播速度和迭代速度都极快。“AI与其他技术的不同之处在于其发展速度。”英国高等教育数字与数据机构Jisc的人工智能负责人苏·阿特维尔(Sue Attewell)说。

全球调查显示,学生们正迅速将AI融入生活。“青少年用户数量简直是天文数字。”沃特金斯说,“全球24岁以下的用户数以亿计。” 科学类学生似乎是先行者。今年,人工智能公司Anthropic分析了其生成式AI Claude与大学生之间的一百万次匿名对话,发现科技、工程和数学(STEM)专业的学生使用比例远超商科和人文学科。

但学生们用AI做什么呢?英国高等教育政策研究所(HEPI)对1000多名英国学生的调查显示,大多数人不出意外地使用AI工具来撰写、改进或总结文本。近90%的学生表示曾在考试或课程作业等评估中使用过生成式AI。其中大多数(58%)用它来解释评估中的概念,25%使用了经编辑后的AI生成文本,8%承认使用了未经修改的AI原文。

主持过关于AI的学生焦点小组讨论的阿特维尔表示,许多学生使用这些工具是为了简化学习、提高效率,而非作弊。她还提到,许多学生只是希望获得如何利用AI促进学习的指导。学生们可能“知道如何在社交媒体或日常生活中出色地使用AI,但这并不意味着他们知道如何在学术上使用它”。

然而,这正是许多大学的不足之处。全球各地的机构一直在仓促地为师生引入关于AI最佳使用方式的政策——但效果参差不齐。在美国校园,“过去两年半一直很混乱,而且我不认为短期内会有改变。”沃特金斯说。他解释道,这是因为许多机构允许个别教员决定在其课程中是否以及如何使用AI,这让一些学生感到无所适从。“一个大一新生可能同时修读五门课,却面对五种不同的AI政策。”

相比之下,教育工作者表示,澳大利亚则采取了强有力的、全国协调的应对措施,部分原因在于其高等教育质量与标准署自2023年起就与各大学合作制定指导方针。而在中国,“将AI融入大学并非可选项,而是国家战略的有机组成部分。”北京师范大学智慧学习研究院联席院长黄荣怀表示。

数据和轶事证据表明,教职员工对AI的接纳比学生更为审慎。研究人员称,一些教职工使用AI工具来自动化自己的工作,例如辅助起草作业反馈,而另一些人则完全拒绝使用。“数字教育委员会”今年对来自28个国家的1600多名教员进行的调查发现,约60%的人在教学中使用AI工具——低于学生的使用比例。然而,80%的人表示其所在机构并未明确如何在教学中使用AI。“教员的使用不如学生那般熟练。”研究技术与教育的南澳大利亚大学学者乔治·西门子(George Siemens)说。

与此同时,OpenAI和Google等大型科技公司一直在向学生和大学推广其产品。“我们被渴望合作的公司淹没了。”俄亥俄州立大学执行副校长兼教务长拉维·贝拉姆康达(Ravi Bellamkonda)说。去年,OpenAI推出了专为大学定制的ChatGPT Edu版本。今年二月,加州州立大学系统宣布为其52万名师生提供该工具的访问权限,据OpenAI称,这成为“全球任何单一组织或公司对ChatGPT的最大规模部署”。八月,Google宣布向美国及少数其他国家的18岁以上学生免费提供其最先进的AI工具。

教育专家指出,科技公司的动机在于商业利益,以及将AI系统根植于数百万年轻用户生活的机会。与科技公司达成协议的大学通常能获得全校范围内的最新AI模型访问权限和数据保护,确保师生数据及学术成果不被用于AI训练。

一些大学正积极主动地拥抱AI浪潮。悉尼大学专攻教育技术的生物学家丹尼·刘(Danny Liu)是首批开发面向高等教育的生成式AI平台的学者之一。该平台名为Cogniti,于2023年开发,现已嵌入该校数字学习平台,允许教师为其课程设计定制化AI智能体。例如,为科学课程模块设计的AI导师,或能将简短评分意见扩展为更具体学生反馈的AI工具。刘表示,Cogniti已被其所在大学的1000多名教育工作者使用,并已分享给全球100多所大学。

在清华大学,学者们在2022年11月ChatGPT发布后也迅速开始了实验,该校在线教育中心主任王帅国介绍道。一年之内,大约涌现出100种不同的教学智能体,学校开始寻求更系统化的整合路径。学校也不希望依赖任何单一AI模型——例如支撑ChatGPT的大语言模型(LLMs)——因为“几乎每天都有新模型问世”,王帅国说。另一个关键目标是纠正“幻觉”,即LLMs有时会生成的不准确内容。

去年四月,清华大学牵头开发了一个中心化的三层“架构”,旨在将AI系统性地融入教学。王帅国介绍,底层接入AI模型:系统调用了来自DeepSeek、阿里云、OpenAI和Google等公司的大约30种模型。中间层包含“知识引擎”(knowledge engines),存储着不同学科领域准确、最新的信息,以确保内容可靠性。顶层则由各种面向学生的平台组成,包括承载教学助理的教育平台,以及帮助清华新生的AI机器人。

例如,作为该系统的一部分,学生可以在课后复习幻灯片时点击“不懂”按钮。这能让他们向弹出的AI智能体提问。中间层会分析问题,将其导向合适的AI模型,并检索自有知识库;然后整合信息,提供准确的答案。王帅国表示,该系统已被中国数百所大学采用。

今年,王帅国的工作重心有所调整,开始启动相关研究,旨在回答一个关键且悬而未决的问题:使用AI工具的学生,其学习效果是否真的得到了提升? 目前尚未发表的初步研究结果已显示出一些令人警惕的信号。王帅国及其同事发现,使用AI辅导的学生在课后即时测试中得分往往高于未使用AI的学生。然而,这种优势并未持续。两到三周后,这些AI使用者的得分反而低于未使用AI的同伴。“学生们可能产生了一种虚假的掌握感(false sense of understanding)” ,他说。

课堂上的隐忧

王帅国并非唯一担忧AI对学生学习产生负面影响的人——正如纳塔利娅·科斯米纳(Nataliya Kosmyna)及其同事在今年六月发布一篇预印本后所经历的那样。该研究初步表明,使用ChatGPT辅助撰写论文的学生,其大脑活跃程度相较于独立写作的学生更低。此后,她收到了全球约4000封来自各级学校教师的邮件,他们担忧这一结果反映了在自己课堂上使用AI的学生正在发生类似的情况。很多情况下,“他们听起来确实非常焦虑。”她说。

科斯米纳是麻省理工学院(MIT)的研究科学家,她和团队使用脑电图(EEG)技术,研究了54名学生在撰写短文(题目如“艺术作品是否有力量改变人生?”)时的大脑电活动模式。学生被分为三组:一组可使用大语言模型(LLM);另一组可使用网络搜索引擎但不能用LLM;第三组仅依靠自身知识。团队通过EEG测量大脑区域间的“连接性”(connectivity),即各区域间信息交流的程度。

研究发现,仅依靠大脑独立写作的学生展现出最强、最广泛的连接模式,并且通常能回忆起自己写的内容。而使用LLM的小组连接性最弱——表明大脑内部信息交流减少——有时甚至几乎记不起自己文章中的任何词句。

科斯米纳承认该研究存在局限性,包括样本量小、未考察长期影响等。(她还觉得颇具讽刺意味的是,一些评论者因使用AI生成对其200页预印本的不准确摘要而曲解了该研究。) 但这项研究无疑加剧了一种普遍担忧:过度依赖AI学习的学生可能无法有效培养批判性思维(critical thinking)等宝贵技能——即分析、评判信息并形成审慎结论的能力。Anthropic公司对一百万次学生与Claude的对话分析亦显示,近半数交互仅仅是用户寻求直接答案或内容,缺乏深入的参与。

领导了六月抗议信撰写的荷兰内梅亨拉德堡德大学计算认知科学家奥利维亚·格斯特(Olivia Guest)表示,过去几年她在学生身上观察到了类似的问题。“他们的能力发生了显著变化。”她表示,一些学生在引用文献或撰写论文方面显得非常吃力。

学生焦点小组的成员们同样感到忧虑,阿特维尔指出。“学生们意识到过度使用AI会导致他们在智力发展上停滞不前。”她表示,一些学生甚至因此开始有意识地减少AI的使用。这也是Jisc今年建议大学应将相关培训融入课程、教导学生负责任地使用AI的原因之一。但俄亥俄州立大学的贝拉姆康达认为这些担忧可能被夸大了,他类比道,使用AI处理某些任务可以释放认知资源用于其他有益的事情,就像使用计算器让人们外包部分数学运算而无重大损害一样。

目前,研究证据并未就AI技术对认知和技能的影响给出定论,研究者们表示,原因在于工具类型多样、研究结果相互矛盾,且严谨的实证研究相对匮乏。伦敦大学学院的教育研究员梅丽莎·邦德(Melissa Bond)在回顾相关文献后强调,对AI技术在教育中的影响,需要开展更稳健、更长期,并涵盖不同学生群体和地域的深入测试。

一些研究表明,若使用得当,AI确实可以促进学习。哈佛大学理论物理学家兼科学教育副主任格雷格·凯斯汀(Greg Kestin)领导了该校AI物理导师的随机对照试验²。在开发该导师系统时,他和同事借鉴了主动学习(active learning)的理念,即学生通过讨论和解决问题来积极地与学习材料互动。大量研究已证明,在人类主导的教学中,主动学习比讲座或教科书等被动方法更为有效。

凯斯汀的AI导师并非直接给出答案,而是引导学生完成学习任务,并促使他们自主理解概念。例如,当学生询问流体从粗管流向细管时压力如何变化时,“AI导师可能会说,‘好吧,让我们退一步思考。你了解哪些会影响流体流动的方程和概念?’”凯斯汀解释道。

在该试验中,近200名本科生被随机分配接受人类教师的标准主动学习物理课,或在家中使用AI导师学习。研究人员在课前后对学生的知识水平进行了测试。结果显示,人类授课组的中位数测试得分从基线2.75分(满分5分)提高到3.5分,而AI辅导组则提高到了4.5分。凯斯汀表示,他之后在一个完整学期内持续试验了AI导师,结果(尚未发表)同样表明学生在这种长期应用中也受益匪浅。

凯斯汀认为,这其中的核心启示在于:“AI既可以帮你代写作业、阻止你思考——也可以帮助你更好地思考。因此,真正的问题在于,你在教育中使用AI的方式,是否能够鼓励批判性思维,是否真正促进了学习?”

评估的困境

教育工作者当前面临的最棘手问题之一是,既然学生可以利用AI工具辅助完成任何非监督测试,那么该如何有效评估他们的真实学习成果。(研究发现,用于检测AI生成文本的工具准确性堪忧。) 如果大学无法有效考核学生,“那将对整个高等教育体系构成巨大威胁。”西门子说,因为大学颁发的学位证书“将不再能有意义地向社会证明毕业生所具备的真实能力”。

一些教育工作者指出,悉尼大学在重新思考评估方式方面走在了前列。今年七月,该校为新学年引入了一个创新的双轨制评估系统(two-pronged system)。所有学生现在都需要参加“安全评估”(secure assessments),如口试、现场实践操作或闭卷笔试,这些评估要求学生本人到场并接受监督。与此同时,他们还将完成非监督评估任务,在这些任务中,一个不同寻常的规定是,教员不得禁止或限制学生使用AI工具。

悉尼大学的丹尼·刘解释说,其背后的理念是激励学生利用非监督评估来发展特定技能(例如撰写实验报告),而他们将需要这些技能来通过有监督的安全测试(例如在实验室内分析数据)。刘表示,这一由他参与设计的系统正被澳大利亚和新西兰的其他大学所采纳。

但刘也认为,AI的到来预示着高等教育需要进行更深层次的反思。“我认为这不仅迫使我们彻底反思教什么,更要反思我们大学存在的根本目的。”他说。他预测,未来教育将“减少对具体内容的关注,增加对人的全面发展(developing the person)的关注”。

在实践中,这可能意味着减少用于记忆事实和生成文本的时间——如果AI能轻松完成这些任务,这些能力在职场上的相对价值可能会下降——而将更多时间用于培养使人们能够在AI时代有效沟通和蓬勃发展的技能。“如果大学能够转向教授判断力、解释能力、批判能力、设计能力以及与AI协作的能力,它们将变得更加不可或缺,而非相反。”研究AI工具的苏黎世瑞士商学院管理研究员迈克尔·格里希(Michael Gerlich)说。

一些研究人员和教育工作者向《自然》杂志表示,他们希望看到大学在与科技公司的互动中展现出更强的自主性和领导力。例如,许多科技公司因其构建的AI工具存在偏见、传播错误信息、利用他人作品作为训练数据以及环境成本高昂等问题而广受批评。“我们不希望大学不加批判地与这些公司建立伙伴关系。”格斯特强调。

西门子则指出,“大学部门对社会负有难以置信的重大责任,要成为一股制衡力量,塑造AI在社会及学习相关流程中的部署方式。” 各大学机构本可以联合起来,向AI公司提出要求,定制具备特定品质的工具,例如“具备适当防护机制以保护用户匿名性且能代表多元人群”的工具,或者能够体现特定教育价值观并保护学生免受潜在伤害的工具。

然而,这种情况并未发生,西门子补充道。大学“简直就像桶里的鱼,坐等这些资金雄厚的科技巨头上门”,然后与它们签订数百万美元的合同,他说。“这无疑体现出大学在AI浪潮面前的领导力真空。”

来源 | 清华大学新闻网

转自 | 清华大学本科教学公众号

展开阅读全文

更新时间:2025-10-28

标签:科技   清华大学   人工智能   自然   杂志   深度报道   学生   大学   工具   清华   全球   悉尼   俄亥俄   公司

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top