如今,AI不再只是专业的研究工具,它已成为大学生日常学习的好帮手。
随着AI越来越深入地融入教育环境,需要思考一系列关于学习、评估和技能培养的重要问题。
目前,大多数相关讨论都基于调查和对照实验,却缺乏学生在真实学习场景中自然融入AI的直接证据。
为了填补这一空白,Anthropic开展了一项针对高等教育中AI实际使用的大规模研究,分析了Claude.ai平台上100万条匿名学生对话记录。

报告的主要发现如下:
理工科学生是Claude等AI工具的早期使用者,其中计算机专业尤为突出。计算机专业仅占美国学位的5.4%,但在Claude.ai的对话中,占比却高达36.8%。相比之下,商科、健康科学和人文学科的学生,Claude的使用率相对较低。
总结了学生与AI交互的四种模式,每种模式在数据中的占比大致相同(各占对话总数的23-29%),分别是直接解决问题、直接生成内容、协作解决问题和协作生成内容。
学生使用AI主要是为了创造新知识和进行分析,如创建编程项目或分析法律概念。这与布鲁姆分类法中的高阶认知功能相契合。不过,这也引发了人们的担忧:如何防止学生过度依赖AI,而放弃自身关键认知能力的锻炼?
教育领域的AI使用情况
研究人们如何使用AI模型时,保护用户隐私是重中之重。
Claude Insights and Observations(简称Clio)是一款自动分析工具,能帮助了解人们使用Claude的具体情况。
Clio能深入挖掘用户与Claude的对话内容,将其提炼成诸如「调试代码」「解释经济概念」等高层次的总结,从而发现AI的使用模式。
研究中,Clio分析了来自Claude.ai免费和专业账户约100万条匿名对话。
然后,进一步筛选出与学生学业紧密相关的对话,如课程作业、学术研究,最终得到574,740条有效对话。
接着,Clio对这些对话进行分类汇总,从不同角度得出有价值的见解,包括不同学科在对话中的占比、学生与AI交互方式的差异,以及学生交给AI完成的任务类型等。
学生用AI做什么?
研究发现,学生使用Claude的主要目的,是跨学科地创建和优化教育内容,这类对话占比达到39.3%。
具体为设计练习题、润色论文、总结学术资料等。
33.5%的对话是让Claude为作业提供技术解答,如帮学生调试代码、修复编程错误、实现算法和数据结构,或解答数学难题。
其中部分行为可能存在作弊嫌疑,后面会详细讨论。
另外,还有一部分学生用来分析和可视化数据(11.0%)、辅助研究设计和工具开发(6.5%)、绘制技术图表(3.2%),以及进行翻译和校对(2.4%)。
下图是各学科常见请求的详细分类。

各学科使用AI的情况
通过对比Claude.ai的使用模式和美国各学科颁发学士学位的数量,发现计算机专业使用Claude的比例极高。
虽然计算机专业在学士学位中仅占5.4%,但在Claude.ai的对话中却占了38.6%。这可能是因为Claude在编程方面的独特优势。
自然科学和数学专业Claude.ai的使用占比,也高于这两个专业的学生人数的占比(分别为15.2%和9.2%)。
理工科学生,特别是计算机专业的学生,可能更早地将Claude用于学习。
这可能是因为计算机学生对Claude更熟悉,同时AI系统在处理STEM任务时,也更出色。
商科相关的对话在Claude.ai上仅占8.9%,而商科学位在美国学士学位中占比高达18.6%,可见Claude在商科领域的使用率较低。

学生如何与AI互动
分析学生与AI的交互时,识别出了四种不同的交互模式,按照两个不同维度分类,具体如下图。

第一个维度是「交互模式」,包括:
(1)直接对话,指的是用户期望尽快得到问题的答案,解决自己的疑问。
(2)协作对话,即用户主动与模型展开交流,通过对话来实现自己的目标。
第二个维度是交互的「期望结果」,分为:
(1)解决问题,也就是用户寻求问题的解决办法或解释。
(2)生成输出,意味着用户想要生成像演示文稿、论文这类较长的内容。
这4种交互在对话中的占比相近(均在23%-29%之间),体现了学生对AI的多元应用。
传统的网络搜索通常只能提供直接答案,而AI支持更为丰富的交互方式,为教育带来了新的机遇。
以下是一些用于学习的案例:
阐释哲学概念与理论,帮助理解其内涵。
打造全面的化学学习资料,助力化学知识的学习。
为作业讲解肌肉的解剖结构、生理机能和功能概念。
与此同时,AI也带来了新的难题。
一个备受关注的问题是:「学生在多大程度上利用AI作弊?」
这个问题很难给出确切答案,因为并不清楚Claude的每一个回复在具体学习场景中的实际用途。
比如「直接解决问题」的对话,既可能是学生在居家考试中作弊,也可能只是在检查练习题答案。
「直接生成成果」的对话,也许是学生想直接生成一篇论文,也可能是为进一步研究总结知识要点。
至于协作对话是否属于作弊,也取决于具体的课程规定。
实际上,近一半(约47%)学生与AI的对话属于直接对话,即参与度较低,只是单纯寻求答案或内容。
虽然很多对话是出于合理的学习目的(如询问概念性问题、生成学习指南),但还是发现了一些令人担忧的情况:
让AI提供机器学习选择题的答案。
直接获取英语测试题的答案。
借助AI改写营销和商业文本,以躲避抄袭检测。
这些现象引发了关于学术诚信、批判性思维能力培养,以及如何有效评估学生学习效果的思考和讨论。
即使是协作对话,学习成果也可能存在争议。
比如「求解概率和统计作业问题并给出解释」,虽然涉及学生与AI的多次交流,但大部分思考过程是由AI完成的。
Anthropic会持续关注这些交互情况,努力甄别哪些真正有助于学习和批判性思维的养成。
特定学科的AI使用模式
不同学科的学生与AI的互动方式存在差异。
在自然科学与数学领域,学生的对话多围绕解决问题展开,常见的如「通过逐步计算求解特定概率问题」「为学术作业或考试题目提供详细解答」。
计算机科学、工程以及自然科学与数学专业的学生,更倾向于选择协作对话。而人文、商业和健康领域的学生,在协作对话和直接对话之间的选择相对均衡。
教育领域的对话中,生成输出的需求最为突出,占比达到74.4%。不过,这可能是由于筛选方法不够完善。
这表明,针对不同学科制定专门的AI教育策略,或许能取得更好的效果。

学生交给AI的认知任务
团队还研究了学生将哪些认知任务交给AI处理。
研究采用了布鲁姆分类法,这是一种在教育领域用于将认知过程从简单到复杂进行分类的框架。
虽然该框架最初是针对学生思维设计的,对其进行调整,用来分析Claude与学生对话时的回复。
研究结果显示,Claude主要承担高阶认知功能,创造(39.8%)和分析(30.2%)是最常见的操作。
低阶认知任务的占比相对较低,应用(10.9%)、理解(10.0%)和记忆(1.8%)。

生成学术文本摘要、撰写论文反馈等生成任务,更多涉及创造。而解决微积分问题、解释编程基础知识等任务,则更多运用分析功能。
虽然AI具备这些能力,但这并不意味着学生不能自己运用这些技能。
比如,学生可以和AI共同完成项目,或者在其他场景中利用AI生成的代码来分析数据集。
不过,这确实引发了人们的担忧,学生是否会过度依赖AI,导致自身认知能力发展受阻。
毕竟,如果基础技能得不到锻炼,就如同倒金字塔一样,难以稳固支撑高阶思维的发展。
参考资料:
https://www.anthropic.com/news/anthropic-education-report-how-university-students-use-claude
https://x.com/AnthropicAI/status/1909626720476365171
本文来自微信公众号“新智元”,作者:新智元,编辑:英智,36氪经授权发布。