破“五唯”是一场事关教育事业长远发展的硬仗。作为一项涉及面广、复杂度高、综合性强的系统工程,我们要不断创新思维方式,积极利用信息技术破解教育评价的“痛点”,扭转不科学的教育评价导向,推动评价理念、评价方式和评价内容的“升级换代”,为教育高质量发展保驾护航。
新技术正在成为教育评价改革的内在变量
教育评价经历了漫长的历史发展过程。早在西周时期,我国就已经形成了较为完整的考试制度。《学记》中记载的“比年入学,中年考校”,就是每隔一年要对学生的学业和品行进行考查,并制定相应的考查标准。之后,隋朝创立了“开科举士”的科举制度,通过地方预选、全国统考和举荐相结合的方式遴选人才,极大地畅通了社会阶层的流动渠道,使贫寒子弟“朝为田舍郎,暮登天子堂”成为可能,对我国封建社会发展产生了深远影响。在西方,古希腊哲学家采用辩论、谈话、实际操作等方式对学生进行考核。在这个阶段,教育评价主要以质性评价活动为主,依靠教师经验或主观判断来评定学生的综合发展水平。
随着现代教育制度的建立,美国教育家泰勒提出了以目标为导向的教育评价原理,根据教育目标编制试题,对学生进行统一测试,按照一定的标准对学生的学习结果进行评分。这种标准化考试侧重评价学生的知识掌握程度和认知发展水平,有效克服了测试者的主观偏差,提高了考试的效度。在实践发展中,教育评价还引入心理测量技术,用数学统计方法对学习结果进行精确描述,常见的测验类型有常模参照测验和标准参照测验。在这个阶段,教育评价主要以纸笔测试为主,通过标准化考试来衡量学生对知识的掌握程度。
近年来,大规模教育评价技术日趋成熟。以经合组织的国际学生评估项目PISA为代表,它结合了学科测验和学生背景信息(家庭社会经济背景、学习动机与策略、学习时间投入、学校教育资源、学校和班级氛围等),采用矩阵抽样、多层线性模型、规则空间模型等测量方法,从多个角度分析学业成就差异的原因。2015年,PISA全面采用计算机测试方法,并构建了大规模的教育评价数据库,在数据挖掘技术的支持下及时发现问题,为各国教育决策提供参考。从这个阶段,教育评价开始引入计算机测试,弥补了纸笔测试难以对学生行为表现(如言语表达能力、动手操作能力、问题解决能力等)进行测量的不足,重点关注学生的能力表现以及学习结果背后的原因分析。
目前,教育评价越来越重视信息技术的重要作用,在实践探索中形成了计算机自适应测验、电子档案袋、学习分析技术、数字画像、基于大数据的课堂观察、区域教育质量监测数据平台等多种评价方式。新技术正在成为教育评价改革的内在变量和活性因子,为破“五唯”带来了新的可能。
新技术推动教育评价理念与方式的深刻变革
随着人工智能、大数据、区块链等新一代信息技术的发展,新技术正在触发一场教育评价方式的深刻变革。今天,我们可以利用技术手段,对评价对象进行多维度、全过程、立体式的考查,在自然情景中采集学生学习的过程性数据,改变过去教育评价的刻意设置特征,实现教育数据的全过程采集和教育结果的适时反馈。评价信息更加多元,既可以是总结性测试的考试分数,也可以是记录学习过程的文字、图片、音频、视频等学习档案,还可以是反映学生能力的调查报告、手工作品、活动总结等学习成果,使评价结果更加合理,读懂学生的真实成长。通过对学生进行精准的数字画像,提供个性化的教育评价服务,改变传统评价过于强调甄别与选拔的现状,使评价、提升、改进融为一体。新技术推动教育评价理念与方式的变革包括:
第一,教育评价将从“容易测量的能力”扩展到“难以测量的素养”。教育领域对分数和成绩的过度关注,固然是教育功利化倾向的必然结果,但也和评价方法不够完善有一定关系。目前,我们还缺乏有效的评价方法和手段,准确衡量学生的高级认知技能和非认知学习成果。2012年,PISA首次引入了计算机测试,在具体的任务情境中评估学生的问题解决能力。2015年,PISA在此基础上构建了真实的任务情境,利用计算机虚拟成员与参与测评的学生合作解决问题,通过评价任务完成过程来检验学生合作解决问题能力。未来,教育评价将从“容易测量的能力”扩展到“难以测量的素养”,通过设置新颖的测试题型、设问方式和任务情境,减少死记硬背的知识性考察,增加能力、素养、思维方式等方面的考察,促使学生主动思考、勇于实践。
第二,教育评价将从“结果视角”转向“过程视角”。评价不是为了证明,而是为了改进。每一次的考试、测验和评估都是阶段性总结,把这些节点数据串联起来发现规律,洞察趋势,才是教育评价的重点。在大数据技术的支持下,教育评价将从“结果视角”转向“过程视角”,通过伴随式的数据采集和自动化的数据分析,评估学生的学习特征与优势潜能,为每一位学生提供学习分析报告,满足不同潜质学生的发展需要,帮助他们持续不断的提升自我。
第三,教育评价将从单向度的考试测验转向多向度的综合素质评价。如何评价学生的心理、品格和个性,一直是教育评价的难点。过去,我们主要采用心理量表进行测量,但存在解释力不足的问题。现在,人工智能领域的深度学习算法提供了新思路。美国斯坦福大学科辛斯基教授设计了一种算法,只需要用户在Facebook(脸书)上的227个点赞行为,就能大致判断出用户的性格特征。这表明,通过网络痕迹可以对学生的人格、兴趣、心理健康等进行预估,为全方位地评价学生提供参考。我们要善于利用信息技术的优势,建立科学的教育质量评价体系,不再用同一把尺子衡量所有学生,把品德、身心发展水平、兴趣特长养成等作为教育评价的主要内容,对不同学生实行差别化评价,鼓励学生发展特长。
教育评价从散点式的成绩记录转向全景式的数据采集
过去,教育评价依赖于学生的考试分数或抽样的截面数据,更多是反映静态事实和集体的平均水平。未来,在新技术的支持下,教育评价将从散点式的成绩记录转向全景式的数据采集,通过学生学习、教师教学、学校发展的大数据,描述学生成长和教育发展的动态过程,发现共性背后的个性特征以及各要素的内在关联,促进学生发展和教育改进。
一是利用学习分析技术建立学习模型,收集学生学习的过程性数据,提供可视化的“学习体检表”,全面展现学生的知识结构、能力表现、内在潜能等方面的数据,并对可能出现的学习困难进行预警和诊断,帮助老师准确把握学生的学习进展和认知特征,为学生提供最优化学习方案。
二是利用区块链技术开展分布式学习记录,建立学生的个人学习成长档案,认证学生的多样化学习成就,重点考察学生的非认知能力发展,有效防止数据丢失或被恶意篡改,助力解决学生综合素质评价中存在的信任问题。
三是利用跨媒体智能技术,探索开展模拟仿真、教育游戏、虚拟任务场景、协作学习环境等新型评价方式,突破传统评价对分数的绝对关注,重点考察学生解决实际问题的能力。引导行业企业、专业机构、社会组织等利益相关方共同参与教育评价,推动考试内容与评价方式的整体转型,使人才培养更加贴合社会需求,提高人才培养的社会契合度。
四是利用大规模的课堂观察技术,对非结构化的课堂行为数据进行分析,包括教师提问类型、学生回答方式、师生对话深度等,全方位透视学校的课堂实施水平,提炼优秀教师的实践性经验,促进教师隐形知识共享,实现信息技术支持下的教师角色转型和教学能力提升。
五是利用可穿戴运动设备,包括智能手环、智能手表、智能运动装备等,采集个人运动及身体健康数据,及时发现学生在体质健康、运动技能等方面存在的问题,提供个性化的改进方案,从而实现伴随成长全过程的形成性评价。
六是利用大数据技术提高教育治理现代化水平,通过全样本、全过程、多模态的数据采集,汇聚形成区域教育大数据,包括学生成长数据、学校运行数据、教育资源配置情况、普职学校规模结构等,帮助管理者获得超越个体或局部的洞察力,提高教育决策的针对性、灵敏性和科学性,努力满足人民群众对多样化高质量教育的需求。
(作者:曹培杰,系中国教育科学研究院副研究员)