去年期末,一位初中历史老师跟我吐槽:“我让学生分析辛亥革命的影响,卷子上的答案完美得像教科书,但让他们向同学解释,一个个干巴巴讲不出。这到底掌握了没有?”——这其实是传统纸笔测验的尴尬。你知道吗?表现性评价就是要打破这种困境。
说白了,它不再问你“知不知道”,而是让你“做出来看看”。就像驾照考试,科目一背得再熟,不上路开一圈,谁敢给你发证?教育,也早就该这样。
什么是表现性评价?简单说就是“做给你看”
很多老师一听到“评价改革”就头疼,觉得又是花架子。其实,表现性评价的核心非常朴素:在真实或模拟的情境中,让学生完成一个任务,通过他们的表现来推断其能力。比如,数学课不只做计算题,而是让学生设计一个小型调查,收集数据、分析并展示——这里面就同时考查了统计、沟通、批判性思维。❗
这跟真实性评价(authentic assessment)理念一脉相承。它强调任务要和现实世界关联。我见过一个小学科学课,孩子们要解决“学校池塘里鱼为什么死了”,得测水质、查资料、写报告,甚至还要向校长提出改进方案。你看,这不就是科学家干的事吗?💡

但这里有个误区:觉得只要动手做了就是表现性评价。错!没有明确的评价量规(rubric),做完任务可能只是热闹一场。量规就是告诉学生:做到什么程度算优秀?哪些维度会被观察?我见过太多活动,最后打分还是凭感觉——这比传统考试还主观,更不公平。
为什么现在这么强调?因为核心素养没法“选择题化”

新课标反复提核心素养,什么批判性思维、合作能力、创新意识……这些东西,能用一张卷子考出来吗?你见过哪个发明家是通过做选择题练成的?🚫 教育部基础教育质量监测中心这几年一直在推表现性评价,就是因为纸笔测试的局限越来越明显。
一个典型的例子:语文的“整本书阅读”。过去考名著,就出几道填空题,背背作者朝代、主要情节就行。现在要求你写书评、做读书分享,甚至改编成课本剧。这就是表现性评价的渗透。说实话,一开始很多老师抵触——备课量太大了,评分也头疼。但坚持下来的发现,学生对文本的理解深度,根本不是原来能比的。
问:表现性评价是不是只适合文科或者实践类学科?数学怎么办?
答:完全不是。数学建模就是个好例子。给一个真实问题,比如“如何安排校车路线最省成本”,学生需要建模、计算、优化,最后拿出方案并向“校领导”陈述。这个过程不仅考察数学应用,还涉及表达、团队协作。许多示范性高中比如北京十一学校,数学考试早就有这样的“闯关任务”了。关键是要有好的任务设计。✅
设计一个好任务,比出100道题都难
这才是最大的挑战。好的表现性任务要满足几个条件:真实性、能引发高阶思维、有清晰的产品或表现、允许不同路径。我最怕看到那种“假装真实”的任务——比如让学生模拟超市购物,但给的价目表全是整数,毫无真实感。那不过是穿了情境外衣的算术题。
还有一点常被忽略:任务最好能让学生卷入情感和价值观。深圳一所初中设计过“为城市流动儿童设计周末活动”的项目,学生们要调研需求、策划方案、联系社区资源。这个任务里,语文、道法、美术全融进去了,而且孩子们的责任感爆棚。这就是表现性评价的高级境界——不只评价认知,还触及态度。

问:表现性评价费时费力,一个班那么多学生,老师怎么忙得过来?
答:确实,这是最现实的阻力。但解决办法也在发展:一是明确核心任务,一学期做2-3个精品就够了,别贪多;二是利用量规让学生自评、互评,反而能培养他们的元认知;三是技术工具,现在有些平台可以记录过程、辅助评分。不过话说回来,如果教育的目标是培养活生生的人,那投入这些时间是值得的,对吧?💪
未来已来:评价即学习

其实,表现性评价的最高境界,是让学生感觉不到在被评价。当他们沉浸于解决真问题、创造真实作品时,评价已经融为学习的一部分。芬兰的现象教学、美国的PBL(项目式学习),本质上都嵌入了这种评价观。国内像上海、浙江的中考改革,已经在部分学科引入实验操作、英语口语人机对话,那就是信号。
我最近在一所小学看到,期末不再全是试卷,而是“素养闯关”——有科学实验解说、有绘本剧表演、有社区问题解决方案展。虽然组织得手忙脚乱,但孩子们眼睛里的光,是刷题刷不出来的。当然,我也得吐槽:有些学校的“闯关”变成变相才艺展示,又歪了。千万别把表现性评价搞成嘉年华,它骨子里是严谨的。❗
所以,如果你是一位老师,不妨从下个单元开始,试着设计一个小任务:让学生给校长写一封信,说服他改进校园某个角落,并附上调研数据。你会发现,原来那些沉默的孩子,也能给你惊喜。
这就是表现性评价的魅力——它让教育回归真实,让成长可见。