先别急着问定义。咱们想象一个场景:期末了,五年级的语文老师布置了一个任务——请学生为一本名著设计一个宣传海报,要求写出推荐语,并且附上能证明这本书价值的“证据”。结果呢?有些平时考试分数平平的孩子,交上来的东西会让你大吃一惊。排版、观点、甚至情感表达,都非常到位。这时候你就不得不承认,一张卷子测不出这个。对,这就是表现性评价的雏形。
一、它根本不是什么新花样
很多人以为表现性评价是个时髦概念,是从国外引进的。其实你细想,体育课上的投篮动作、美术课上的素描、音乐课的演奏——哪个不是在评价学生的“表现”?只不过,我们长期被标准化考试裹挟,把这些原本自然的事情给忘了。
真实任务、核心素养、做中学,这些词这几年很热。教育部2022年的新课标里,几乎每个学科都强调了“加强实践性”。为什么?因为靠刷题建立起来的知识结构是脆弱的。而设计一个需要调动理解、创造、合作的真实任务,学生才会把知识用活。这就是表现性评价的核心。

不过话说回来,理论大家都懂,一到操作就抓瞎。上周有个老师私信我,说自己设计了一个跨学科的表现性任务,结果全班收上来一堆差不多的PPT,一看就是家长代劳。她特别沮丧——这评价的到底是谁啊?我特别理解这种崩溃。
二、爱,是因为看见了活生生的人
我亲眼见过一个案例。一个数学老师,平时考试总在后进生名单里的男孩。在学习“统计与概率”单元时,老师布置了一个任务:调查学校食堂午餐浪费情况,分析数据并提出改进建议。这孩子带着小组蹲在泔水桶边数剩菜,然后做了一张特别清晰的数据图表,最后在班会上陈述时,眼里有光。老师后来说,那一刻她觉得自己做的是“人的教育”。
这就是表现性评价的魅力。它把知识从试卷上拽出来,放到真实情境里拷问。你背得了公式,但你能用它解决实际问题吗?你记得住历史年份,但你能用史料论证一个观点吗?这个过程里,那些看似不起眼的能力——沟通、抗挫、批判性思维——全冒出来了。
可惜,接下来的问题就残酷了。
三、怕,怕的是“不准”和“太累”
先回答一个家长特别关心的问题。
问:老师,你说表现性评价好,但它主观性太强了吧?比如作文,不同老师给分能差老远,怎么保证公平?
答:这个问题戳到痛处了。坦白说,完全消除主观不可能,但可以有方法。第一,制定清晰的量规,比如把“演讲能力”分解成语音语调、肢体语言、内容逻辑等维度,每个维度给出可观察的行为描述。第二,多人交叉评分,或者让学生自评互评,形成证据链。第三,任务设计要聚焦关键能力,别什么都想评。其实传统考试的主观题不也一样有误差?只不过表现性评价更透明地暴露了这一点。
还有一个困扰老师的大难题——工作量。我办公室隔壁的年轻老师,为了给学生的项目学习做表现性评价,连续一周批改到晚上十点。她叹着气说,比改卷子累十倍。确实,你要观察、记录、写评语,还常常需要拍照、录音、整理档案。很多学校根本没这个支持系统。
问:那有没有什么省力的办法?老师也是人啊。
答:当然有!我的建议是,别追求完美。一是从“点”开始,一个学期精心设计1-2个表现性任务就够了,不必每个单元都搞。二是善用技术,比如用简单的视频记录代替文字记录,用在线量规工具快速打分。三是把评价融入教学常态化,比如课堂上的小汇报、小组互评,都算,不一定非要搞大型活动。记住,目的是促进学习,不是折磨老师。

四、它要活下去,光靠老师热血不行

我们得清醒点。表现性评价想真正落地,需要学校甚至区域的整体设计。比如,留给老师减负空间,别一边喊着要表现性评价,一边考核分数排名一个不落。还有,给家长做好解释,让大家明白分数不是唯一衡量标准。
最近有个消息挺振奋人心的。一些地区的高考改革,已经在探索将综合素质评价作为录取参考,虽然步子很小,但方向对了。毕竟,未来社会需要的人才,绝不是只会答卷的人。
最后想对所有纠结的老师说一句:你教的东西,很多时候是无法量化的。当一个孩子因为你的一堂课爱上了一个领域,当众表达时不再紧张,这些成长,表现性评价或许能捕捉到一些微光。哪怕很难,也值得。