说实话,我第一次听到“表现性评价”这个词,是在一次教研会上。当时的感觉是——又来了一个新名词?反正教育界隔三差五就会造些词。但后来,亲眼看到一个孩子为了完成“校园植物图鉴”的任务,主动查资料、画图、甚至说服门卫大爷让他观察角落里的杂草……我才意识到,这真不是噱头。
别把“表现”当成“表演”
曾经观摩过一节公开课,老师让学生分组表演历史短剧,热闹非凡。课后我问一位学生:“你演的秦始皇,为什么统一六国?”他愣住:“因为台词里写了啊。”你看,如果只是穿上戏服走个过场,那就是表演。表现性评价的核心是“表现”,是在真实任务中展现理解和能力,而不是把知识复刻一遍。
所以,它到底是什么?简单说,就是让学生完成一个具有真实情境的复杂任务,比如撰写一份环保建议书、设计一个校园减灾方案、或者为来访客人规划一条游览路线。老师通过观察、收集学生的作品和过程记录,依据事先明确的量规来判断其思考、协作、解决问题等素养水平。它和纸笔测试最大的不同就是——卷子只能测你记住没,表现性评价偏要看你真会了没。

这种评价方式早就不是新鲜事了,但为什么这两年突然火爆?因为2022版义务教育课程方案和课程标准,把“核心素养”摆在了前所未有的高度。我们总说“素养导向”,素养怎么评?靠选择题吗?不可能的。核心素养只能在做事中体现,在表现中评估。于是,表现性评价被推到了前台。
那些让人头疼的实践难题
不过话说回来,真正做起来,真是一把辛酸泪。
我认识的一位初中语文老师,兴冲冲设计了“创办班级文学公众号”的任务,想让读写能力在真实情境中生长。结果呢?学生兴致勃勃了两周,新鲜劲一过,开始应付;家长质疑“天天弄这些,考试怎么办”;她自己更是累得够呛,光是制定一份像样的评价量规就熬了好几个晚上。她苦笑着跟我说:“我这是给自己挖了个坑。”
这太真实了。表现性评价常常面临三个坎:任务设计难(怎么找既真实又匹配课标的任务?)、评价量规难(怎么描述不同水平的表现?)、实施耗时多(怎么平衡课时和精力?)。

但❗千万别因为这些困难就回到只考标准答案的老路上去。我们完全可以“小步走”:一个学期重点做1-2次表现性评价,选那些最值得的核心素养;量规可以先和学生一起商量着制定,哪怕粗糙点,也比没有强;至于时间,可以和综合实践活动、校本课程结合,而不是额外加码。
接下来,你可能最关心的问题——
问与答:那些真实困惑

问:表现性评价是不是就是做项目、搞展示?
答:真不是!项目学习是载体之一,但表现性评价的灵魂是“评价”——必须有清晰的评价目标、量规和证据收集。一个项目如果没有聚焦特定的素养,没有基于证据的判断,就只是活动而已。反过来,表现性评价也可以很简单,比如一次5分钟的口头论证、一张思维导图、一份实验报告,只要它要求学生“创造性地表现”出理解。
问:这样评价,公平吗?会不会太主观?
答:这是最大的顾虑。坦白讲,如果只靠老师随便打分,确实主观。解决办法就是量规。好的量规会把表现分成几个维度,每个维度有清晰的等级描述,就像游泳比赛的评分一样,有标准可依。而且,量规最好提前给学生——甚至和学生一起制定——这样评价就成了学习的脚手架,不再神秘。另外,多主体评价(自评、互评)也能分散主观风险。说到底,公平不是来自标准答案,而是来自公开透明的标准。
问:那和形成性评价有什么区别?
答:表现性评价可以是形成性的,也可以是终结性的。它最独特的是任务形态:要求学生在真实挑战中“表现”素养。形成性评价强调过程中的反馈与调整,可以发生在任何评价方式里;而表现性评价的特质是任务设计——你必须做出一件“东西”或用行动证明自己。所以,两者是交叉关系,不是一回事。
最后想分享一个触动我的瞬间。去年在一所农村小学,科学老师让学生制作“月相观察日记”。一个内向的女生,连续一个月每晚画月亮,感冒了也不间断。她在日记最后写道:“原来月亮真的会变脸,和书上一模一样。”那一刻,我突然理解了——表现性评价不只是评价,更是在创造一种学习体验,让孩子看见知识与生活的联系。
我们总说“为理解而教”,那么评价也该为理解而评。这条路不容易,但值得。你说呢?