上周和一位教了十五年物理的朋友聊天,他突然说:“我现在根本不在乎学生能不能默写出牛顿第二定律的公式。” 我一愣。他接着说,“我问他们,如果让你设计一个实验,验证电梯上升时人的体重变化,你做得出来吗?——就这一问,刷掉了八成背公式的孩子。” 那一刻我突然意识到,表现性评价这事儿,早就不是学术论文里的冰冷概念了。它在真实课堂里,正在撕开传统考试的面纱,露出一些我们不愿面对的事实。

它究竟是什么?比‘素质教育口号’实在得多
简单说,表现性评价不是让你在ABCD里打钩。它要你“做”出来——做一个产品,完成一次演示,解决一个真实问题。就像考驾照,没人只让你答交规,最后必须上路。可是,咱们教育的很多领域,比如语文阅读理解,还在用四选一来判断“鉴赏能力”,不荒唐吗?😅 表现性评价瞄准的就是这种割裂:知识在脑袋里,但不等于能用出来。
不过话说回来,很多老师一提它就头疼。“又给我加活?我带两个班,一百多学生,怎么一个个评?” 这抱怨我听过无数次。但有趣的是,那些真的去尝试了的老师,往往发现:原来评价本身就是一种教学。比如,一个历史老师设计任务——让学生以1945年记者的身份,给报纸写一篇报道评述广岛事件。这过程中,学生得查史料、分析立场、构建叙事。老师最后给的评语,比分数管用十倍。你看,这不就是评价即学习吗?💡
为什么国家新课改疯狂暗示它?
翻开2022版义务教育课程方案,里面有一句话让我琢磨了很久:“注重对学习过程的观察、记录与分析,倡导基于证据的评价。” 这不就是在说表现性评价吗?这些年,我们总吐槽“高分低能”,其实不是孩子的问题,是评价指挥棒把“能”定义得太窄了。只测记忆,就只得到记忆。而核心素养——沟通、合作、批判性思维——这些没法在答题卡上显影。

最近在北京、上海的一些学校,我看到了挺欣喜的变化。他们不是取消考试,而是让考试“升级”。比如,数学期末考里,最后一道题不是解方程,而是“设计一个家庭节水方案,用数据说服家长”。学生要测量、统计、计算、画图表,最后写建议书。这才是把数学素养活生生拽了出来。说实话,看着那些孩子煞有介事地展示自己算出的用水模型,我甚至有点感动——原来他们可以这么能干。
设计一个靠谱的表现性任务,得躲开哪些坑?
你可能会想:那我把作业都换成做海报、做PPT不就行了?大错特错!表现性评价的陷阱,往往就藏在“热热闹闹”里。我见过最惨痛的例子:一个英语老师让学生拍短视频介绍家乡,结果全班交上来一堆炫酷剪辑,但仔细一听,英语全是语法错误,念稿的。任务确实“表现”了,但没“评价”到点上。
所以,好的表现性任务要像一把精准的手术刀,而不是散弹枪。它得紧扣评价目标。想评价口语表达能力,那就必须要求脱稿、有互动;想评价合作能力,就得设计出只有分工才能完成的任务。而且,一定要有评价标准——最好让学生也参与制定。就像游戏里的任务说明,规则清楚了,他们才会朝着那个方向使劲。否则,你收获的不是创意,是焦虑。
问:表现性评价是不是只适合文科类科目?理科怎么用?
答:恰恰相反,理科可能更需要。数理化的公式定理,如果不放到情境里,就是死知识。你可以设计一个任务:“用统计知识分析学校食堂的浪费情况,并给出改善建议”。这需要抽样、制表、推断、报告,把概率统计活了。学生不仅学到东西,还顺便参与了校园事务,多好。关键是,老师要敢放手,别怕乱。
问:表现性评价打分太主观了,怎么保证公平?
答:这是最核心的质疑。坦白讲,完全客观不可能,但我们可以用“评分量规”把主观关在笼子里。量规就像详细说明书:从“优秀”到“有待提高”,每个等级都描述具体表现,比如“论证是否用了多种证据”“语言是否连贯”。如果条件允许,多教师交叉评,或让学生自评互评。实测下来,一致性相当高。而且,这比改客观题有意思多了,学生从你给的量规里能读出方向,而不是一个冷冰冰的分数。
最后,我想说点得罪人的话

表现性评价不是魔法,它不能解决所有教育问题。但它像一面镜子,逼着我们去思考:我们到底想培养什么样的人?是知识搬运工,还是问题解决者?如果没有勇气推翻一些陈旧的东西,就别怪孩子“没有创造力”。其实,他们一直有,只是我们没给他们“表现”的机会。哪天,当校园里不再只用试卷来定义学生时,教育才真的变得性感起来。❗
对了,如果你正在尝试,别追求完美。从一个单元、一次作业开始,哪怕只设计一个真实任务,观察学生的反应,你都会发现——他们眼睛里的光,比任何分数都真实。