前几天,朋友发来一张图片,是他们家孩子小学三年级的期末试卷。我一看,好家伙,题目考的不是死记硬背,全是跨学科情境题——比如给出一段关于植物生长的文字,让学生计算种植面积和所需肥料,同时分析光合作用。这孩子直接懵了。朋友吐槽:“不是说减负吗?怎么越减越难?!”
我苦笑。这哪里是减负的问题,这分明是考试评价改革在倒逼教学啊。很多人不明白,改革的阵痛期,最焦虑的其实是家长和老师。学生反而适应得更快——因为他们还没被完全固化。
一、分数还是命根吗?不一定了
我记得十年前刚入职时,期中考后办公室必然上演“批斗大会”。现在呢?很多学校开始搞过程性评价,把平时的课堂表现、小组合作、项目作业都计入总评。有个数学老师跟我诉苦:“以前一张卷子定乾坤,简单粗暴;现在我得天天观察学生,记录他们的思考过程,工作量翻了三倍!”
但效果呢?说实话,两极分化。自觉的学生如鱼得水,懒惰的学生照样糊弄。上次去一所实验校听课,老师让学生自评、互评,乱成一锅粥。有个男孩给自己打了满分,理由竟然是“我今天心情好”。你看,一搞就乱,一收就死。这就是改革的常态。

那怎么办?退回老路?不可能了。因为时代变了。你看现在的AI,刷题机器人的分数比你还高,但有用吗?我们需要的不是答题技巧,而是解决问题的能力。所以考试命题越来越活,死读书的孩子确实吃亏。
二、过程评价的迷思:为啥总感觉不靠谱?
很多家长质疑:“老师主观打分会公平吗?万一偏心呢?”这真是灵魂拷问。我亲眼见过一个案例:两个孩子做了类似的科学实验报告,一个因为字迹工整画了插图,得了A+;另一个实验设计更严谨但写得潦草,只得了B。家长群炸了。
所以,没有标准的过程评价,就是耍流氓。目前比较靠谱的做法是表现性评价,给出详细的评分规则(Rubric),学生提前知道怎么才能拿高分。比如演讲评分标准:内容深度40%,表达流畅30%,互动效果20%,时间控制10%。这样相对客观。但说实话,执行起来还是难——老师哪有时间给每个孩子写详细评语?一个班四五十人呢。
这时候,技术能不能帮上忙?

三、技术能让评价变聪明吗?

去年去杭州一所中学参观,他们用了一套智能教学系统,能自动采集学生课堂数据:举手几次,回答正确率,小组讨论参与度……然后生成一个数据分析图。校长得意地说:“这叫伴随式评价。”我当时挺震惊的——这不就是《黑镜》里的桥段吗?学生的一举一动都变成数据,细思极恐。
但转念一想,如果有严格的数据隐私保护,这种技术也许能解决“老师没时间”的难题。比如作文批改,AI可以给出初步的语法和结构建议,老师再聚焦内容指导和情感互动。北京有些学校已经在试点“人机协同”评价了。不过,就怕学校只买硬件不更新理念,最后变成电子监控,那还不如不搞。
问:考试评价改革后,考试会不会越来越简单?
答:恰恰相反。改革不是降难度,而是改方式。以前是考记忆,现在是考应用。比如数学题可能给一个真实的购物小票,让你算折扣并判断哪种支付方式更划算。对生活经验少的孩子来说,反而更难。所以家长别高兴太早。
问:综合素质评价到底有多大用?高考会看吗?
答:目前主要在强基计划、综合评价招生等渠道使用。普通高考录取还是分数为王。但趋势是,越来越多省份把综合素质评价作为录取参考,比如浙江的“三位一体”招生。不过,有家长担心这会给特权阶层开后门。所以透明化是关键——所有记录都要公示,经得起查。
四、我为什么对改革既期待又害怕

作为一个十年教龄的老师,我太清楚教育系统的惰性了。每一次改革,初衷都很好:多元评价、减负提质、核心素养……但落地往往走样。比如有的学校,过程性评价变成了填表大赛,老师学生都苦不堪言。
但我不悲观。新一代的校长和老师,很多是在改革中成长起来的。他们自己就受过应试教育的苦,更愿意尝试新事物。上个学期,我搭档的年轻班主任搞了个“学习积分银行”,学生可以通过完成挑战任务赚积分,兑换免作业卡或者选座位权。你猜怎么着?效果出奇的好!管理难度是大,但孩子们眼里有光了。那一刻我觉得,折腾是值得的。
所以,考试评价改革到底能不能成功?我不敢打包票。但至少,我们在路上。这条路坑坑洼洼,可总比原地踏步强。
(全文完)