考试评价改革为何总在“翻烧饼”？一位一线教师的十年观察-如东教育网

前几天，朋友发来一张图片，是他们家孩子小学三年级的期末试卷。我一看，好家伙，题目考的不是死记硬背，全是跨学科情境题——比如给出一段关于植物生长的文字，让学生计算种植面积和所需肥料，同时分析光合作用。这孩子直接懵了。朋友吐槽：“不是说减负吗？怎么越减越难？！”

我苦笑。这哪里是减负的问题，这分明是考试评价改革在倒逼教学啊。很多人不明白，改革的阵痛期，最焦虑的其实是家长和老师。学生反而适应得更快——因为他们还没被完全固化。

一、分数还是命根吗？不一定了

我记得十年前刚入职时，期中考后办公室必然上演“批斗大会”。现在呢？很多学校开始搞过程性评价，把平时的课堂表现、小组合作、项目作业都计入总评。有个数学老师跟我诉苦：“以前一张卷子定乾坤，简单粗暴；现在我得天天观察学生，记录他们的思考过程，工作量翻了三倍！”

但效果呢？说实话，两极分化。自觉的学生如鱼得水，懒惰的学生照样糊弄。上次去一所实验校听课，老师让学生自评、互评，乱成一锅粥。有个男孩给自己打了满分，理由竟然是“我今天心情好”。你看，一搞就乱，一收就死。这就是改革的常态。

那怎么办？退回老路？不可能了。因为时代变了。你看现在的AI，刷题机器人的分数比你还高，但有用吗？我们需要的不是答题技巧，而是解决问题的能力。所以考试命题越来越活，死读书的孩子确实吃亏。

二、过程评价的迷思：为啥总感觉不靠谱？

很多家长质疑：“老师主观打分会公平吗？万一偏心呢？”这真是灵魂拷问。我亲眼见过一个案例：两个孩子做了类似的科学实验报告，一个因为字迹工整画了插图，得了A+；另一个实验设计更严谨但写得潦草，只得了B。家长群炸了。

所以，没有标准的过程评价，就是耍流氓。目前比较靠谱的做法是表现性评价，给出详细的评分规则（Rubric），学生提前知道怎么才能拿高分。比如演讲评分标准：内容深度40%，表达流畅30%，互动效果20%，时间控制10%。这样相对客观。但说实话，执行起来还是难——老师哪有时间给每个孩子写详细评语？一个班四五十人呢。

这时候，技术能不能帮上忙？

三、技术能让评价变聪明吗？

去年去杭州一所中学参观，他们用了一套智能教学系统，能自动采集学生课堂数据：举手几次，回答正确率，小组讨论参与度……然后生成一个数据分析图。校长得意地说：“这叫伴随式评价。”我当时挺震惊的——这不就是《黑镜》里的桥段吗？学生的一举一动都变成数据，细思极恐。

但转念一想，如果有严格的数据隐私保护，这种技术也许能解决“老师没时间”的难题。比如作文批改，AI可以给出初步的语法和结构建议，老师再聚焦内容指导和情感互动。北京有些学校已经在试点“人机协同”评价了。不过，就怕学校只买硬件不更新理念，最后变成电子监控，那还不如不搞。

问：考试评价改革后，考试会不会越来越简单？

答：恰恰相反。改革不是降难度，而是改方式。以前是考记忆，现在是考应用。比如数学题可能给一个真实的购物小票，让你算折扣并判断哪种支付方式更划算。对生活经验少的孩子来说，反而更难。所以家长别高兴太早。

问：综合素质评价到底有多大用？高考会看吗？

答：目前主要在强基计划、综合评价招生等渠道使用。普通高考录取还是分数为王。但趋势是，越来越多省份把综合素质评价作为录取参考，比如浙江的“三位一体”招生。不过，有家长担心这会给特权阶层开后门。所以透明化是关键——所有记录都要公示，经得起查。

四、我为什么对改革既期待又害怕

作为一个十年教龄的老师，我太清楚教育系统的惰性了。每一次改革，初衷都很好：多元评价、减负提质、核心素养……但落地往往走样。比如有的学校，过程性评价变成了填表大赛，老师学生都苦不堪言。

但我不悲观。新一代的校长和老师，很多是在改革中成长起来的。他们自己就受过应试教育的苦，更愿意尝试新事物。上个学期，我搭档的年轻班主任搞了个“学习积分银行”，学生可以通过完成挑战任务赚积分，兑换免作业卡或者选座位权。你猜怎么着？效果出奇的好！管理难度是大，但孩子们眼里有光了。那一刻我觉得，折腾是值得的。

所以，考试评价改革到底能不能成功？我不敢打包票。但至少，我们在路上。这条路坑坑洼洼，可总比原地踏步强。

（全文完）

考试评价改革为何总在“翻烧饼”？一位一线教师的十年观察

一、分数还是命根吗？不一定了

二、过程评价的迷思：为啥总感觉不靠谱？

三、技术能让评价变聪明吗？

四、我为什么对改革既期待又害怕

文章目录

最新文章

热门标签