我用AI助手出题一个月后,班里及格率直接飙升40%,同事全都跑来问我秘诀
说句掏心窝子的话,刚当老师那会儿,我最怕的就是周末——不是怕上课,是怕出卷子。
每次快到考试周,我都得把自己锁在办公室翻教辅资料,对着电脑屏幕一个字一个字地敲题目,选择题、填空题、解答题,光排版就能耗掉半天。有一回为了赶一张数学期中卷,我愣是熬到凌晨两点,第二天上课嗓子都是哑的。

直到一个偶然的机会,我接触到了所谓的AI助手出题功能——起初我还以为是忽悠人的玩意儿,但用了不到一个星期,我就彻底“真香”了。

那是三月中旬的事。学校教研群里有人发了个链接,说好未来发布了一款叫“九章龙虾”的教师专属AI智能体,能在零配置状态下自动完成数据处理和多模态内容创作-。我点进去看了下介绍,好家伙,所有运算都在本地运行,还能打通飞书、钉钉这些办公平台-1。我当时就想,这要是真能帮我自动出题组卷,那可比我自己埋头苦干强太多了。
第一次试用的场景我现在还记得特别清楚:我就在对话框里打了句大白话——“帮我出一张初三数学一元二次方程的周测卷,难度中等偏上,包含6道选择题、4道填空题、3道解答题”。不到三秒钟,一张完整的试卷草案就弹出来了。我往下翻,每道题不仅配了标准答案,连评分标准都给得明明白白-47。
说实话,看到那个结果的时候我整个人都有点懵。不是我吹,那卷子的出题质量比我自己弄的还高,知识点分布特别均匀,难易梯度也很合理。后来我研究了一下原理才知道,AI助手在背后干了三件事:海量数据分析、深度学习模型训练、以及知识点-难度-题型的映射关联-20。说白了就是AI把这十几年的题库都啃了一遍,记住了每道题该在哪个位置、该考什么深度。
那一刻我真的觉得,以前那些为出题熬的夜,全白熬了。
有个同行朋友问我:“你就吹吧,AI出的题能用吗?别到时候学生一问三不知。”
我跟他说,你这话放到2024年可能还真有点道理,但放到2026年,那就是老黄历了。
就拿今年三月份“北极星”基础教育大模型评测场的数据来说,国内外50多个主流大模型在智能出题、智能解题、教案生成等7大场景下进行了全面对决,头部通用模型在综合表现上已经相当稳定领先-27。我还专门查过一个更硬核的研究——以HSK6级阅读理解题为例,国内学者对比了推理大模型、指令大模型和垂直领域大模型在自动出题上的表现,结论是推理大模型的综合评分最接近真题-26。
当然,我也得说句实在话。上面那篇论文也指出了,AI生成的题目仍然在不同程度上存在选项设计不合理、题目不可回答、难度控制不够好等问题-26。所以我现在养成了一套固定的操作流程:
学生这边反响也很炸裂
让我最惊喜的其实还不是自己省了多少力,而是学生的变化。
以前班里学生做作业,成绩好的嫌题太简单没挑战,成绩弱的一看到题就头大。现在我用AI助手的智能分层功能,能根据学生平时的学习数据,自动给每个人推送难度匹配的练习题-46。英语学科方面,千问AI最近升级了整页作业批改和错题本自动整理的功能,还能一键生成练习册-3。豆包那边也不甘示弱,升级到2.0版本之后,讲解方式从单纯的解题步骤转向了围绕知识点展开结构化讲解,讲解结束后还会提出延伸问题引导学生继续思考-3。
上个月的月考成绩出来,班里及格率比上学期期末直接高了将近40个百分点。我们年级组长在办公室念成绩的时候,几个同事全转头看着我,眼神里就写着两个字——“有诈”。
我笑了笑,掏出手机给他们看了我的操作流程。现在整个年级组的老师都在用。
不是给AI当“甩手掌柜”,而是当“监工”
说真的,用AI出题这一个月我最大的感悟就是:AI不是来抢老师饭碗的,是来帮我们把碗端稳的。
好未来的CTO田密有句话说得很到位:“希望通过AI赋能,把老师从繁琐的事务性工作中解放出来,让他们有更多精力专注于教学创新和学生关怀”-2。我现在每天至少能多睡一个小时,备课的质量反而比以前更高了。以前大部分精力花在“怎么把题弄出来”上,现在更多精力花在“怎么把题用活”上。
当然我也不是没踩过坑。有一回我想偷懒,没仔细审核AI生成的题目就印了发下去,结果有一道多选题的选项设置出了bug——两个答案都对,但正确答案只标了一个。第二天课堂上一堆学生举手问我,场面一度非常尴尬。
所以现在我对AI助手的态度是:让它干活,我来把关。 它也累不死,我也闲不住,配合得刚刚好。
我想听听你们的看法
网友“数学老师老周”问:AI出题这么方便,会不会让老师变得越来越懒,最后连基本的命题能力都丢了?
说实话老周,你这个担心我一开始也有过。但用了一个月之后我发现,恰恰相反。因为省去了那些机械性的、重复性的出题劳动之后,我把更多精力放在了“这道题能不能真正考查到学生的核心素养”这种更高层级的思考上。北京师范大学那篇评测报告里也指出了,当前AI在“启发引导”和“素养导向”这些维度上仍然是短板,情景题的生成能力还有很大的提升空间-27。所以最终决定题目质量的,还是老师自己的专业判断。AI再厉害也就是个工具,就像计算器没有让数学家丢掉心算能力一样,AI出题也不会让好老师丢掉命题能力。关键是你把它当工具用,还是当“甩手掌柜”用。
网友“全职妈妈小鹿”问:我孩子上小学三年级,我在家辅导功课的时候能用AI出题帮他巩固知识点吗?如果可以用,选什么工具比较适合?
小鹿你好,你这个问题问得太及时了。三年级正是打基础的关键阶段,很多家长都有这个需求。我的建议是先从阿里千问App入手,它今年3月刚升级了“AI讲教材”功能,覆盖小学一到六年级的语文和数学内容,支持语音讲解和动态图示,孩子学起来不枯燥-3。还有个叫Testudy的AI工具(原名Quizbot),专门做智能测验生成,月访问量已经接近10万,功能相当成熟-。我个人的使用习惯是:先用AI给孩子生成一套基础练习题,做完之后让AI自动批改并生成错题分析,然后把错题整理成错题本,再让AI根据错题数据生成一套针对性巩固练习。这样循环下来,效率比家长自己出题高太多了。唯一要注意的是,别让孩子完全依赖AI,做完题之后家长还是要带着复盘,毕竟AI给不了孩子那种“妈妈陪你一起进步”的陪伴感。
网友“IT从业者大刘”问:我公司的技术团队一直在内部培训中用人工出考题,效率太低了。企业培训场景下有靠谱的AI出题系统推荐吗?最好能支持编程题自动评测。
大刘你这个需求很专业。我专门调研过企业培训方向的AI出题系统,给你推荐两个方案。第一个是企学宝,它基于自研大模型,支持上传文档或者输入关键词就能生成全题型试题,包括单选题、多选题、判断题、填空题和简答题,实测出题效率提升约20倍,试题可用率达到85%,而且深度集成了钉钉,支持10万+用户并发,特别适合中小企业的新员工培训和技能测评-7。第二个是云考酷,这个更硬核——由高校师生团队研发,集成DeepSeek大模型,支持8种编程语言和SQL的自动评测,能直接生成编程题和简答题,题库还支持“复制粘贴”一键导入,完全不需要格式整理-7。如果是技术类的认证考试或者编程能力测评,云考酷的适配度会更高。顺便说一句,如果你们公司对考试安全有严格的要求,考试云也是个不错的选择,它具备等保三级认证,能支持60万人同时在线的严肃考试场景-7。选哪个,取决于你们团队的规模和技术含量。
相关文章

最新评论