交大要闻
[学者笔谈]金艳:考试亦学问
[编者按] 继2011年上半年推出“身边的感动”系列报道受到广泛好评后,从2011年10月起,我们推出了新栏目“学者笔谈”。本栏目将陆续推出一批我校有影响的学者,重点展示他们在人才培养、科学研究、服务社会和文化传承与创新等方面的观点和见解、思路和做法及理论和实践,旨在弘扬科学精神,激荡人文情怀,回归学术本位,浓郁学术气象,全面提升交大学术的影响力和传播力。
■ 如何让考试内容更加合理、考试形式更加丰富有趣、考试结果更加易懂、分数更加有意义、成绩更具可比性,更重要的是,如何让考试变得更加公正、公平……这一切使考试成为了一门不得不研究的学问。
■ 考试要做到公平公正,看似简单,实际复杂。
■ 考试并不是素质教育的敌人,素质教育也不意味着就要取消所有的考试。完善考试制度和体系,使考试更加科学合理,这才是积极有效的方式。
■ 虽然考试必然存在误差,但是从总体看,它不失为社会教育和人才流通的一个不可或缺的环节。
对于很多人而言,考试是学习过程中一大压力的来源,也是生活中带有痛苦色彩的一个部分。很多人怨恨考试,觉得考试使生活充满了竞争,甚至剥夺了学习的趣味。高考的月份,就被人们习惯地称为“黑色六月”,或多或少有些焦虑甚至恐惧的色彩。
但是,考试又是很多人梦想的一部分。中考、高考、乐器等级考、种类繁多的职业等级考试等等,曾是很多人梦想的起点。“知识改变命运”这句话大家也许都已耳熟能详,但“考试改变命运”在某种程度上也许更真实地反映中国的实际国情。高考等众多考试成为中国社会公平选拔人才的一个不可或缺的环节。
作为一个也曾有过多年学生经历的人,我个人从小对于考试的态度还是比较积极的。也许是因为从小在考试中表现还算不错的关系,考试对我而言也有了正面意义:肯定我的付出,展示我的学习成果。看到周围有不少同学朋友为考试而头疼苦恼,甚至采取各种方法躲避考试,小时候的我时常思索,若是考试能够设计得像游戏一样,让大家都喜欢就好了。
长大后我渐渐明白,我的梦想太天真——考试设计得再完美,也不可能让学生喜欢考试;相反,不少学生害怕考试,为考试而焦灼不安。但是,在我选择读研之前,我从未想到过,考试也是门学问,为什么考?考什么?怎么考?考试对教学和社会产生的影响是什么?考试是一门涉及教育学、测量学、心理学、社会学等等的交叉学科。就以考试焦虑为例。心理学研究发现,考试焦虑是伴随着对考试可能失败或成绩不理想的担忧而出现的一系列具有特定表现的生理上和行为上的反应。考试焦虑至少具有两个维度,即生理上的情绪反应,如心跳加快、头晕、恶心、恐慌等,以及认知层面的担忧,如与同伴比较、担心失败的后果、缺乏自信心等。而认知焦虑则是影响学业表现或测试成绩的主要因素,焦虑程度越高,学业或测试成绩越差。
作为一名英语系的学生,在读研时我选择的专业是“语言测试”。顾名思义,研究的就是如何测试一个人的语言水平。刚入门时,我未曾想过这门学科竟然有如此之深,考试这门学问的复杂,远超于简单的出题与评分。语言能力是什么?单维度还是多维度?知识还是技能?为什么有的考试偏爱客观题,有的偏爱主观题?如何报告语言测试的成绩?采用分数还是等级?报告一个总分还是单项加总分?考试的分数如何解释?等级如何描述?在学习和研究如何使考试更加公平高效的同时,我也逐渐体会到“考试”这门学问对于我们社会生活方方面面的深刻影响。在此我想分享一些我的经验与心得,希望能帮助大家对于“考试”这门学问与人、与社会的关系有更深一层次的思考与理解。
“不学就会”的专业?
首先我想聊聊我对于“考试”作为一门学科的看法。很多人对于“考试”是否能算作一门学科表示怀疑。在不少人看来,测试别人似乎是一门不学就会的专业。从小到大,大、中、小学的各学科老师似乎都能轻而易举的出题并给出成绩,他们都没有学过“测试”这门学科。
但是,虽然这些老师都进行了测试,也公布了成绩,不过有没有遇到过这样的情况:某位老师命的考试题目总是刁钻难懂,学生普遍反应没有发挥出他们正常的水平?某位老师的评分标准忽严忽紧,让人偶尔庆幸扣分扣得少,偶尔又觉得被扣多了冤得慌?类似情况的发生,在小环境下看似无伤大雅,但是若在重要考试如高考、会考之类决定命运的选拔性考试中发生,那么考试的公平性就被打了很大的折扣。因此,如何让考试内容更加合理、考试形式更加丰富有趣、考试结果更加易懂、分数更加有意义、成绩更具可比性,更重要的是,如何让考试变得更加公正、公平……这一切使考试成为了一门不得不研究的学问。
在对考试重要性和科学性的理解上,美国的一些经验值得借鉴。美国教师从业资格就涵盖了‘评价理论和知识’这一门必考科目。教师职业的重要标准之一就是“懂得如何开展促进学生学习的教学评价”。美国SAT考试(相当于美国的高考,是美国高中生参加的标准化考试,与其他因素结合决定学生是否被大学录取)的主办方College Board有一套完整的命题、评分、分数等值和计算方式,以确保每次考试的分数都能准确反映学生在智力发展和解决问题方面的实际能力。经过多年努力,SAT考试几乎已经做到了近乎完美地反映学生真实水平和能力。同一个学生,在未进行更多学习的情况下,SAT的成绩几乎都相同!
我国自主研究和开发的一些英语能力等级考试也成功地运用了语言学理论和教育统计测量理论,使考试的成绩客观、真实地反映学生英语应用能力。曾经有一些学生到全国大学英语四、六级考试委员会办公室查询成绩,因为他们不相信自己为什么会一而再、再而三地考出59分!实际情况往往是,在两次考试之间的这段时间内,这些学生并没有真正地学习英语,而是希望碰运气。这样的情况也许有一定偶然性,但是,四、六级考试的题目都经过预测,每一次考试成绩都进行等值,这样,不仅确保了每道试题的质量,而且每次考试的总体难度得到控制,即使略有偏差,也会经过等值处理调整过来。因此,如果学生的能力没有切实提高,他们的成绩就不会有显著地变化。
有不少人认为,国外的中学生比国内的要轻松自由很多。造成此情况的原因很复杂。一方面是他们教学资源的丰富,竞争压力相对较小。另一方面也是因为他们高考的评价体系相对比较科学、合理,能够客观、准确、全面地反映学生的真实水平。当教师和学生都可以信任一个评价体系,相信通过考试和其他评价手段可以真实反映学生能力的时候,教师的教学积极性和学生的学习热情也会提高,而不是麻木地反复操练,心中默念保佑考试发挥正常!
考试要做到公平公正,看似简单,实际复杂。人们往往将考试作弊视为影响考试公平公正的唯一原因,但是,没有作弊的考试并非就一定是公平公正的考试。题目的易懂性、命题材料的偏向性、通过应试策略得分的可能性、评分的一致性等等都影响着考试的效度(是否反映所要考核的知识和能力)和信度(评分的可靠程度),而效度和信度差的考试不可能是一个公平公正的考试。目前,我国自主研发的各类考试体系正在趋于成熟和完善。虽然偶尔还是会发生高考语文作文怪题或理科难题偏题导致学生发挥失常的情况,但总体来看,随着对于考试这门学科研究的不断深入,考试的公平性和有效性都在不断地得到提升。
“哑巴英语”谁之过?
考试是教育系统不可或缺的一个组成部分。当考试成绩与学生未来密切相关的时候,“考什么→教什么→学什么”就成了必然。因此,考试对整个教育体系产生重大影响。
举例来说,改革开放三十年以来,我国学生英语阅读能力的提高是有目共睹的。由于英语是中考、高考的必考科目,也是大学生求职的“敲门砖”,从小学生到中学生再到大学生甚至学龄前的娃娃们英语学习热情都普遍高涨。可是,学生的英语口语表达能力似乎总是难以像阅读能力一样突飞猛进。在托福或雅思之类的国外英语水平考试中,听力、阅读、写作中获得高分甚至满分的中国学生并不十分稀奇,可是没有迈出过国门却能在口语考试中发挥出色的学生凤毛麟角。
究其原因,似乎与考试有关。各类英语考试中,口语一般不在测试范围内,即便有口试,也往往被作为“自选项目”或“参考分数”。虽然我们经常看见学生晨读英语,但是学生很少有机会真正用英语说话,老师也很少认真教授学生如何用英语参与口头交际。初看这是由于口语测试难度大。无论是人-机对话还是人-人对话,口语考试的实施都比较难,评分则更难,因为评判的主观性很大。高考、四级、六级考试等正在努力试图通过计算机化考试来加强对口语能力的测试,这对引导国内英语教学迈向全面化,改善学生外语口语短板的现象有一定作用。事实上,我国英语学习者听和说的能力相对较弱的深层次的原因是,我们的外语教学缺乏一个学习者可以运用外语的环境。因此,改变“有口不会说”、“有耳不会听”现象的根本出路在于创造更好的外语学习环境。
在教学与测试的关系方面,不少著名的测试学家都强调两者是“主仆”关系,教学是第一性的,测试是为教学服务的。但是,在一个经济水平还处于发展中的国家,家长、老师们难免希望孩子可以通过考试脱颖而出。从某种意义上来说,考什么教什么的现象是很难被彻底改变。考试也因此被称为教学的指挥棒,被赋予了引导教育走向的重任。除了英语,在其他学科中,考试也都承担了责任重大的引导作用。语文老师评卷时的爱好,促成了学生平时的写作习惯。钢琴考级的必考曲目,使学习者把这些特定的曲子弹奏得滚瓜烂熟。因此,在这个特定的历史阶段,考试工作者的社会责任尤为重大!
“不可或缺”的罪人?
有人质疑,这套考什么教什么的模式,极大地增加了学生的负担。学生的近视、超重、缺乏创造力、片面发展等等,似乎都是考试惹的祸。但是,设想若是音乐、美术、体育、社团服务、志愿者活动等等被纳入中考或高考的评价体系,那么这些学科是否会得到更多的重视呢?答案是肯定的。事实上,因为体育成绩被部分纳入中考计分,初中生体育锻炼的热情极大提高,体育老师也跟着“扬眉吐气”,以前被忽视,而现在被学生追着讨教锻炼方法、请求帮助制定锻炼计划。
由此可见,考试并不是素质教育的敌人,素质教育也不意味着就要取消所有的考试。完善考试制度和体系,使考试更加科学合理,这才是积极有效的方式。我国的实际情况决定了对于公平、公正选拔方式的需要,在我国没有任何一种主观评定方式能在公平性上胜于以客观评定为主的考试制度。为学生减负需要考虑的也不是如何取消或取代考试,而是如何完善考试,如何引进多元化的评判标准,如何开展促进学习的形成性评价,这些都有助于使考试在孩子们的成长过程中扮演积极引导的角色,也会对培养综合素质人才起到重要作用。
诚然,选拔性考试和各种“证书”类考试都为社会选拔人才起了很多正面的作用。英语水平考试,如大学英语四、六级考试、公共英语等级考试、口译证书考试,以及各种从业资格证书类考试都给人们提供了证明自己实力和价值的平台。在一个无法完全摆脱“关系”的社会,有什么能比客观的考试成绩更为公正地评价人们在某方面的能力呢?对于一个鼓励人才流动的社会而言,客观的评判标准是必不可少的。
但是,如果考试被赋予了超越其本身价值的社会使用价值,被赋予了过大的社会权重,那么这种对考试的过度依赖或是错误使用,将会给教育体系带来严重的负面效应。饱受诟病的“高分低能”现象与此有关。有的人在考试中发挥出色,考证时也一个不差,可是干起工作来,能力并不高。原因之一是教学围着考试转,教师不再全面传授知识和能力,而是在让学生练习考试的题目,在帮助学生掌握应试技巧,通过运用技巧放大自己的能力,进而在考试中获得好成绩。
考试亦是一门学问。在一个人人都善于用言语包装自己的年代,各种测试的存在给予人们一个量化自己能力的可能,让人们可以用一个客观可信的数字或等级来评价自己的能力。虽然考试必然存在误差,但是从总体看,它不失为社会教育和人才流通的一个不可或缺的环节。
希望在未来的日子里,考试作为一门学问,能在我国得到更多的重视,使考试作为一个专业领域发展得更深更好。也同时希望我国的莘莘学子们,在提到考试时,能少一些恐惧厌烦的情绪,多一些积极乐观的思想,能认识到考试不是他们人生中的绊脚石,而是一步步引领他们通往梦想的台阶。
学者小传
金艳,上海交通大学外国语学院教授、博导。兼任全国大学英语四、六级考试委员会主任。1984年进入上海交通大学,完成了本科、硕士和博士学习。曾于上世纪九十年代和本世纪初分别赴英国雷丁大学、英国萨里大学、美国教育考试服务中心等学校和机构学习、进修并开展合作研究。
自1988年起从事教育考试研究和实践,方向为大规模考试的开发、实施和效度论证,主要负责的大规模考试是全国大学英语四、六级考试。曾任四、六级考试委员会办公室主任、考委会副主任和常务副主任。2004年至今由教育部高教司任命担任全国大学英语四、六级考委会主任,负责考试的设计、科研以及日常运行工作,包括命题、试测、阅卷、评分、成绩计算和分数报道等。此外,2006年至今,由上海市考试院任命担任上海市高考英语学科专家组专家,为上海市英语高考提供设计和改革方面的专业指导。目前主要学术兼职为国内外多种学术期刊的编委会委员或顾问,如语言测试领域最著名的国际SSCI期刊Language Testing编委、Classroom Discourse编委、国内CSSCI期刊《中国外语》编委、《外语界》编委、《中国外语教育》编委、《中国ESP研究》顾问、《当代外语研究》编委等。主要奖励有上海市育才奖(2007)、上海市优秀博士论文奖(2001)、国务院政府特殊津贴(2012)。