第一章 高中语文教育评价概述
“教育评价”(educational evaluation)作为专有名词,是美国俄亥俄州立大学教育科学研究所泰勒教授首次提出 (1935年)的,并由美国国会通过的 《初等及中等教育法案》(1965年)得以合法化。
教育评价在学术界尚无统一定义,不同的学术流派对此各有表述,但大体可以归纳出以下几个共同点:
第一,强调以教育目标为标准的价值判断过程。第二,强调用多种方法系统收集资料与信息。第三,教育评价的内容既可以是教育计划,也可以是课程;既可以是学生的学习结果,也可以是某种教育现象、教学活动、教育目的或教育程序。第四,强调为学生发展和教育决策服务。
“教育评价学”乃是教育科学的一个分支,即研究如何运用方法来分析教育活动的应用学科,是教育科学体系中带有综合性、技术性、实践性、应用性特征的应用性学科,是人们依据教育基础理论和教育规律来指导教育实践通常所依赖的技艺与方法。
语文教育 (包括小学、初中、高中)评价又是教育评价学的更具体的应用性分支,高中语文教育评价是语文教育评价这个应用性分支的更细的分支。具体地说,高中语文教育评价就是按照高中语文课程标准的要求,利用各种方法收集资料信息,对学生的语文发展变化及影响其发展变化的各种要素进行价值分析和判断,并为高中语文教育决策提供相关依据的过程。
教育评价学肇始于西方,我国虽然很早就有教育考试及评价的具体操作,但是学科意义上的教育评价学理论、方法都是学习外国。目前国内的教育评价学研究也主要是翻译、介绍外国的学术著作、学术体系,语文教育评价研究更是稀少;至于高中语文教育评价这样操作性极强的、极微观的应用性研究,则是少之又少。一个难以兼容的事实就是:研究评价学的学者往往是从事“形上之思”,绝少针对某一具体学科从事 “形下之作”;广大高中语文教师虽然每天从事着 “形下之作”,却又难以把大量的、具体的现象上升为 “形上之思”。
高中语文教育评价涉及的范围非常广泛,粗略区分,就有高中语文教师评价、高中生语文学习评价、高中语文课程评价、高中语文教研组评价等。如果按照学校类型区分,又可分成重点高中语文教育评价、普通高中语文教育评价、私立学校高中语文教育评价、职业高中语文教育评价、企业高中语文教育评价等。在一本书中将如此众多的评价都纳入其中,对其作全面探讨是不现实的。为此,本书仅截取高中语文教育的一个横截面,从教师、学生、课程、语文教研组四个方面进行评价研究。
语文新课程标准已颁行,新的课程标准基于以学生发展为本的课程价值观、科学与人文整合的课程文化观、回归生活世界的课程生态观、创新与发展取向的课程实施观和民主化的课程政策观,强调了语文学科工具性和人文性的统一,突出了全面提高学生的语文素养,正确把握语文教育特点,倡导自主、合作、探究的学习方式和努力建设开放而有活力的语文课程新理念,是语文课程在新世纪信息化、全球化背景下的一次革命性发展,必将对我国基础教育阶段的语文课程教学产生深远的影响。然而,美好的蓝图不等于严峻的现实。语文新课
程标准要靠广大语文教师实施,检验实施效果的标准和工具是与新课程相配套的语文教学评价体系。这就要求我们对现行的语文教育评价体系进行脱胎换骨的改造,构建语文新课程标准的语文教育评价体系。
第一节 高中语文教育评价的基本理念
近百年来,中国的社会变革都以教育变革为突破口,而教育的变革又往往以语文为突破口。远者不论,20世纪90年代关于语文的讨论就是一个例证。教育的职能无非是在社会需求与个人需求之间建立桥梁,通过传授文化内容而培养人,通过培养人而弘扬文化。教育之所以能够产生教育的作用,之所以能够发扬文化的教化价值,之所以能够培养人,就在于教育本身是一种文化解释活动,或者说教育阐释着文化传统。
一、教育变革的现实要求是基本的理念
教育联结传统与现代的方式是把文化传统解释给求教育者,从内容到形式,从意义到价值,从过去到当代,从而使求教育者在理解中建立与传统的意义关系,受到教化。教育对文化传统的诠释是帮助、引导个体实现理解的必需的方式。由于求教育者处在成长时期,理解的视野不够宽广,对时代的处境与问题敏感性不高,所以教育的解释尤为重要。教育解释文化传统关键在于引导受教育者的自主的理解,而不仅仅是传送具体的知识内容,不是把所解释的意义灌输给学生,而是揭示传统的价值与内涵,引导求教育者理解传统,投入到传统与客观精神中,获得精神的发展,教育的文化解释使传统与现代人的关系不仅仅是知识上的关系,而且是价值上和 “精神上”的关系。
在基础教育阶段,没有哪个学科能像语文学科一样承担起这个教化作用,因为语文教育的目的;就是 “要充分发挥其促进学生发展的独特功能,使全体学生获得应该具备的语文素养,并为学生的不同发展倾向提供更大的学习空间;要为造就时代所需要的人才,弘扬和培育民族精神,增强民族创造力和凝聚力发挥应有的作用”①。当教育不能适应社会发展的需要、受教育者成长的需要时,就必须进行变革。
新课程改革就是在社会发生巨变、教育不能适应社会对人才的需要,以及个人发展不能在已有教育中获得应有的需求的背景下进行的。它要求教师从以往的课堂主宰、教育权威角色转变成学习的参与者、学习的促进者、辅导员,要求学习方式由从前的被动 “听讲”转变为主动探究、合作交流,要求改变 “满堂灌”课堂结构,要求师生共同开发课程资源。当然,新课程改革也要求评价制度的改革。
二、基础教育改革的相关文件是根本的依据
基础教育改革的方针是根据基础教育的现实、基础教育的基本规律制定的。《基础教育课程改革纲要 (试行)》指出,要 “建立促进学生全面发展的评价体系”,“建立促进教师不断提高的评价体系”,“建立促进课程不断发展的评价体系”。以往的教学评价,更多关注的是学生的学业成绩,学业成绩的唯一标准是考试分数,导致语文教师无力指导学生读书,只能屈从考试要求去做大量的试题;而绝大多数试题的水平都比高考试题低,于是,试题训练越多,越是在低水平的训练中不可自拔,以致造成学生的高分低能。
教育部 《关于积极推进中小学评价与考试制度改革的通知》对中小学评价体系有明确规定,“建立以促进学生发展为目标的评价体系”,“建立有利于促进教师职业道德和专业水
平提高的评价体系”,“建立有利于提高学校教育质量的评价体系”。这是高中语文教育评价的根本依据。
三、语文课程标准是行动的纲领
高中语文课程标准是根据语文教育现状、语文教育的基本规律制定的。《普通高中语文课程标准 (实验)》(以下简称 《课标》)“评价建议”主要由两个部分组成:一是六条评价的基本原则;二是二类课程的不同评价。这两个部分内容有一些共同的出发点:要求评价的目标要与教学目标一致,评价要为教学服务,评价既要面向全体学生,注意学生的全面发展,同时又要针对不同学生、不同课程采取多种方式。这是新中国成立以来第一次提出 “必修课”、“选修课”两类课型及评价要求。新课程以前的高中语文课是唯一的学校语文教育形式,大体上相当于新课程的“必修课”。而 “选修课”则是全新的事物,无论课程体系还是评价体系都要进行从无到有的建构。对选修课的评价,我们没有现成的经验可以借鉴,以前虽然也有选修课,但大多是以讲座形式开展的,现在要将这类课程纳入评价的范畴,就需要我们花力量去研究解决。这些评价建议是与教育教学评价发展趋势相一致的,又有很高的理论价值,具有很强的现实针对性。
语文教育评价是语文新课程的重要组成部分,尤其在我们这样一个特别重视考试的国家,它起着调节语文教学的作用。好的教学评价能引导语文教学走上正确的轨道,反之,会影响语文教学的效率。我们一定要探索一条既能顺应世界教育评价发展趋势,又符合中国实际情况的语文教学评价新路来,教师一定要有主动性,参与到教学评价的改革中来。而这些探索,都应该在 《课标》的指导下进行。
①教育部基础教育司 普通高中语文课程标准 (实验) 北京:人民教育出版社,2003
第二节 高中语文教育评价的目的、类型与功能
任何行为都要有明确的目的性,教育行为更是如此。高中语文教育评价的目的、类型与功能,是研究语文评价的重要内容。
一、高中语文教育评价的目的
《课标》指出:“评价的根本目的是为了促进学生语文素养的全面提高。普通高中语文课程与九年义务教育语文课程相衔接,致力于进一步提高学生的语文应用能力、审美能力和探究能力,全面提高学生的语文素养。语文课程评价要突出整体性和综合性,从知识和能力、过程和方法、情感态度和价值观几方面进行全面考察。”这是针对学生的语文学习确定的评价目的。
实现语文教育的目标,使学生达到课程标准要求的标准,教师是关键。因而,高中语文教育评价首先必然地指向高中语文教师。高中语文教师评价体系的建立,必须“有利于促进教师职业道德和专业水平提高”。从什么角度评价教师的职业道德和专业水平,本书将进行探讨。
课程目标的实现最集中体现在课堂教学中,课堂教学是教学的主体———教师同学习的主体———学生共同研讨文本的舞台,是学生语文学习的重要阵地,对课堂教学的评价能够集中反映教师的教学水平和学生的学习状态。如何评价高中语文课堂教学,本书也将进行探讨。
从课程设置上考察,从课堂教学上考察,语文教研组在教师发展上有重要的责任,因为教研组是学校基层的教学、教研组织,又是教师个体的集合体,教研组肩负着教师队伍培养、学科建设的重任,如何建立有利于提高学校语文教育质量的教研组评价体系,本书也将进行探讨。
二、高中语文教育评价的类型
目前,还没有完全针对高中语文教育的评价体系,这里介绍的几种类型,都是根据国内外学者对教育评价的分类。关于教育评价的分类问题,学术界不仅分类的角度不同,而且观点分歧很大。从评价的性质上看,可以把评价粗略地分成最大成就和典型行为两大类;从课堂教学中运用的角度看,可以把评价方法分成形成性评价、诊断性评价和终结性测验评价三类。
(一)按评价在教学中运用的时机分类
在国内学校课堂教学过程中,教师经常用到的教育评价,根据语文课堂教学运用评价方法的时间顺序来分,主要有三种:形成性评价、诊断性评价和终结性评价。
1 形成性评价
以教学目的为出发点的教学过程,经教师和学生的相互作用,转化为学生听读说写的学习行为,教师随时把这种学习行为和原定目的进行对照,一旦发现问题,便立即进行矫正教学,以保证教学目的的达成,这个过程就是形成性评价。形成性评价重视的是教学过程中对存在问题的及时发现,对教学措施的及时调整和对学习行为的有效控制。
形成性评价在教学过程中经常实施,在性质上大致相当于单元测验。形成性评价的目的,对教师而言,是借此获得教学过程中连续性的反馈,了解学生的学习效果、学习历程、学习特点、学习困难等信息,作为随时修正自己教学的参考。同时,形成性评价也可对学生的学习提供反馈信息,学生根据反馈的结果获知自己学习后的表现情况,从而肯定或修正以后的学习方式。因此,在教学过程中,形成性评价是不可缺少的。根据预定的教学目标,然后核对形成性评价的结果,教师才能针对全班或个别学生的学习成败情形分别给予辅导。
形成性评价可在课文、单元或学期教学过程中随时进行。
例如,高中语文第一册第五单元先秦历史散文选了 《左传》、《国语》和 《战国策》篇章,在语言文字上要求学习重点实词,每课课后练习都规定了一定数量的文言实习,随堂就可顺利完成。学生有时随堂完成情况很好,一到综合运用就不够理想。于是可以选择 《左传》、《国语》或《战国策》能够包括四篇课文重点文言实词的选段,设置单元综合测试,使课内学习的文言实词同课外选段中的文言实词相联系,就可以实现形成性评价。
2 诊断性评价
诊断性评价是对经常表现出学习困难的学生所作的评价,它的目的是对个人的问题行为及其原因进行诊断。诊断性评价多半是在形成性评价之后实施。形成性评价是在教学过程中实施的,实施之后如发现学生有学习困难的情形,即随时给予个别辅导,在辅导中帮助学生改善方法或习惯,从而克服学习困难,并跟上班级教学的进度。如果辅导之后学生学习困难情形依旧,甚至日益严重,那可能就不是单纯的读书方法或学习习惯的问题。长期表现学习困难的学生,很可能在心理上另有原因。在这种情形下就需要对他们实施诊断性评价。
还以文言文学习为例。上述单元检测中,有的学生随堂练习对文言实词掌握得不错,一到单元检测就 “发蒙”。经过教师询问,原来初中阶段文言文量比较少,学生往往以死记硬
背为主要学习方式,很少整体理解文章。一到高中,面对数量多、篇幅长、内容相对深的文言文,还是采取死记硬背的学习方法,加上其他学科的综合压力,就手忙脚乱。经过诊断,教师发现了 “病因”,就在文言文学习方法上进行引导,以诵读为主,注重朗读的节拍;充分熟悉课文,了解历史背景,介绍历史掌故,激发学生的兴趣;在学习方法上促其转变,采取情境释词的方法,把单音节文言实词情境性地转化为现代汉语的双音词,不仅促进了文言文学习,同时还使现代汉语水平得到提高。
3 终结性评价
终结性评价用于教学结束后,在性质上相当于现在学校中所举行的期末考试。其目的有两个:其一是在教学目标之下,检查学生一学期的学业达到了什么程度,从而判断教学效果的得失;其二是根据终结性评价的结果,评定学生的学业成就,并将评定结果通知学生家长或记入档案。
终结性评价的关键环节是编制试题,一份好的测试题应达到以下标准:
(1)测试内容要与教学目的相对应,要围绕排列有序的知识点从多角度、多侧面、多数量制题,然后选择好的题目组卷。
(2)测试题排列要有层次性,按认知目的的记忆、领会、运用、分析、综合、评价的顺序呈现出一种递进关系,以选择、填空、简答、写作等题型来体现。
(3)要以测试语言为重点,在主要测试语言的理解表达能力的基础上,还要涉及思维能力和语文知识的测试。
(4)还要照顾不同水平的各种学生,可用必答题和附加题的形式满足不同水平学生的不同需求。另外,还应注意到情感原则,试题要形式多样,生动活泼,阅读和写作的内容要尽量接近学生的生活实际。教师根据终结性测试的反馈信息,对没有达到学习目的的个别学生,要设法进行个别辅导;对大多数学生没有掌握的内容,教师要进行集体补救性教学。个别辅导和集体矫正仍然要围绕教学目的进行,不过要变换教学方式,变换辅导角度,变换检测试题,以确保教学目的的达成。
目前,我国的高中普遍采用的终结性评价,仍然以期末考试成绩为主,有的学校将期中、期末成绩相加求和除二,取平均值,此平均值记录到学生学业成绩表上,作为将来毕业成绩。而呈给学生和家长的,则是期末成绩。学生和家长往往并不看重平均值。这也说明,在终结性评价上还存在着单一、片面、失衡的问题,需要改进。
(二)按评价的内容分类
教育评价的内容极为丰富,欲穷其类,实非易事。但从基本内容来看,语文教育所涉及的主要有能力倾向评价、成就评价、人格评价。
1 能力倾向评价
能力倾向评价的目的在于评价个人的潜在才能,预测个人的能力发展倾向。能力倾想评价一般可分为两种:一种是关于一般能力倾向的评价,旨在评价个人多方面的潜能;另一种是特殊能力倾向评价,旨在探测个人某方面的特殊潜在能力,如音乐能力倾向、机械能力倾向、美术能力倾向等。能力评价主要是预测学生是否有能力继续未来的语文学习。由于评价目的不相同,测试的内容也有区别,如学年测试和毕业测试的重点应在学生已学习过的课本内容上,高考则通过在大纲规定的范围之内,而又在课本以外的内容来测试评价学生的语文能力水平。
有的学生口语表达好、朗读水平高,有的学生阅读面宽,知识面广;有的学生写作水平高;有的学生认识水平高。语文教师一旦了解学生上述不同的能力倾向,因材施教,专门点拨,就可能将 “倾向”培养成 “能力”。我们经常听到在某方面取得成绩的人士回忆当年的语文教师,最深的印象就是语文教师发现了自己的某方面的潜能,适机加以激励,使得自己终于经过努力在这方面取得成就。
2 成就评价
成就评价的目的在于评价个人在接受教育或训练后的成就。常见的有两种类型:一是学科成就测验,旨在评价学生在某一科目上的学习成就;二是综合成就测验,旨在测量与评价学生在多个学科或综合学科上的学习成就。综合成就测验既可以是单个测验,也可以是成套的测验。
在语文学习上成就评价主要是用于说明过去语文学习活动的成功程度。例如学年语文评价、毕业语文评价,目的是说明学生在过去的一年中或三年中语文学习活动的成功程度,以决定学生能否升级或毕业。能力评价主要是预测未来语文学习活动的能力水平。
例如高考语文评价,目的是预测学生在未来语文学习活动中取得成功的可能性,以决定学生能否进入大学继续学习。换一种方式说,成就评价主要是用于说明学生对把已经学过的语文内容掌握了没有。
我们不否认当前许多成套的面对高考的测试题有成就评价的性质。但是,在高中语文教育中,这种成就评价是亟需改变的。用许多训练题强化训练的,是学生的应试技巧,很多试题本身存在问题,而一旦以有问题的试题检测学生、评定学生的学业成就,将给学生造成巨大伤害。有这样一个真实的案例,一位高中生,在学校的历次考试中,现代文阅读成绩总是很低,他的答案总与 “标准答案”有较大差距。后来,向一位资深的语文特级教师咨询,这位教师同学生交谈后发现其语文素养很好,阅读面也很宽,就让学生把做过的试卷拿来,分析后发现,原来试卷是学校从题贩子那里买来的盗版试题,“标准答案”不标准,教师批卷又 “严格”遵循 “标准答案”,结果造成对该学生的极不公平的 “成就评价”。
3 人格评价
人格评价也称为个性评价,其目的在于评价学生的人格心理特征,诸如气质、性格、兴趣、态度、动机、适应性等方面的心理特征。由于人格的概念十分宽泛,因此,人格评价所涉及的内容层面也很多,人格评价方法也是丰富多彩的。为了更好地把 “因材施教”的原则落到实处,语文教师应当掌握评价人格的一些基本原理和方法。
笔者接触到一位刚上高中的学生,他希望分到的班级班主任和任课老师都没有 “人格缺陷”,这从反面说明,教师存在着 “人格缺陷”的现象是客观存在。如果有 “人格缺陷”的教师去评价学生,将对学生的人格评价发生怎样的偏差?语文学科内容的特质决定了语文教师与学生的亲密交往程度,教师对学生的人格评价也是最有发言权的人。
(三)认知水平评价、情感水平评价与技能水平评价
按教育目标领域的不同分类,可以把评价分为语文认知水平评价,语文情感水平评价与语文技能水平评价。
1 认知水平评价
语文认知水平评价主要是用于说明学生对语文知识的掌握程度和语文智力水平的提高程度。例如:确定学生在学习过程中对语文具体知识、语文方法知识和语文理论知识的记忆水
平,确定学生在领会、运用、分析、综合、评价等不同智力水平上已经达到的程度或可能达到的程度。认知水平评价一般借助语文测试成绩的定量分析结果进行。
2 情感水平评价
情感水平评价主要用于说明学生学习语文时的情感水平的提高程度,通过判断学生在接受、反应、价值评价、组织、由价值或价值复合体形成的性格化等不同情感水平上的学习行为,来说明学生在语文学习方面的发展趋势。对情感领域的评价一般不采用定量分析的方式,而采用会谈、问卷、轶事记录、自我报告和观察技术等定性分析的方式。如果单独采用上述某种定性分析方式时,也不能对学生的情感水平作出适当的评价,但几种方式综合运用的结果,可以对学生学习语文的进步情况和变化趋势作出相当精确的判断。
3 技能水平评价
技能水平评价主要用于说明学生对学习语文的简单技能、复杂技能和高级技能的掌握程度与发展水平。对技能领域的评价可以采用定量分析和定性分析相结合的方式进行。①
(四)按试题的标准化程度可分为标准化测验和非标准化测验
1 标准化测验
标准化测验是指由测量专家严格按照测验编制程序而编成的一种测验。通常标准化测验都具有一定的程序编制,包括试题的抽样,难度、区分度指标分析,明确的施测指导语和施测程序,计分标准,解释分数的常模,以及信度、效度等指标资料。高考试题相当于标准化测验。
2 非标准化测验
这类测验的编制相对自由,没有严格按照测验编制程序进行。教师自编测验常由教师依照自己的教学需要和教学目标而自行编制的测验,是一种非标准化的测验。教师自编测验的编制程序(如试题的编拟、实施、计分和解释等)没有经过标准的步骤,缺乏严谨一致的信度和效度指标,更没有提供解释分数的常模,所以相对而言不够严谨。但是,它能满足教师在教学情境下使用,符合教学的需求。
这种 “非标准化测试”在语文教学中有泛滥倾向,大量的 “非标准”的训练充斥语文教学中,把语文教育推向 “非标准”题海战术的渊薮。因此,对这种测验的有效控制将是高中语文教学应该研究的问题。
语文教学评价如果按其他不同的标准分类,还有个别评价与集体评价、文字评价与非文字评价、自我评价与同伴评价、领导评价与专家评价等方式。
三、高中语文教育评价的功能
评价有许多重要的功能
如评定的功能、判断的功能、选拔的功能、反馈的功能、教育的功能、导向的功能、威慑的功能、预测的功能、诊断的功能、激励的功能、改进学习的功能、改进教学的功能等。不过,就教学情境而言,评价的主要目的是改进学习和教学,所以,评价结果的其他用途,都是第二位的或补充性的。教育评价的功能,可以归纳成如下几点:
(—)实现教育判断的功能
教育评价的最基本、最原始、最现实、最普遍的功能,就是实现教育判断。它包括评定的功能、事实判断的功能、价值判断的功能、问题诊断的功能、区分选拔的功能等。
1 评定的功能
教育评价活动的直接目的是为了客观地评定学生的学习成绩,或者是为了给应试者的行为表现评定一个成绩 (分数或等级)。教育评价具有评定的功能,是因为这种判断过程不是主观随意的,而是按照某些科学准则和程序对人的行为表现作出较为客观的评价。
2 事实判断的功能
教育评价是一个完整的过程,在这一过程中,人们利用测量和非测量的种种方法,系统地收集资料,在此基础上可以对被测对象或被评对象的某种属性、行为表现等做出符合事实的判断。判断结果可以以量化的分数出现,也可以采用定性描述的形式出现。
3 价值判断的功能
虽然某些事实判断过程也蕴涵着价值判断的成分,但事实判断就整体来看,它与价值判断有明显的差别。价值判断过程是把事实判断的结果同外部的某种价值体系或价值标准联系在一起,对事物或人的属性做出价值分析、价值判断和价值描述。价值判断往往是建立在事实判断的基础上,事实判断更多地具有写实性,而价值判断往往也具有社会性。
4 问题诊断的功能
教育评价在实现其事实判断功能和价值判断功能的同时,还具有问题诊断功能。如对学生学习困难的诊断;对教师教学问题的诊断;对课程设置、课程计划、课程实施的诊断;对教研组机制的诊断等。由于教育评价具有问题诊断的功能,因此,在教育过程中,人们常利用各种测验、各种评价表以及考试等手段,大量地收集资料,经由这些资料的分析,充分发挥和最大限度地实现教育评价的诊断功能。
5 区分选拔的功能
人类的个别差异是客观存在的。在学校教育过程中,减少学生之间的个别差异量,是教育的刻意追求,但要消灭人的个别差异是不可能的。在教育与社会活动中,由于资源的有限性或者由于存在竞争,因此,许多情况下必须做出区分与选拔的人事决策。为了做到一定的客观性、公正性和科学性,利用精心设计的教育评价方案可以较好地实现选拔的人事决策。科学的教育评价方案,具有区分选拔的功能。
新课程标准对此功能有弱化的倾向,就是对以往教育评价过于重视区分选拔功能的矫正。如何在高中语文教学中有效利用这一功能,是现实的、复杂的命题。
(二)改进教师教学的功能
高中语文教育评价能够通过下面几点充分发挥改进教师教学的功能:
1 了解学生的起点行为
摸清学生的学习和发展状况是因材施教的前提。任何一次成功的教育活动,如果不是建立在尊重学生已有的学习和发展状况的基础上是不可思议的。
因此,在教学或教育前,教师可以先针对学生实施一次测量,用来评价学生在学习之前已具有的背景知识,以作为决定有效教学的起点。
对于起始年级,教师进行教学前,对所教班级学生语文水平作一个调查,分析其知识、能力的基本情况,对教学很有帮助。代课教师、从非起始年级接课的教师,面对陌生的学生群体,也往往要调查其学习状况,以便安排有效教学。有的教师虽然很卖力气,但学生不买账,其中就有不了解学生的学习状况、教学起点不恰当的原因。
2 作为改进教学的参考
根据教育评价的结果,教师可以明了自己在教学上的缺失,判断教材的可用性,判断教学方法的有效性。例如,教学过程中,有哪些教学方法或教材的选择、组织、联系不当,是否需要调整或改变教学策略等。
《谈 〈水浒〉的人物与结构》是茅盾在新中国成立初期写的一篇研究 《水浒传》的文章,是新中国 《水浒传》研究的奠基之作。但是,由于作者按照阶级斗争的观点狭隘地分析作品 (如把林冲说成是 “小资产阶级”),已经不能适应现实的语文教育需要。而且以往在讲授 《谈 〈水浒〉的人物与结构》时,学生不认可作者的观点,不同意教师的分析,于是,根据具体情况,教师作了调整,把它替换成王蒙的 《谈 〈红楼梦〉的人物语言》,在教学中取得了很好的效果。评价的结果,为教师改进教学提供了十分有用的参考信息。
3 作为补救教与学的依据
对测量结果的分析,可以让教师了解学生的学习类型,如果该测量过程是经过特殊设计,含有诊断不寻常反应、错误概念和反应心向等不正确选项的话,在对测量结果分析之后,更能进一步提供给教师诊断学生在认知结构上哪些地方有缺失的信息,这些信息可以作为教师实施补救教学的参考。测量后的试题分析的信息,可以提供给教师关于所编制测验的统计特征 (如难度、区分度等等)。根据这些信息,教师能够进一步找出不良试题所在,以确保教师所编制的试题均属于性能优良的试题,并且可以被保留在题库内,供日后编制新测验或复本测验使用。由诊断学习获得的信息,可以作为教师实施补救教学的依据,教师可以针对不同学习类型的学习行为特性,以及不同认知结构缺陷的所在,有针对性地提出符合个别需要的补救教学的策略与措施,以达到因材施教的目的。
例如,有的学生语文基础知识很扎实,但现代文阅读水平不高,经过测试发现,凡是综合推断、评价鉴赏方面的试题失分都比较多。经过分析发现,这是因为该学生识记水平较高而逻辑思维水平较低,教师为他指定阅读逻辑性强的文章,并训练他列文章思路提纲,一个阶段后思维水平有明显提高。但是,由于班额大,教师教学任务重,一般难以做到这样的个别辅导。
4 确保教学目标的达到
教育评价的最终目的在于确保教学目标的达到。根据评价结果,教师可以知道目前的教学情况离目标有多远,是否需要修正目标或改变教学策略,是否需要改换教材及教法等。比如,在单元、期中、期末学习后,为了检验教育工作的好坏,便少不了全面了解学生对学习内容的掌握情况,这是检查前一段工作的效果,也是进一步进行教育工作的基础。
(三)促进学生学习的功能
教育评价具有促进学生学习的功能,其主要体现在如下几个方面:
1 激励学生的学习动机
一份有效的成就测验,可以通过以下几个方面直接影响学生的学习:其一,为学生提供了短期的学习目标;其二,明确所要学习的内容;其三,提供有关学习进步的反馈信息。因
此,对教育评价的正确使用,不仅可以引导学习目标、提供学习成果的反馈,还能激励学生学习的动机。
2 帮助学生的记忆和促进迁移
因为教育评价可以引导学生朝向教学目标作努力,因此,教育评价可以促进学生的学习记忆和学习迁移。尤其是较高层次的学习目标,教育测量更可以引导学生关注这些较复杂、较深奥的学习内容,以弥补教学期望的效果。
3 促进学生自我评价
教育评价可以提供反馈信息,让学生了解自己学习上的优缺点,有哪些错误的概念需要更正以及有哪些技能已达到熟练程度等自我评价的效果,以促进自我了解,自我认可,帮助学生自己做出最佳的学习决策或制定出最佳的学习计划等。
(四)行使教育管理的功能
教育评价具有教育管理的功能,这是因为许多测量与评价方案是按照教育政策、教育法规、教育文件、教育目标等具体要求来设计的,体现了国家、社会、教育管理者等方面的意愿,具有控制、指挥、导向、计划、检查、考核、评估和监督等方面的作用,行使了教育管理的功能。主要是:
1 对教师的管理
评价在对教师的管理中所起的作用具体体现在以下几个方面:
一是教师的资格评定,即教师的专业知识水平是否达到基本要求,专业知识包括文化知识和教育心理学方面的知识。
二是教师的教学艺术水平的评定,即对教师的教学能力进行评定。
三是教师管理水平的评定,即对教师在班级管理方面的能力进行评定。
四是教师的个性评定,其中教师的资格和教学艺术水平的评定是其核心内容。
充分发挥教育评价在教师管理中的作用,可以提高对教师管理工作的科学性。
2 对目标的管理
教育评价是根据教育目标进行的,它通过对现状与目标之间的差距进行判断,能有效地促进被评价的对象不断接近预定的目标。因此,通过评价目标与指标体系的引导,可以为学校指明办学的方向,为教师与学生指明教与学的目标。①
3 对过程的管理
利用教育评价,可以全面地掌握教育的各种情况,及时发现教育过程中存在的问题,对教育教学任务完成的数量与质量进行控制,为促进、提高教育活动的有效性提供科学的依据。
教育评价具有上述多种多样的积极功能,但这些功能是否得到很好的发挥,就要依赖于我们能否制定出科学的方案,能否正确地认识和使用评价手段。在新一轮基础教育课程改革中,我们要 “改变课程评价过分强调甄别与选拔的功能,发挥评价学生发展、教师提高和教学实践的功能”。②
①参见靳健,石义堂主编 现代语文教育学 兰州:甘肃教育出版社,2000 311—321
①②黄光扬主编 教育测量与评价 上海:华东师范大学出版社 2002 40—42教育部:基础教育课程改革纲要 (试行),教基 [2001]7号。
第三节 高中语文教育评价的过程与方法
一、高中语文教育评价的过程
高中语文教育评价的过程与其他教育评价的过程具有共同性,也有自己的特性。
(一)学生评价的基本步骤
学生评价是一件技术性很强的工作,按照评价工作的基本规律,科学地开展学生评价对提高评价的质量会有很大的帮助。从评价学的观点看,科学地评价学生的学习进展与行为变化要经过以下六个步骤:
1 确定教育方案的目标,并预测各种可能出现的非预期的副效应。
2 把教学目标转化为作业目标,预测各种副效应可能的行为表现。
3 设计获得学生反应的途径。
4 决定评定方式与获取代表性样本的方法。
5 取得记录。
6 结果分析
上述六个方面的工作是紧密相连、环环相扣的,其中第一至第四步是评价的设计;第五步是评价的实施;最后一步是结果的分析与处理。①
(二)其他评价的步骤
盖尔在 《教育评价与测量》一书中,从教育活动展开这一侧面提出,评价活动可以分为准备、实施与结果分析三个阶段,这三个阶段适用于学生评价以外的其他评价活动。其中每一阶段又有若干项工作。
1 评价的准备阶段包括:背景分析、制定评价的方案和建立评价组织。
2 评价的实施阶段包括:相互沟通、收集信息、评议评分和汇总整理等项工作。
3 评价的结果分析包括:收集与目标相关的资料、收集非预期成果的资料、分析与解释资料、撰写评价报告和向有关方面提供反馈评价信息等。②
二、高中语文教育评价的方法
高中语文教育评价的方法按照不同的标准划分,有不同类型,这里主要介绍以下六种。
(一)听课法
听课法是语文评价者根据评价对象和指标内涵的要求,有目的、有计划地获取语文评价信息资料的方法。它以 “听”和 “看”为基本手段。
听课法的基本步骤是:
第一,根据评价的目的和质量要求,设计好听课的记录表格。第二,根据授课老师的授课情况和学生的反映情况,及时记录,填好表格。第三,召开评议会,将听课记录收集起来,进行统计分析,对授课教师作出结论。
听课的方式和要求:
一是听课要有针对性,根据评价对象和目的,确定听课的内容和范围。二是掌握好听课记录的方法和技巧,常采用行为摘录法和评定量表法。三是对评价对象应有统一的听课标准,尽量减少个人情感和心理影响。四是评价者只能将听课作为获取评价信息的资料,不可作为评定成绩或其他结论。目前,不少学校往往就凭老师的一堂语文课来给被评价者做出定论,这是一种不严肃的行为。
(二)问卷法
问卷法又叫填表法,是通过对评价对象进行书面调查而获取评价资料的方法。这种方法可以在较短时间内获取较多的信息资料。目前,问卷法多采用定案表格型,即在案卷上出现多种答案,让被评价者在认为合适的答案上做出记号。其优点是易于统计分析,如每学期期中考试后学校面向学生组织的针对语文教师教学情况的问卷调查,大多是采用定案表格型。
问卷法的基本要求是:
问卷的内容要全面而且有层次和清晰感;各项中的权重和赋分要合理,符合语文教学的实际;突出重点内容,不能喧宾夺主。
(三)测验法
语文测验法主要是指语文考试。它是语文测量获取教学评价资料的主要方式,教师教的情况和学生学的情况大多可以从考试中反映出来。
1 语文考试的类型
根据编制方式,语文考试可分为标准化考试和教师自编试题考试两种。
标准化考试是指考试试题的设计、题型、题量、试卷长度、实施、计分、分数的解释等一系列程序都是按照统一的标准和严格的控制进行的,所有的被试者条件一致。它是由语文学科的专家和测试编制专家按程序精心设计的,具有较高的效度和信度,试题本身又有恰当的难度和较为理想的区分度。
其优点是具有客观性、可比性,是评价学生成绩的主要工具。
教师自编试题考试是教师在单元教学的各个阶段,根据需要,为完成教学任务或了解教学情况而自行设计的考试。
其优点是:考试内容与教材内容、目标、要求和进度完全一致;难易程度符合学生的胃口;较为灵活自由,随讲随测。
根据记分方式的不同,语文考试可分为常模参照考试和标准参照考试。
常模参照考试是以学生团体在该考试中的平均分数 (常模)作为参照标准,说明某一学生在被测团体中的相对位置,将学生分类排队,重在个人间的比较。这种方法使分数的客观性及可比性达到了前所未有的水平,实现了考试成绩的高度数量化。
标准参照考试是以具体的教学目标为标准,测试学生是否达到教学目标以及达到何种程度。它对于诊断教与学的情况尤为适宜,教师自编考试,多属此类。
根据考试功能分类,语文考试可分为诊断考试和普通考试;根据教学过程分类,语文考试又可分为期初摸底考试、期中阶段性考试和期末总结性考试。从政策上看,语文考试还有会考和高考等。
2 语文考试命题设计的基本原则
语文考试命题的原则是测量考生语文水平的理论依据。了解并掌握了原则,语文命题就有了“度”,测试就有了效果。
第一,依 “纲”扣 “本”的原则。“纲”就是指语文教学大纲和语文考试大纲,“本”是指语文教材。第二,知识与能力相结合,而又以能力为主的原则。第三,客观性试题和主观性试题相结合的原则。第四,难易适度的原则。对于每学期期中、期末考试,难易比例应以7:2:1为好或者以6:3:1为好,系数应掌握在0 70左右;对高考而言,低、中、难的比例多在4:4:2,难度系数一般掌握在0 55—0 65为好。
3 语文客观性试题的设计
语文考试题目一般分为客观性试题和非客观性试题。客观性试题是在试题内提供正确和错误的答案,让学生从中选择他认为与题干要求相符的正确答案。这种题型评分客观准确,便于人工阅卷或微机阅卷,不受评卷者的主观因素干扰。经过精心设计的客观性语文试题能从语言知识(语音、文字、词汇、语法、修辞、标点、句子)及其运用等多个角度来考查学生的语文学习水平和能力,其不足是不能考查学生的语言文字的组织和表达能力。
客观性语文试题的形式有四种:即判断正误题、配对题、单项选择题和多项选择题。判断正误题是只提供正确和错误两种答案,让学生选择,不存在模棱两可或中间答案。配对题是提供若干个题意和答案,要求学生将每个题意配上他认为正确的答案。
目前这两种题型在大型考试中已经被选择题取代,因为其本质也是选择题,只不过通常的选择题是四选一,而判断题是二选一;配对题是交错的多选。
单项选择题是客观性试题中采用最多最普遍的一种形式,标准规范化的单项选择题一般是从所给定的四个答案中选出正确的一项。
多项选择题大多用在阅读理解当中,是指所给定的多项答案 (一般是4—6项)中不止一项是正确的。这种题型集中了客观性试题的优点,是考查学生阅读理解能力较好的一种形式。一是它能体现阅读目标的层次;二是对不同学生公平对待,猜测的概率较低;三是提供的选择项都是难度不一的迷惑性答案,对学生有诊断作用。近年高考阅读的最后一课就是多选,但2005年的高考取消了多选。
在设计语文客观性试题时,应注意以下几个问题。
一是客观性试题考查的多是语言知识的理解及其运用,因此,在设计题目时,设计者对知识的理解要准确,对题干要求的语言表述要有清晰度。二是提供选项或答案的排列应是随机的,要有迷惑性,而不是有规律的排列。三是题目的设计要严谨,注意区分度,比如多项选择题,如果备选答案不严谨,那么就会产生丧失鉴别能力的消极作用。四是题目设计要有梯度即层次性,掌握好难易程度,防止偏难或偏易。
4 语文主观性试题的设计
语文主观性试题就是在答题时学生必须依靠自己的语言来组织和表达才能实现对题目认知的题。它有两个特点:第一,语言的组织和表述可以不必求统一,自由发挥的空间较大,只要符合题干要求,意思对即可。第二,评卷时必须依靠阅卷老师的主观判断。这种试题的优点是能最大限度地发挥学生的创造力,培养他们组织语言的能力,可以弥补客观性语文试题的不足之处;缺点是往往由于缺乏严格的客观标准而造成阅卷老师的主观误差,费时间,信度也不高,特别是表现在对作文的评判上,出现较大误差的概率就特别大。在语文选拔性考试当中,学生对语文往往最没底,就是因为作文误差造成的。
由于主观性试题的问题多集中在阅读和写作上,因而对此两项内容应该格外重视起来。 现代文阅读题的设计要体现教学目标和要求,宜从下面七个知识点入手,由浅入深,循序而进:
① 理解词语在句中或文中的含义。
② 理解文中重要的句子。
③ 辨别和筛选文中重要的信息。
④ 分析归纳文章的内容要点和中心思想———具体的能加以概括,抽象的能加以阐发,含蓄的能加以解说。
⑤ 分析文章的结构层次和表现形式。
⑥ 分析概括作者在文中的观点态度。
⑦ 初步评价鉴赏文章的思想内容和表达技巧。
文言文阅读题的设计也应从如下七个方面入手:
① 理解常见实词在文中的含义。
② 了解常见文言虚词在文中的用法。
③ 了解与现代汉语不同的特殊句式和用法 (词类活用)。
④ 正确把握句子在文中的意思。
⑤ 翻译成现代汉语。
⑥ 分析文章的内容。
⑦ 分析概括作者在文中的观点和态度。
作文题目的设计主要表现在题目和评分标准的制定两个方面。
题目的设计应遵循下面三个原则:
一是要密切关注社会,贴近日常生活,并且学生熟悉,能写。二是要加强不同文体、不同表达方式和不同思维类型 (联想思维、想象思维、求异思维、发散和辐合思维、辩证思维等等)的综合性,体现综合特质。三是要体现对学生的思想和道德教育。
对作文评分标准的设计关键是要制定作文评分量化表。
目前,在高中的作文考试中,选拔性考试基本上采用分项分等量化表,阅卷时要分项分等打分,目的是防止误差,体现准确性。而在非选拔性考试当中,由于阅卷人力和时间的限制,多采用综合评分标准。这种方式的优点是速度快,但缺点是误差概率高。
在设计语文主观性试题时应注意:命题者预先制定好标准答案,并列出可能出现的答案,定出处理的办法,而且办法要详细、明确,以免使阅卷陷入无法操作的被动局面。
5 语文试题的分析和试卷的评价
①语文试题的分析。语文试题分析的任务就是将学生答题过程中的表现或带有倾向性的错误作系统的整理和讲解,以帮助学生检查他们的语文学习情况。
它的意义主要表现在四个方面:
第一,了解每道试题是否达到了老师所希望达到的水平。第二,了解学生在语文考试中的具体表现。第三,为改进以后的语文教学提供依据。第四,修正试题,以便今后备用。
考试中,每道语文试题的质量究竟如何,需要作出量的分析,这便涉及难度和区分度了。语文试题的分析主要就是指这二者。
难度是指每一个小题的难易程度。难度值常用答对该题的人数比例即通过率或正答率来表示。
区分度是指语文题目对不同水平考生的区分能力。一道试题的得分与试卷总分的相关程度就是试题的区分度。区分度高,表示该题的区分能力大,使水平高的考生得高分,水平低的考生得低分。反之,会出现水平低的得高分,水平高的得低分的反常现象,这就没有区分度。一般认为,区分度值不足0.2的试题应淘汰,大于0.3小于0.4的属良好,大于0.4的为优秀。
区分度和难度密切相关。一般来说,太难或太易试题的区分度往往很低甚至等于零,中等难度题目的区分度较高,难度值为0.5的试题,其区分度最高。所以,调整试题难度是提高区分度的重要方法。就整个语文试卷来说,每道试题都有相当的区分能力,但它们对考生的具体区分情况又不完全相同,这样的试卷才有较为理想的区分效果。评判语文试题的质量,区分度是比难度更为重要的指标。
②试卷的评价。效度和信度是测量学中最重要的两个概念,是确定测验质量最基本的条件。我们对一份语文试卷的评价实际上就是对效度和信度的评价。
第一,试卷的效度。效度是指语文测验或考试的内容与该测验或考试设计所要测量的东西的符合程度。
简单地说,就是考的内容是否就是该考的。效度的分类对于语文考试而言,主要有内容效度和效标关联效度。内容效度指的是测试内容与预计要测的内容间的一致性程度。语文考试不可能包括所学过的全部内容,必须就一些基本知识或问题来编题,合成试卷。如果考试题目是所学内容的最佳代表,则可以推论考试有效;假如考题偏差,与内容无关或关系不大,则视为无效。效标关联效度,又叫预测效度,是指考试结果与效标之间的一致性程度,一般指的是一次语文考试对于特定情境中的考生行为进行预测的有效程度,预测越准,那么有效程度越高,说明预测与实际发生的情况越接近。
第二,试卷的信度。信度是指考试结果的可靠性程度,是衡量考试质量的重要指标。语文测验的信度如何,对学生、老师来说都十分重要,信度不高的考试不能保证对每个学生都
公平合理,也不能提供关于学生成绩的真实情况,教师也就无法依据它来改进后边的语文教学。
根据影响信度的不同因素,可以把信度分为几类:
一是评卷教师的信度。这是至关重要的因素,教师的责任和水平对学生主观性试题尤其是作文的评判影响极大。在具体批阅过程中,往往是一个老师一个样,一个老师一个标准,由此导致作文误差进一步扩大。对待同一篇作文,不同的评卷者便会由于不同看法而得出不同的分数。而这种状况,同样表现在选拔性考试中,由于阅卷者的水平不同,有的甚至不是语文老师,因而要想保证阅卷老师的信度就很难。解决的办法只有一个,那就是加强对评价标准的学习和交流。
二是重测信度,又叫再测信度,即用同一种测验在不同的时间里两次测试同一组学生,然后统计两次测试成绩的相关性,求得相关系数即为信度最高,说明测验成绩稳定、有效;如果是0,表示重测信度最低,说明成绩不稳定,受影响变化大。
三是 “等值复本”信度,即分两次用两套内容、难易程度、试卷结构相等的语文试题来测验同一组学生。获得的两组成绩间的相关系数就是 “等值复本”信度。在目前的语文教学中,各学校的语文老师大多建立了相关内容的语文题库,两次考试样题完全可以解决好。
四是分项信度,即把语文考试的三部分内容分为基础知识、阅读理解和作文,统计分数时对此三部分内容的成绩分别计算平均分,作为信度的指标。这样,教师在相互比较时,这个参照就有了可信度,从而指导教师今后在哪些方面还应努力。
(四)统计分析法
统计分析的方法就是用系统论中所揭示的数学方法去搜集在数量上不确定的评价信息资料。在语文教学系统评价中,统计分析的方法主要表现为算术平均值法。算术平均值法通常称为平均数或均数、均值,它是把教学中各个变量总和除以教学中变量个数所得到的商。这种方法适用面较为广泛,既可用于评价教师的课堂教学,也可用于考试中每道小题的正答率和语文平均分的计算,同样可用于学生互改作文。
(五)评定法
评定的含义。语文教学系统评定阶段的主要任务是在整体语文测量结果的基础上,对被评价者做出价值分析,并得出相应的评价结论。它不同于测量,不是一种纯客观的活动,而是主观需要和客观情况的有机统一,是教学系统评价功能实现与否的主要决定因素。评定的方法就是定性和定量相结合的方法。定性多是语文评价主体通过多种渠道和途径了解到的对被评价者发表的意见和见解;定量是评价者通过所掌握的有关数字对被评价者进行的等级价值判断。在定性评价中有时以定量评定为基础和前提;在定量评定中也要通过定性研究,分析被评价者的教学或学习,提出要改进的意见。二者必须有机结合,才能使整个评定过程和方法更加完善。
评定的基本要求。一是准确性,符合评定对象的实际;二是可接受性,评定的结果应该能为被评定者所接受,并引起他的积极反应;三是指导性,做出的评定不但要提出准确的、可接受的结论,而且还应为被评定者指明今后努力的方向,提出进一步解决的具体措施。
评定的方式。一是评语。运用口语或书面文字,对评价对象进行解说,这是在评价活动中最常见的一种形式;二是评分。运用分数或等级对评价对象进行界定。它的优点是容易鉴
别出评价对象之间的高低,能激发起评价对象间的相互竞争,但也容易给评价对象造成心理压力。
总之,评语和评分、等级是语文教学系统评价中最常见的形式,带有较强的普遍性。
(六)模糊综合评价法
模糊综合评价法是把模糊数字应用于语文教学系统评价而形成的方法。它是根据评价对象和评价目标要求建立起模糊矩阵,通过一系列的判断、推理、论证,由最佳隶属度原则得出可靠结论的一种评价方法。用模糊数字进行综合评判,包括三个方面内容:系统分析、模糊、数字处理、计算机运算。
其主要步骤如下:组织上成立评委会;确定因素集U;确定评价集V,确定模糊关系矩阵R;确定权重系数A;进行运算,对评价结果最后处理。这种方法的引进和运用,其优点是避免了定性评判法的主观随意性,可以克服打分法弹性较大的弊端;每个评委都独立行使评判权利,防止个人说了算;能够使评价拉开档次,分出高低。不足之处是过于烦琐,操作麻烦。①
①②陈玉琨 教育评价学 北京:人民教育出版社,2004 71,72陈福华 教育评价的概念、分类、步骤和基本模式 中国教育报 2002—10—21
①参见朱本轩等 语文教学系统论 青岛:青岛海洋大学出版社,1998 212—215
第四节 高中语文教育评价的模式
教育评价的模式是相对固定的评价程序,它是在一定的理论指导下对教育评价的基本范围、内容、过程和程序的规定。西方教育评价的模式一般都有较大的适用范围,不但可以广泛地用于学生评价,在实践中也被广泛地运用于课程与教学方案评价等各个方面。教学评价主要有以下三种模式:
一、泰勒模式
泰勒模式诞生于20世纪30年代,泰勒评价模式与现代学生评价的关系最为密切。这一模式的基本观点集中体现在所谓的 “泰勒原理”中。泰勒原理是由两条密切相关的基本原理组成的:一条是 “评价活动的原理”,另一条是课程编制的原理。泰勒评价模式的评价步骤包括以下几个方面:
① 确定教育方案的目标。
② 根据行为和内容对每个目标加以定义。
③ 确定应用目标的情景。
④ 确定应用目标情景的途径。
⑤ 设计取得记录的途径。
⑥ 决定评定方式。
⑦ 决定获取代表性样本的方法。
二、CIPP模式
CIPP模式诞生于20世纪60年代。有人对泰勒评价模式提出疑问,认为,如果评价以目标为中心、依据,那么,目标的合理性又根据什么去判断?教育除了活动要达到预期的目标外,还会产生各种非预期的效应、效果,这些非预期的效果等要不要进行评价?在西方,有一种教育流派认为,教育乃是个人自我实现的过程,用统一的目标模式去统一个人的自由发展,去评价教育、教学的结果,从根本上是不可以接受的。1966年斯塔弗比姆首创了CIPP评价模式。这是由背景 (context)评价、输入 (input)评价、过程 (process)评价和成果 (product)评价这四种评价组成的一种综合评价模式。
三、目的游离模式
这种模式诞生于20世纪60年代,是由美国教育家和心理学家斯克里文提出来的。严格地说,目的游离模式不是一种完善的评价模式,它没有完整的评价程序。因此,有人把它仅当作一种关于评价的思想原则。斯克里文断定:“对目的的考虑和评价是一个不必要的,而且是有害的步骤。”按他的观点来看,目标评价很容易使评价人受方案制定者所确定的目的的限制。因此,他建议把评价的重点由 “方案想干什么”转移到 “方案实际干了什么”上来。他认为,评价委托人不应把方案的目的、目标告诉评价人,而应当让评价人全面地收集关于方案实际结果的各种信息,不管这些结果是预期的还是非预期的,也不管这些结果是积极的还是消极的,这样才能使人们对方案做出正确的判断。①
以上三种评价模式具有普适性,因此,虽然其模式的创设并非针对高中语文学科,却同样适用于高中语文教育的评价,只是在具体操作中,评价者应该善加选择,并根据具体情况扬弃,为评价的本土化、学科化作出贡献。
第五节 高中语文教育评价存在的问题
新中国成立以来,语文教学评价体系随着语文课程改革而同步推进,内容和形式都有了很大的发展,对促进语文教学的历史功绩无可置疑。但是,突出的弊害也日益彰显,成为语文教育发展的桎梏。随着教育改革不断深入,教学评价的改革也出现了种种变化,形势确实对语文教育评价改革有利;而且我们知道,语文教育评价有许多特殊性,因此,在借鉴国外教学评价经验的同时,要充分考虑到自己的实际情况,不能照搬照套外国的一套,但对先进的理念精神也不能拒绝。现实同理想状态总是有很大的距离,我们的语文教学评价存在一些问题。
一、评价内容的伪圣化
这是整个语文教育在语文教学评价体系中的集中反映。所谓伪圣化,就是用一套唯一的 “公共思维”模式,钳制师生丰富多元的精神方式、说话方式,压抑精神自由,让全体师生都用一个模式思维,用一套话语说话;用伪神圣、假崇高的观点去看待 “高尚”、“健康”、“先进”等真正的人文价值范畴。培养学生言行脱节,思想与行为相悖,远离真实。体现在语文教学评价中,无论是教师教学还是学生表达,都要体现唯一的社会主流意识。其表现如下:
一是禁绝个性语言、多元解读。如对人物形象的分析,总要先深挖其阶级根源,对故事情节的理解,总要联系社会现实,作文也要写积极向上的,轰轰烈烈的,有 “意义”的事,因为考试时答案就是这样,否则将被扣分甚至不得分。不管学生的个体感受是否真实,强调千篇一律。分析 《祝福》的主题,必须分析出批判 “四权”,否则评价不高。
二是定制统一的公共话语套子让师生共同使用。语文教育中过于强调思想政治的教化作用,使语文丧失了个性,丧失了自身,导致一些话语 “意象”被赋予了特定的象征意义,如石子与奉献、蜡烛与教师,大公无私与共产党员、光明与社会主义、腐朽与资本主义等,带
有明显政治褒贬色彩的话语与特定的意象构成了固定的对应。学生对课文的理解,写出的文章,天南地北如出一辙,从小学到高中,形近神似,千万个不同的脑袋,有着惊人相似的精神套路、言语方式。曾经听一位教师讲 《故都的秋》,当时正值北约轰炸我国驻南大使馆事件爆发,于是课堂上由 “故都的秋”联系到北京的春天,再联系到科索沃的春天,再升华到 “科索沃没有春天”,于是群情激昂,声讨一片。于是,大家沉浸在“成功”的赞扬中。
三是 “圣化”“升华”情结。言必社会制度、阶级根源,看到一篇文章一定想揭露了什么,歌颂了什么,作文一定要写积极意义、有价值的东西,写高尚的、宏大的、反映社会主旋律的,即使写了点 “阴暗面”,也要来一片 “亮色”,安一个 “光明的尾巴”,似乎一定要学生言不由衷,一定不让他说真话。朱自清在 《荷塘月色》中的表现出的 “淡淡的哀愁”是因为国民党叛变革命;巴金在 《灯光》中 “我不由得看着山那边笑了”的 “山那边”是指革命圣地延安„„诸如此类,不一而足。
二、评价标准的教条化
语言是思维的外壳,通过语言教学训练思维,培养情感,形成思想,从而达到课程设计的目标。检验是否达标,还是要借助语言。抛开写字识字及语法修辞等客观性较强的基础知识姑且不论,学生对现实的客体进行阅读、思考后,用于表达意志情感思维水平的语言形式应是各具情态的,但现行的评价体系中,通行的评价标准却是单一的、教条的。
一是格式的标准化。把标准化考试方式引入语文评价体系后,客观试题标准化,主观试题也试图标准化,或准标准化,逼着学生按一定的套路来思考,甚至出现 “作文就是一个大填空题”的怪论。在试题中要求用规定字数写出对文章内容的理解,更是屡见不鲜。以教条单一的形式束缚鲜活多样的思维,按一个模子 (标准答案)铸出规格一样的 “思维”,导致思维的 “标准化”,教出的学生没思想,也不会思想。
二是过程的要点化。现行的评价形式主要是试卷,试卷有参考答案,对主观性的问题,参考答案一般也罗列几个要点,供师生参考。但实施过程中,为追求评价的标准统一,阅卷简便,便对参考答案简单化和绝对化,使参考答案变成标准答案、唯一答案,以致教师教学时胆战心惊地强调,对某内容必须理解成几个要点,不能理解为几个要点。否则就得不到分数。学生在十二年的语文学习就挣扎在这样的环境中,学生成了一个被动反应的机器,对语文知识的整理反馈过程便是罗列要点的过程。学生答题答要点,教师阅卷找要点,对上几点就给几点的分数。在学生心中,本来生动活泼的大千世界变成了几个要点,几个原则的构件,语文学科的人文性肢解殆尽。
三是评价结果的数据化。对语文教学成效、学生掌握程度一律以数据量化。冷冰冰的数字,使一些隐性能力无法得到体现。如果一个口吃者甚至读不准拼音和四声的人能记住每个字的注音,他的语音成绩会是满分,而一个朗诵水平不错的学生如果记不清某些字的拼音写法,语音考试成绩则很不理想。单纯的量化评价不能全面准确衡量出教师的教学水平和学生的掌握程度。
三、评价结果的功利化
领导评价语文教师的工作往往只是以考试成绩 (结果)作为依据,而且这些 “结果”很可能并不是最终的结果 (高考),而是学生平时的所谓 “统测”、“摸底”成绩。常常见到我们的校长和教导主任充当 “会计”角色,一次次在统计成绩,用电脑排名的方式来对教师和学生施加压力———在现实应试压力严重的情况下,不少教师受到焦虑感的困扰,有的人工作非常努力,他们认为学生的成功是自己的功劳,因而对学生的失败就会责怪各种外在条件。考分高低不仅是学生成绩好坏的标志,也是教师教学实绩的唯一标准。升学的唯一
尺度是考试成绩,升学率是学校教学质量的晴雨表。对于学校、教师、学生,有了考分就有了一切,考分高,升学率就高,学校信誉就好,生源就有保证,就有发展的空间。学校也是以学生考分高低来评价教师的工作业绩,一般还要与奖金福利、评优晋级直接挂钩,考分成了学校、教师和学生的唯一追求。有些地方虽然把考试量化成绩作为整个工作评价体系的一部分,但对其他工作考核采取一些定性的办法,在没有等次悬殊的情况下,考分依然是区分高下的唯一尺度,致使 “考考考,教师的法宝,分分分,学生的命根”几十年积重难返,考分等于零,一切等于零,纵有千般本领,考试答题得不到高分,任何努力都是徒劳。
尤其要考查语文教师在整个教学过程中做了一些什么努力,他是怎样努力提高自己的专业能力和教育心理学知识水平的,可惜这一些往往并不在校长们评价的范围之内。同样的情况也会出现在教师对学生的评价上。如有些学生尽管暂时成绩不理想,但他有可能在努力改变学习方式,加强知识积累的同时,努力阅读与写作,虽然由于种种原因,暂时还不能在成绩上反映出来,只要持之以恒,他总会提高成绩的。同样可惜的是,这些学生的努力往往在不断进行的测试中被忽视了,因为教师也是只看结果不看过程。总之,无论是学校行政领导还是教师,弄清楚教学过程中一些变量对我们评价语文教学工作有重要的意义。加涅说:“当学习根据结果来评估的时候,学生在教学情境中的学习能力可能对学习具有重大影响。因此,要测量教学方案的效果,必须施加某些控制,使学生已有的学习能力倾向对学习的影响能够单独分离出来,才能说明教师自身所起的作用。”除了学生自身的能力倾向以外,我们还须要将学生的家庭背景、社会背景对学生学习的影响从中 “分离”出来,才能对教师教学工作加以恰当的评价。如我们所知,影响学生语文因素要比影响数理化学习复杂得多,语文水平的提高是一个漫长的渐进过程,因而还有一点,教师的教学实绩也应当是一种复杂的精细工作,仅凭一二节公开课,对学生的一二次测验就判断某位教师的工作,很可能是不全面甚至是有谬误的。为什么一位教师在普通中学教了多年都成绩平平,而一旦进入省市一级重点中学时,其教学实绩立即令人刮目相看?这其中一个可能的解释是:在教学过程中,影响学生学习结果的各种变量是不一样的,对知识积累丰富和智力超常的学生来说,很可能他们取得的成绩多数是自己学习所得,并不是靠教师教会的。“一切真正的学习,归根到底,是自我教育。”尤其是语文学习,明白这一点是十分重要的。①
四、评价主体的边缘化
语文教师已经丧失了参与评价的权利,更不用说学生自己参与评价了。语文教学评价在这十多年里出现了这样一种情况:课程是由上级制定的,授课计划是由教学参考书给预定的。更为严重的是,所有学生的考试试卷包括平时的练习卷都是由校外人士设计出来的,由教育部门统一印制的,教师对学生学业的评价是以他们提供的 “标准答案”为标准的。英国新教育代表人物之一的尼尔说:“当一个人不再计划和控制他自己的工作时,完成这些任务所必备的技能会衰退直至遗忘。教师经过数十年艰辛劳动而形成的技能———确定课程目标、构建内容设计教案和教学策略、根据对每个学生的愿望和需要的详细了解而进行个别教学等一一都丢失了。”还说:“课程变得完全标准化和系统化。完全集中在测验测得的能力上,并主要依赖事先设计好的商业性的材料,这种趋势可能会带来与我们想要达到的目的完全相反的结果。我们可能不再拥有那些关注自己要做什么和为什么要做这些事的专职教师,而只会拥有异化的、执行他人计划的人。”这种“异化”正在我们这里发生。以前,我们每位教师通常每学期总要根据教学情况,设计几次小测验,期中期末考试都是由学校自己决定的。评价是教学的一部分,教师通过考试了解每位学生的学习情况,然后反馈给学生及其家长。由于语文学科的特殊性,一般来说,语文教师比其他人更了解自己学生的学习情况,每个学生的 “变量”不同,一个学生的学习情况要比一张试卷成绩反映出来的东西复杂得多,但由于将校外和校内的教学评价混同起来,于是一律采用校外统一考试的方法 (以终结性的评定为主,以选拔为标准)来考学生,平时的期中考试和期末考试大多采用模仿高考题题型的考卷,或参加省市一级的 “统测”、“摸底”,或由几个名校组织起来 “联考”,然后组织一部
分教师按统一的 “标准”阅卷,于是任课教师和学生的命运攥在一批并不了解自己的人手中。由于每次语文试卷的信度效度总是不如数理化,于是常常会出现 “有人欢喜有人愁”,语文水平高的学生完全有可能考不过水平比他低的人。对此,语文教师完全无能为力,因为掌握着 “话语权”和 “命题权”的行政管理部门作为一方,代表着强势团体,而广大语文教师和学生成为另一方,成了弱势群体。他们的责任是完全按照别人给你设计好的试题去做去想,而不允许有自己的主动性,教师也无能力利用评价来激励学生主动地去学习。教师、学生只有去不断地重复考试———批卷的劳动。
教师已经完全丧失了评价自己学生的权利,即使课堂里有评价,也是按照别人定下的调子去评价。一旦教学评价中非教育因素介入了,那么情况便更糟。例如由某种权威人士编写的系统练习进入当地课堂时,有哪一位教师敢于拒绝?尽管教师可能知道做这样的练习题也许根本不可能提高学生的语文素质,连起码的应试能力也提不高,遑论智力和智慧。相反,过于频繁的测试引起了教师与学生的高度焦虑,于是教育的不公平现象就出现了,语文教学在成就了极少部分 “胜利者”(得高分的)外,却造成了更多的失败者。更严重的是教师也会处于焦虑状态中,为了适应需要,教师会采用自己认为适当的各种手段鼓励班里的学生竞争,以此来提高成绩。
例如:我们一方面在批评传统 “死记硬背”式的学习方法,一方面却又强迫学生去背试题答案和教学参考书中的分析文字。学生如有不服从,则会借助于各种惩罚手段。这种情况在全国各地区不同程度地存在。单一的试题形式产生厌烦,频繁的测试又导致高度的焦虑感,长期处于高度焦虑状态中,不但学习变得无效,连人格也会产生变异。教育评价的作用便被异化了,教育本身也被异化了。①
①尤新潮 建立新的语文教学评价体系是实施语文新课程标准的基本保证 语文学刊
①参见赵志伟 高中语文课程新探 长春:东北师范大学出版社,2004 229-231
第六节 高中语文教育评价的趋势
教育评价是为教育服务的,教育发展了,教育评价的手段方法也要跟着发展,教育史上的教育评价经历从考试、测试到教育评价三个阶段正是适应了教育的发展。作为教育评价组成部分的语文教育评价,也要适应这种发展和变化。从哲学角度看,变是绝对的,不变是相对的。任何一种评价方法总有利有弊,再好的试题,沿用久了也会产生弊端。例如:语文考试引入 “标准化试题”,初衷不可谓不好,而且确实也在语文考试中起了重要作用。但随着语文教学改革的深入,它的弊端也越来越为人们认识,所以要探讨,要改革,要变,但是,这种 “变”,是在继承传统下的 “变”,而不是盲目地赶潮流;是在尊重教育规律的前提下稳步地改革,而不是否定一切。作为一名高中学语文教师,应当对当前国际国内教育评价的改革和发展趋势有所了解。
一、教育评价的新趋向
(一)国际教育评价的新趋势
教育评价具有导向功能这是一种客观存在,这一点国际国内都一样。但对我国来说,这种 “指挥棒”的作用尤其明显,因为中国的教育资源尤其高等教育资源有限,而教育评价的重要功能就是给学生分等级作鉴定,以利于选拔。为此,教育评价要力求公正客观,具有权威性。另一方面,教学活动具有丰富多样性、复杂性和不确定性。在教学活动过程中,各种变量 (环境、遗传、教学活动等)都会影响教学结果,而我们的评价手段与工具又有局限性,所以教育评价不可能做到完全公正客观,而且无论你如何精心设计各种测试方式,所能考到
的,总是只有某一方面的内容。因此,探讨教学评价新方法,力求客观公正,力求评价方法科学,力求评价方法多样化成为全球性的课题。从目前来看,教育评价有这样一些趋势:
1 更加注重教育评价的诊断性
强调 “诊断性”功能目的是为了改善教与学,它要求适应并发展每个人的能力、能力倾向,以目标达到度来代替传统的等级与甄选为主的评价。教育评价与传统考试和测验最大的区别在于:前者是为了 “创造适合于儿童的教育”,而后者则只是为了 “选择适合教育的儿童”。以人为本,以改进学习、推进学生发展为本的理念是教育评价的根本目的。
2 更加注重教育评价的全面性
布卢姆在 《教育评价》一书专门列了一章:情感目标的评价技术,他认为 “认知可以改变情感,情感也能影响认知”。因此,他把情感目标也列为评价内容之一。近年来,这种对情感目标的评价的重要性越来越为人们所认识。
“评价全面性”的另一个含义是指教育评价目标从重知识到重全面素质转变。注重对学生基本知识和基本技能的掌握,是当今教育评价的热门话题。除了评价学生的智力能力外,还注重对学生思想、心理素质的评价,除了评价学业成绩外,还要评价学生的非学业成绩。
3 更加注重教育评价中的自我评价
教育评价一个主要的作用就是反馈。反馈的目的是让受教育者从评价中获得对自己学习方法、技能、成就的认识,学会自我评价,能够修正自己的学习计划,改变学习方法,提高学习效率。同时自我评价也应包括教师自己对工作的评价:强调自我评价可减少终结性评价给教师、学生带来负面性的焦虑感、盲目的攀比、自卑等。20世纪90年代美国等先进国家开始发展起来的“表现性评价”、“档案袋评价”以及我国有些地区出现的 “成长记录袋”等都是让学生参与自我评价的一种尝试。这种评价可以使学生通过 “成长记录”看到自己进步的轨迹,发现自己的不足,并通过 “成长记录”加强自我反省和自我评价的能力。“档案袋评价”可以做到使袋内资料与学科教学目标相结合,阶段性评价和期终评价相结合,自我评价和他人评价相结合,可以全面考察学生的知识和技能、过程与方法、情感态度和价值观三方面的发展。
4 更加注重教育评价的多元化
所谓多元化,主要是指评价方法手段的多元化,从各个角度采用不同方法对教学过程进行评价。例如:对不同教学目标可采用阶段性测试,成就测试,也可采用水平测试。对不同的教学内容可采用综合性测试和单项测试,既可以由教师测试,也可由学生在教师指导下自测评估;测试的方式既可用笔试,也可用口试;试题既可用 “客观型”、“标准化”,也可用传统的论文型;既可以开卷,也可以闭卷等等。
此外,评价标准也在改革,从只有统一性答案发展到多样性答案的出现。从20世纪初 “标准化”客观型试题出现以来,它已走过了八九十年的历程,人们对它的好处有了充分的认识,但对其局限性和可能产生的弊端也逐渐有了认识。所以,现代教育评价在评价标准上从统一性的答案逐渐走向多样性,让学生有自由发挥的空间这一种趋势对人文科学尤其重要,它可以给学生多次机会。近几年不少地区,如北京、上海等地实行了一年两次高考,语文作为最重要科目之一,当然要适应这种变化。此外,随着高考改革深入,口试将成为重要考试之一,语文选拔考试中,口试也成为语文评价的重要手段之一。复旦大学、华东师范大学的文科基地班在单独招生考试时,都有口试项目。这种口试对书面考试起了很好的补充作用,它能够比较有效地测出那种仅靠书面考试无法获得的信息。①
二、《课标》关于评价的新要求
评价因其独特的 “指挥棒”与导向性特点,成为人们关注的焦点。《课标》结合语文课程特点及其素质教育要求,提出了新的课程评价理念,较之以往语文教学评价体系,有以下几个转变:
1 由 “重选拔”到 “促进学生的全面发展”
以往的教学评价以学生的学业成绩为主要依据,对学生进行甄别和选拔。甄别和选拔必然造成大多数学生的学业失败,不能面向大多数学生的教育,扭曲了基础教育的性质和任务,不利于国民基本素质的整体提高。要改变这种教育现状,必须先改变与之配套的评价功能。《课标》及时提出了 “语文课程评价的目的不仅是为考察学生达到学习目标的程度,更是为了检验和改革学生的语文学习和教师的教学,改善课程设计,完善教学过程,从而有效地促进学生的发展”。甄别好坏、优劣,选拔人才,已经不是课程评价的唯一目的,了解学生学习状况,改善教师教育教学,从而促进学生的全面发展,才是语文教学评价的真正目的。
2 由 “重知识”到 “全面考察学生的语文素养”
长期以来的语文教学评价,仅以试卷测试的方式,考察学生语文知识及其阅读、鉴赏、写作等能力,学生的语文实践、创造能力培养缺失,情感体验和自尊自信的培养缺失,学生人生观、价值观的关照空白,致使部分学生高分低能或低分低能,如果考试失败,走向社会后,实践、协作、创新、生存能力极差,在校学习的所谓知识不能转化为工作能力,造成学校教育的巨大浪费。《课标》指出:“突出语文评价的整体性和综合性,要从知识与能力、过程与方法、情感态度与价值观几方面进行评价,以全面考察学生的语文素养。”语文素养是指 “学生热爱祖国语文的思想感情,能正确地理解和运用祖国语文,具有适应实际需要的识字写字能力、阅读能力,写作能力,口语交际能力。具有良好的个性、健康的审美情趣和健全的人格”。语文教学评价,不仅要考察学生知识的掌握程度,而且还要考察学生的思想品德、情感水平和人格结构,这样才能把学生的发展引到健康的轨道上来。
3 由 “重结果”到 “重过程”
以往的语文课程评价更多的是关注学生学习结果,通过学习结果的评价来反映学生学习情况和课程实施情况,以及教师的教学情况。无论教师采取什么样的教学方式,学生的学习情况怎样,各方面的能力是否得到发展,只要在考试中取得优异的成绩,就会获得好的评价。这种教学评价,只关注教学活动的结果,引起语文教学中不正常的竞争,使评价功能退化为仅仅是对学生分数的鉴定,评价的目的被严重扭曲。《课标》提出形成性评价和终结性评价相结合,但应加强形成性评价,提倡 “采用成长记录的方式,收集能够反映学生语文学习过程和结果的资料,如关于学生平时表现和兴趣潜能的记录、学生的自我反思和小结、教师和同学的评价、来自家长的信息等”。并可以组织师生通过观察、测验、作业分析、调查研究等手段搜集资料,对课程实施评价。这样,加强过程评价,避免了由结果评价所带来的不良影响。并将两者结合,相得益彰,使评价更准确、科学,更好地促进教与学。
4 由 “重量评”到 “重质评”
以往的语文教学评价以量评为主要方式。所渭量评,就是把语文教学现象简化为数量,从数量的分析与比较中推断语文教学的成效。但是,语文教育毕竟是一种丰富的生命活动,它涉及到社会生活的方方面面,其内容丰富无比,如果把学生生动活泼的个性和丰富的情感体验抽象成一组组准确精制的数字,简化为可能的几个数量,那么语文教育的复杂性和学生状况的丰富性则泯灭其中,尤其是量化下的标准答案,框定了学生思维,禁锢并扼杀了学生的创造能力,从而违背了语文教育的规律。《课标》提出应把定性评价和定量评价相结合,
更应重视定性评价。《课标》指出:“学校和教师要对学生的语文学习档案资料和考试结果进行分析,客观地描述学生语文学习的进步和不足,并提出建议。用最有代表性的事实来评价学生。对学生的日常表现,应以鼓励、表扬等积极的评价,采用激励性的评语,尽量从正面加以引导。”只有将定性评价与定量评价相结合,加强定性评价,才能使评价客观、公正,对学生真正负责。
5 评价主体由 “单一性”到 “多元性”
长期以来,教师是评价学生的唯一主体。由于教师的评价常以外部观察与主观测定为依据,且以评价学生的学习成绩为主,评价的结果不可避免地受教师的经验、水平、评价手段等因素的影响,尤其对学生的学习过程、情感态度等内部因素的评价更显出其局限性,学生作为被评价者,在评价过程中处于被动地位。《课标》打破教师在评价体系中的垄断局面,提出 “应注意教师的评价、学生的自我评价与学生间互相评价相结合。加强学生的自我评价和相互评价,还应该让家长积极参与评价活动”。这样,把语文学习的主人———学生请到评价的体系中来,让他们进行自我分析、自我解剖,相互比较、相互批评,真正做到民主平等、公正合理的评价。同时,还让家长、社会成员参与评价活动,并充分调动他们的积极性,主动参与性。评价主体的多元性,能够克服个人评价的种种局限,发挥群体优势,致使评价逐步走向合理化、科学化。①
思考题
1 高中语文教育评价的基本理念是什么?
2 高中语文教育评价的目的是什么?有哪些功能?
3 高中语文教育评价主要使用哪些方法?
①参见赵志伟 高中语文课程新探 长春:东北师范大学出版社,2004.235
①陈桂绒 课标 下语文教学评价的几个转变 当代教育论坛