当前位置: 首页 >> 高教研究信息 >> 高教理论研究 >> 正文
高等教育评估结果的使用及其规范探究
发布时间:2013-12-10    文章录入:    点击:[]

来源:《中国高等教育》  2013年第21期

近些年,关于大学排名问题引起了政府、社会和高校的关注。人们对大学排行的态度很复杂,既信又疑,既爱又恨。然而,正如有学者指出的,当前社会上形成了一股大学排行榜依赖症,某些高校办学围绕排行榜转,排行榜左右着高校的教学和研究。有的排行榜组织者片面宣传排行榜的作用,不仅以之给高校排出高低好坏座次,还利用排行榜进行市场化和商业化运作。那么,应该如何利用排行榜呢?事实上,作为高等教育评估的一种特殊形态,如何使用大学排行榜,其实质也就是如何使用评估结果的问题。应该说,当今高等教育已经进入了评估时代,评估范围之广、频次之高、类型之多可谓前所未有,评估无所不在,它已经渗透到高等教育各个领域,只要有教育活动或教育项目和计划,就会有评估,以至于出现了“评估型政府”、“评估型社会”等专有概念。因此,在这样一个评估时代,讨论评估结果的利用问题,就具有特别重要的意义。

一、高等教育评估的类型与结果

研究高等教育评估结论使用,首先需要弄清评估的类型与范围,因为不同范围和类型的评估,其目的、标准以及方法是不相同的,评估的影响与结果使用也就会存在差别。在我国,高校接受的评估数目是比较多的,这些评估,若从评估主体分,大体包括高校自我评估、政府评估和社会评估:从评估范围分,有整体评估(综合评估)、单项评估和项目评估,整体评估包括大学综合实力排名、高等教育质量评估,单项评估包括教学评估、专业认证、课程评估、高校单项实力排名等,项目评估主要指政府实施的项目或计划的评估(如优秀博士论文评估、精品课程评估等);从评估内容分,有教学评估、学科评估、科研评估、学位评估、体育评估、艺术教育评估、校园安全评估等;从评估方式分,有专家进校现场评估、数据监测以及跟踪调查;从评估等级划分,有合格评估、选优评估、质量审核等;从评估时间分,有固定周期的评估(如年度大学排名、政府或专门机构实施的若干年一次的周期性评估)、一次性评估(如精品课程评估、“211工程”评估等)、常态性信息质量监控等;从评估的作用分,有终结性评估、过程性评估、发展性评估等;从评估的自由度分,有高校自主开展的内部评估、必须接受的具有强制性的外部评估、有选择参加的外部评估(如ISO族的质量认证、国际同行评估、大学学科或专业排名)等。

不同类型的评估,有的给出明确结论,这方面又分两种。一种是定性等级式结论,如我国首轮高校教学评估中所划分的优秀、良好、合格、不合格,或者香港地区学术评审局所实施的大学教育审核评估中值得赞扬、需要改进和必须整改。工程或医学认证中的通过(但有长短不同的有效期)和不通过;另一种是分数式等级制,如英国高等教育质量保障署(QAA)实施的学科评估中采取的24分级制,英国高等学校科研质量评估(RAE)的5分制,印度、马来西亚等国实施的高校评估百分制等。有的评估则没有明确的结论,它只是一种事实、状态说明或表征,这方面以大学各种排名最为典型,无论是《美国新闻与世界报道》的排名。还是英国《泰晤士报高等教育副刊》大学排名或者我国各种大学排名,都仅仅给出大学在排行榜中的分数及其相对位置,但并不代表谁合格谁不合格,或者谁优秀谁不优秀。高低优劣完全由公众自己来判断。高校开展的过程性评价或者发展性评价,其指向于师生真实的教学生活本身,师生既是教学的参与者,又是评价主体和对象。评价的目的在于发现自身、关注自身发展和过程中的持续改进。所以,这种评估没有明确的评估结论。

二、高等教育评估结果的使用形态

高等教育评估的结果存在着规定主体和使用主体区分。所谓规定主体,即评估的政策制定者及评估的组织者,评估的目的、评估指标体系以及评估结果或用途皆由其规定,规定主体主要有政府、高校和专门机构。使用主体指利用评估结果达到自身目的的利益相关者,包括政府、社会用人部门、高校以及公众。

在各种各样的评估中,有些评估的结论具有特定目的和用途,在评估设计中便已经充分考虑和设计,因而以文件的形式加以规定。在欧洲某些国家,政府往往以高等教育评估的结果决定对大学进行财政拨款,如英国的学科评估和科研评估就是如此,学科评估结果影响政府对大学学科建设和科学研究的拨款份额。法国高等教育评估委员会组织实施的高等教育质量评估,其结果也决定和影响政府与大学之间所签订的教育与研究合同。在原合同行将结束时,委员会要对合同项目执行情况及其效果进行评估,依此决定是否继续执行合同。而政府若要与高校签订新的合同,也需要进行相应的评估(专业评估、学科评估或者科研评估)来确定。所谓合同,就是高校获得政府的项目及其经费支持,并且执行该项目以取得预期结果。美国法律规定,只有顺利通过六大区域认证机构或相应专业认证机构认证的高校才能优先得到联邦或州政府的经费资助,包括学生的奖学金和助学金。我国1996年—1999年实施的“普通高等学校本科教学工作优秀评估”,其本来目的是配合国家“211工程”计划。因为该计划要求,凡是准备申请加入“211工程”重点建设资助的高校,必须接受优秀评估并且通过。即获得优秀结论,否则就将失去进入国家重点建设行列的资格。我国有些省份也规定。学校升格(如专科升本科)、改名(如学院改大学)、发展研究生教育、各种奖励、预算外拨款等等,也需要在相应的评估中获得相应的等级。这些说明,评估是一道准入门槛。当然,有的评估也规定了奖惩式的使用规则。如我国高校教学工作评估就规定:对在评估中未获得“合格”或者“不通过”结论的高校,不仅要限期进行整改,而且还要在招生规模、新专业设置、质量工程项目审批、教学成果评奖等方面加以限制。至于大学排名,则没有相应的结果使用方面的规定。

通过上述分析,我们发现,不同的评估,在结果使用上存在明显差别。有的评估明文规定结果的用途及使用范围,有的评估没有给出明确规定。但事实上,凡是评估,都有结果的使用问题,只是程度或方式不同而已。

1.正式使用与非正式使用

凡是在评估方案中明确宣示评估结果用于某种特定目的的,就是评估结论的正式使用,反之,则属于非正式使用。一般情况下,官方机构或者具有官方背景的专门评估机构以及基金会组织实施的评估,结论往往非常明确,结果的使用目的也有明确指向。这种情况下,评估结果通常用于选择性、竞争性或者非均衡性的政策,比如经费拨付、学校或专业设置、学位授予、项目资助、计划实施、评审奖励等。评估及其结果使用是有条件的,需要以评估及其结果作为资源分配的依据。前面所列举的英法美等国家实施的评估即如此,我国的“985工程”、“211工程”计划评估、高校教学质量工程项目评估、“2011计划”评估、学校升格或改制评估等等,也是这样。

评估结果的非正式使用有两方面含义。既指某一种评估并没有明确的结果,因此也就不存在结果的正式使用;又指虽然有评估结果,但是评估组织者并没有明确规定结果应该如何使用,或者对于这种评估结果应该如何利用,权利不在评估组织者,而在于被评部门、单位或个人。通常情况下,评估结果的非正式使用往往比正式使用的范围宽。各种各样的高校排名、高校内部开展的教师互评、学生互评、师生互评等自我评价活动,就没有明确的结论使用说明,如何利用则取决于使用者和公众自身。比如高校排名,社会公众可能用于了解信息、高校志愿填报、研究生专业报考或者企事业单位用于录用高校毕业生参考,然而,这些并非出于排名者的直接意图以及对结果使用的直接规定。

2.实质使用与形式使用

实质使用,就是评估结果总是指向于某种实际用处。如物质奖励、经费获得、项目支持、政策倾斜等等。形式使用,就是评估结果使用不是可见的物质方面,而是指向声望、名誉、发展、自我实现等精神层面。关于前者,在不同的评估中都有不同的表现。例如,学生评教(即学生评价教师的教学工作)是高校内部评估中很普遍的一种形式。不少高校学生评教结果与教师职称晋升、福利分配、评选优秀等挂钩,同样,高校教学、科研和行政人员的津贴、资金、福利、职务晋升、住房等资源性分配,也会与内部工作绩效评估结果直接挂钩。在这一意义上,评估是资源分配的手段。关于后者,也普遍存在,某些评估或评价的目的与物质利益并没有直接的关联,其目的指向于主体精神发展和素质提高的内在需求。例如高校内部自我评估中的学生互评、教师互评、外校同行评价以及具有评估性质的教学状况调查等。在这种真实性的评估中,双方通过参与评价,获得关于自身和对方的认知,了解自己与他人的特点所在,互相学习、分享经验,促进自身的发展和成长。发展性或者过程性评价的结果使用,就是形式上的使用方式。

3.直接使用与间接使用

直接使用,是评估工作所产生的结果直接用于某种特定的目的,一般情况下,它由评估政策、评估方案直接规定出来,例如。一些国家在评估文件中有正式规定和表述,如评估与拨款条件、学位授予、奖励、项目支持或者惩罚性措施。间接使用,有两层含义,一是评估结果直接使用后所产生的附带性影响,如质量、声誉的影响以及由此导致的招生、社会资源等方面的影响;二是评估并未明文要求结果如何使用,但它却对被评估者以及利益相关人产生了影响,如大学排行榜或大学声誉调查、毕业生跟踪调查,任何一个排行榜或调研报告,对社会公众而言,通过排名或报告可以对国内外各高校的总体情况和相关方面的情况有比较直观、明晰的了解,在选择高校及专业的时候可以以此为参考。对政府部门而言,大学排名或报告从一个侧面反映了国内高校的有关情况,可能会为政府的宏观调控和决策提供依据。对高校自身而言,通过与其他学校对比,可以了解自身的优势和不足,促使学校完善自身,更好地提高教育质量和办学效益。这说明,虽然是间接使用,其评估的导向性也是明显的。

4.平行使用与交叉使用

不同的评估相互之间存在着较复杂的关联,这种关联有时可能是正向的,有时可能是负向的。因此,不同的评估,在其结果的使用上,一般情况下有着明确的规定和条件限定。有的评估之间存在着互相说明和佐证的关系。因此,在结果的利用上承认对方评估的效用。如台湾地区高校的系所评鉴与专业认证就是如此,如果某一学校的某一专业已经参加了行政部门认可的认证工作,那么在该学校所接受的系所评鉴中,那些经过前期认证的专业可以免评,其过程、结论及其结果使用等均被认可。这种情况在其他国家和地区的评估中也不少。我们把这种相互承认并相互印证支持的评估,叫做交叉使用。

不过,更多的是各种评估及其结论之间的并行关系。它们并不相互支持和利用,各行其是,互不干预,我国目前的许多评估就属于此种情形。比如,针对大学排行榜可能给高校带来的影响,政府就明确指出,政府不会依靠排行榜的排名来决定高等教育资源分配及制定相关政策,不仅如此,政府还曾一度拟取消大学排行榜,认为它扰乱了高等教育秩序。只是近些年来,随着高等教育大众化、社会化以及国际化进程的加快。政府才不再宣称取缔,虽不明确反对,但绝不支持。政府开展的各项评估,从来不会考虑社会上大学排行榜的数据、指标和名次。同样,政府间的科研评估、教学评估、就业评价、素质教育评估、体育艺术评价等,也是独立进行的。不会出现某一种评估在先,其他评估就可以承认此评估进而免除该项目的评估情况。究其原因,是这些评估出自不同的行政部门,其间不交叉,但确实有重复评估和增加学校评估负担的问题。

三、当前高等教育评估结果使用中的问题及其规范化

不论是什么样的评估,都可能影响高等学校的声誉、资源、质量和发展,因此影响到学校的教育、教学和研究等工作,因此。在当今所谓的评估化时代,去除评估几乎是不可能的,世界各国都在强化而不是弱化评估。评估的影响和作用很大,其结果的使用也须认真研究和对待。

1.评估结果使用中的问题

评估结果使用中最易出现的问题,主要有两方面:一是过度使用,二是不当使用。

过度使用,是对评估结果的使用超越了评估实际所能发挥的作用范围。将评估的结论与某些政策直接挂钩本无可厚非,因为评估本身是实现目标的手段,为了达到某一特定目的,需要通过评估这一形式。运用得好,会取得令人满意的效果,但若运用不好,不仅无法正确发挥评估机制效能,甚至适得其反,将会带来消极后果。当前,有的高校及部门过分迷信和依赖评估,将评估视为万能工具,什么任务不好推进、什么工作不好开展,就企图通过开展相应的评估来驱动。造成评估项目过多、形式过滥、评估负载过重,影响学校正常教育教学工作秩序,影响评估声誉。对此,高校反映比较强烈。纷纷建议取消那些不合理的评估。所谓不合理,即本来可以被其他评估形式所覆盖或替代的评估。没有存在的必要,但某些单位和部门却出于本位主义考虑,设立相应的评估。另外,政府评估文件、评估方案中对评估结果已经有明确规定的,有些部门或单位却超出规定范围任意使用,附加了文件中所没有的内容,造成评估结果使用中层层加码现象。比如,高校首轮教学工作水平评估,评估方案只规定了评估结果分为“优秀、良好、合格与不合格”四个等级,其中对于结论为不合格的高校,规定限期整改,两年后复评。如复评还达不到合格标准。将在招生、项目评审、新专业设置等方面采取限制性措施。然而,有的地方教育行政部门,却把在评估中获得不同结论的高校进行二次排名。甚至对相应的二级指标和观测点专家打分情况进行排名。优秀的给予表扬、奖励、增加资源;而在高校内部,对教学评估结论更是高度重视,对于在评估中工作做得好、有可能为评估加分的二级单位或个人,进行不同程度的奖励,有的还可能获得职务提升,而对于可能带来不利影响的部门、工作或个人,则采取惩罚手段。由此导致高校在评估结果上的攀比,最终影响评估形象、质量,首轮评估中部分学校出现的形式主义、弄虚作假以及兴师动众,大学排名中出现的营私舞弊等,都可以说是评估结果过度使用造成的。

评估结果的过度使用肯定会出现不当使用,但不当使用不一定是过度使用。评估结果使用怎样才是合理的、正当的,需要认真研究。一般地说,只要在评估功能范围内的使用,都应该是合理和正当的,超功能使用则带来不合理和不正当。

不当使用,就是没有把评估结果应用到恰当的地方或时机,或者应该使用而没有使用。当前许多评估工作,结果都存在不当使用的问题。比如,大学排名。本来可以增强高等教育利益相关者对高校办学、教育教学等信息的了解,它仅仅是提供了一种认知工具和参照。但是,有的高校却唯大学排名是从,为了能够排名靠前,根据排名指标而决定办学目标和选择重点工作,这就偏离了办学方向。同样,社会也过分依赖排行名次来决定高考志愿以及专业选择。政府已经指出,不依据大学排行榜决定资源分配和项目支持,这是非常理性的,尽管政府的评估与排名完全平行也有其不合理的一面,但在这一点上,却表现出它的正当性。还有,各种评估过程和评估结果,都有改进教育教学工作的价值,可是,人们往往忘记了过程改进本身的意义,从而放弃了评估改进教育教学的功用,而去追求评估直接的名誉、地位、经济功效等外在功能。各种因评估而设立的奖励、项目等等。在某种意义上背离了评估结果使用原本的宗旨。我们看到,当前,一些评估本义是改进教育教学,提高教育教学质量的,然而。评估已经几个轮次过去,教学还是那种教学、观念还是那种观念。几乎没有发生变化。之所以如此,就在于评估结果未能得到正当使用,缺乏反思、改进、提升的环节,内在的需要没有得到扩张,外在的功利需求却大行其道。

2.实现高等教育评估结果使用的合理化与规范化

由于评估影响高等教育利益相关者的利益,因此造成了评估结果的各种不当使用和过度使用。评估要想发挥正确的导向作用,必须首先规范评估结果使用范围、使用方式及其使用边界。

科学设计评估指标体系。不同的评估有不同的目标,不同的目标有不同的方案和指标体系。因此。任何一种评估及其评估方案、指标体系,都应该为其目标服务。比如,高校教学评估,其目的是以评促建、以评促管、以评促改,提高质量。质量是目的,建、管、改是内容。因此,评估方案和指标体系的设计,必须围绕建、管、改和质量做文章。否则,就会引起评估的偏差和结果的不当使用。所以。教学评估,要有边界意识,不能将教学评估的边界无限扩大。有的教育行政部门希望在教学评估中加进非教学工作的内容,以期实现相关目标,如共青团工作、社群工作、就业工作等,就有不合理之处。而大学排行榜指标体系设计欠缺更为明显,在排行榜指标赋值中,把大量精力放在一所学校的财富、声誉和研究项目等外延性指标上,而对学习方法和有效教学等内涵性指标关注太少。这说明,评估方案和指标体系设计的科学化具有根本性、本源性的地位与作用,优化评估方案和指标系统是评估结果发挥作用的前提。

减少评估结果使用上的功利行为。现在不少评估工作,设计者为了实现预期目标,如通过评估促进建设和发展,或者引起被评估者对评估工作的高度重视,以便顺利实施和推进评估,往往在评估结果的使用上下功夫,把评估结果与相关利益直接或间接挂钩。这种做法表面上确实能够实现设计者或组织者的意愿,但如果某一项评估过分与现实的功利目标相连,就会使评估走向事与愿违的地步。目前的一些评估,结果使用上可操纵的东西不是少,而是太多;不是轻,而是太重了,应该给评估减负降压。与其通过结果无限使用达到目标,不如更少功利地利用评估的自然影响。越是往评估身上加压,评估就越偏离,越容易出现形式主义。我们看到,欧美一些国家尽管在拨款上引入了绩效评估,但绩效评估结果影响拨款的范围和比例是相当有限的。一般不超过总费用的10%,且只涉及到发展性或竞争性的拨款,如科研合同项目的拨款、某些尖端项目的拨款等等,根本不影响高校日常教育教学支出的拨款。也就是说,高校基本资源的分配。原则上并不通过评估实现,这就从根本上保证了教育资源分配的基本公平和均衡。日本大学学位授予机构实施的院校评估,其结果也影响学位授予甚至拨款项目,但评估中很少有学校不通过的情形,是因为日本政府和评估机构在评估结果使用上采取了相当稳健、谨慎的态度,使得评估越来越柔性化。我国也有学者建议评估不要与过多的利益挂钩,以免过分强化评估,使评估走向机械管理主义,同时也免除对高校自主办学和创造性办学的损害,这不失为好的办法。

【作者简介:刘振天  教育部高等教育教学评估中心】