导师立德树人成效评价的两难困境及破解之道
毛金德
摘要:“不评价,无动力;一评价,唯指标”的两难困境使导师立德树人成效评价陷入了“上热下冷”的尴尬处境。从表面看,两难困境是由于评价工具的信效度不足所致,实则是评价指挥棒迷思下目标与手段错位。评价指挥棒迷思强调通过评价手段来实现动力激发的目标,结果不仅难以真正激发导师立德树人的内在动力,也制约着评价工具的信效度。破解之道在于走出评价指挥棒迷思,将目标与手段分离,打破评价–动力的路径依赖;其次,通过教育督导等多种管理手段解决导师立德树人动力问题,通过人工智能等现代数智技术提高评价工具的信效度。
关键词:导师评价;立德树人;两难困境;督导评价
作者简介:毛金德,汕头大学高等教育研究所副教授,汕头 515063。
一、导师立德树人评价的尴尬处境:上热下冷
近年来,关于导师立德树人成效或职责评价的政策文件频出,显示出党和国家对立德树人事业的高度重视和关切。为了扭转研究生教育中重科研轻育人的不良倾向,激发导师立德树人的积极性,各研究生培养单位制定了导师立德树人职责及成效评价相关文件,将导师立德树人职责落实情况和成效作为职称评定、职务晋升、绩效分配、评优评先的重要依据。表面看,导师立德树人评价相关政策热度非常高,但实际来看,可能是“虚热”的表现。虽然各校文件中均有“将导师立德树人成效作为岗位聘用、绩效考核、职务晋升等工作的重要依据”等类似规定,但对于考核结果的使用表述较为模糊,缺乏具体实施细则。
与政策文件层面的“高热”相比,导师评价在实践执行层面却频频“遇冷”。通过对高校导师、研究生院领导的访谈,发现在实践中导师立德树人评价对导师并未产生实质性影响。在导师评价实践中,导师科研成果依然是主要乃至唯一评价标准。这说明,在实践中导师立德树人评价并未能产生政策预期效果。这一结论也得到了相关研究的支持[1]。由于导师立德树人效果难以测评,多数研究生培养单位没有建立考核制度而是以导师遴选制度替代,即使有考核也存在奖惩不力等问题[2]。曹洪军等认为,目前研究生导师立德树人考评工作不力,严重影响了导师立德树人功能的发挥,提出注重考评结果的奖惩运用[3]。
从政府政策“高热”再到高校规章“虚热”,再到实践“遇冷”,导师立德树人评价陷入“上热下冷”的尴尬处境[4]。本文认为,导师立德树人评价之所以存在上热下冷现象主要是因为评价的背后存在着两难困境,无论是否对导师立德树人成效进行考核评价,都难以真正解决问题。
二、两难困境的现实表征:不评价,无动力;一评价,唯指标
所谓两难困境是指,如果不对导师立德树人成效进行考核评价,则难以激发导师立德树人的动力,难以扭转重科研轻育人不良倾向;而一旦对导师立德树人成效进行考核评价,则又容易形成唯客观指标倾向,陷入“五唯”窠臼。概言之,不评价,无动力;一评价,唯指标②。所以,对于高校而言,合理的行动策略便是规章“热处理”,执行“冷处理”,最终导致了上热下冷的局面。
(一)两难困境之一:不评价,无动力
研究生教育场域是学术场域和教育场域的交集[5],天然具有重科研、轻育人的内在基因。学术场域从事的是高深知识生产活动,遵循的是学术逻辑,其根本任务是无条件追求真理。教育场域从事的是培养人的活动,遵循的是人的发展逻辑,其根本目标是促进人的全面发展。知识生产与人才培养本是两种截然不同的活动,但在洪堡“由科学而达致修养”理念下学术逻辑与教育逻辑通过“教学与研究相结合”实现了融合[6]。然而这两种逻辑的内在张力始终存在,这也为后来“科研的漂移”和“教学的漂移”埋下了种子[7]。所以,自现代研究教育诞生以来,内部始终存在着重视知识生产,忽视立德树人的内在冲动。
此外,高校“以科研论英雄”的评价倾向为导师重科研轻育人注入了“催化剂”。目前高校教师评价过于强调论文、项目,牵制了导师的时间和精力分配。即使导师立德树人积极性很高,也不得不优先考虑利益攸关的考核评价。加之以量化考核为主的“非升即走”制度,使得导师面临愈来愈大的压力[8],在一定程度上加剧了导学关系异化[9]。在科研考核压力下,部分导师不顾及学生的兴趣和能力,把自己的研究项目或者项目的一部分作为研究生的学位论文题目,把完成课题和项目作为首要目标[10],过分看重研究生的科研产出,加剧了导师重科研轻育人、重使用轻培养的倾向[11],忽视了导师立德树人职责的落实[12]。 在这样的背景下,如果立德树人工作没有纳入考核评价范畴,自然难以调动导师的积极性。
(二)两难困境之二:一评价,唯指标
教育评价的指挥棒功能要求明晰的绩效指向,才能发挥导向作用[13]。因此,在评价指挥棒视域下,评价的丰富内涵被窄化为考核,陷入“评价即考核”的思维定式。由于考核评价要求具备公平性、可比性、客观性、可操作性,一旦将导师立德树人成效纳入考核评价范围,立德树人成效中那些能够量化的、可测量的指标往往被重视,而那些重要但难以观测和量化的指标往往因为捉摸不定而悬置,因偏主观而被排除,因难测评而遭放弃[14]。
目前导师评价大多以指标体系 量化评分的形式呈现。由于科研成效更易于评价,因此,指标体系通常以科研成果评价为主,且主要以硬性指标为评价依据,忽视价值观念、学术伦理、人格养成、品德塑造等软指标的考核评价,未能体现导师立德树人工作的重点。即使部分评价指标覆盖了导师立德树人职责的各个方面,体现出立德树人全方面、全过程、多主体的特点,但往往只能细化至二级指标,一定程度上降低了可操作性。部分评价体系虽然提出了可操作性指标,但往往将指标具体细化至导师和学生发表论文、获得课题等成果的数量及层次等,虽然评价指标更精细,但依然未能跳出“唯指标”的窠臼。
因此,一旦将立德树人成效纳入考核评价,由于立德树人工作的极端重要性,可能会形成“唯立德树人指标”的倾向。结果导致导师被迫去“卷”各种立德树人成效的客观指标(如学生论文发表、竞赛获奖等级数量等),而忽视了真正的育人工作,形成“唯指标”的不良倾向。
三、两难困境的再审视:指挥棒迷思下目标与手段错位
“不评价,无动力;一评价,唯指标”的两难困境一直困扰着导师立德树人评价。长期以来,提高评价工具的信效度被认为是解决导师立德树人成效评价的关键。学界围绕评价指标体系和方法开展了大量研究,但依旧难以跳出“五唯”的窠臼。然而,深入分析发现,两难困境看似无解,实则经不起推敲。两难困境背后隐藏着一个未经审视的前置性问题:为什么要通过评价的方式解决导师立德树人的动力问题?需要进一步追问的是,为什么一遇到动力问题,就习惯性想着通过评价来解决?除了评价,难道就没有别的手段来解决动力问题吗?目前,虽然高校“唯科研”的不良评价导向的确制约着导师立德树人的积极性,然而,解决问题的思路难道不应该是解除这些限制,为导师松绑,给导师更多的育人自主空间吗?而不是相反,试图将立德树人成效纳入考核来解决动力问题。通过将导师立德树人成效纳入考核并不能真正解决动力问题,就如同通过增加考试科目的方式解决不了应试教育问题一样。两难困境从表面看是评价工具难以全面准确地评价导师立德树人成效,实则是在评价指挥棒迷思下目标与手段的错位所致。
(一)指挥棒迷思及其渊源
评价指挥棒迷思在我国具有深厚的历史渊源。我国研究生教育主要走的是后发外生型发展路径,政府政策驱动对于我国研究生教育高速发展起到了巨大推动作用。从1999年到2023年,我国在学研究生人数增长15倍以上。这种由外部政策驱动的研究生教育发展模式在极大推动研究生教育超常规发展的同时,也一定程度抑制了研究生教育发展的内生动力。外部驱动发展模式严重依赖“指挥棒”的指挥,在规模扩张阶段,发挥着重要作用。进入高质量发展阶段,这种主要由外部驱动的模式的缺陷日益凸显。
长期以来,受指评价挥棒迷思的影响,形成了一旦涉及动力问题,便想到通过评价指挥棒来解决的思维惯性,形成了对评价–动力的路径依赖。评价指挥棒成为解决各种动力不足的“灵丹妙药”——哪里缺乏动力就评哪里。当导师缺乏立德树人动力时,管理者习惯性想到通过评价指挥棒激发动力,这导致了评价目标与手段的错位。
评价指挥棒迷思过度迷恋评价的指挥棒功能,一遇到动力和积极性问题,就习惯性用评价指挥棒来解决。评价的指挥棒功能有着严格的适用条件和使用限度,滥用、误用或过度使用评价的指挥棒功能将损害立德树人事业。
(二)评价指挥棒的适用条件及其限度
评价是激发动力的常见手段,被广泛运用于各类管理活动中。评价作为一种价值判断活动,本身并无动力激发功能。评价的动力激发功能并不取决于评价本身,而在于评价结果的使用。当评价结果与评价对象的切身利益挂钩,成为评价对象行动的指挥棒时,评价便有了动力激发功能。评价作为指挥棒的隐喻通常有两层含义:第一,指挥棒意味着指明行动方向及路径;第二,指挥棒意味着具有一定的强制性,通过奖惩问责使行动者必须按照指示方向行动。在教育评价实践中,发挥指挥棒功能的评价常见形式主要有量化评比、绩效考核等。指挥棒型评价在评价类型上属于结果评价,在评价方式上以量化评价为主,其背后遵循的是问责逻辑。
教育评价事关教育发展,是教育改革的关键领域和实现教育高质量发展的重要抓手[15]。但能否实现教育高质量发展,关键取决于教育评价这一“抓手”怎么使用,怎样“抓”。教育评价是一把“双刃剑”,既有激励、改进、提升等正向功用,也有导致工具化、功利化、趋同化等负向功能[16]。作为指挥棒的教育评价,要发挥正向功能,需具备以下两个条件:第一,评价结果对评价对象具有约束力。第二,具有明确的质量标准,评价工具客观、准确、公平,评价结果具有可比性。只有同时具备这两个条件,才能充分发挥评价指挥棒的积极功能,否则可能适得其反。
对于导师立德树人成效评价而言,第一个条件很容易实现,只要将评价结果与导师职称晋升、绩效考核等切身利益挂钩即可,但第二个条件则很难达到。立德树人工作从本质上来说“是一种道德实践而不是技术或工艺实践”[17],缺乏客观的质量标准。导师立德树人活动具有个体性、自主性、专业性、创新性等[18],立德树人效果不仅表现为外显、即时的状态,更具有潜隐性、迟滞性、协同性等特征,难以实现精确测量[13]。教育实践是一项非常复杂的活动,横跨自然世界、社会世界和人文世界等“三个世界”[19]。评价指挥棒只能作用于教育中的自然世界和部分社会世界,但对于人文世界,则超越了其本来限度。换言之,指挥棒评价对于评价对象的客观属性具有适用性,因为人的客观属性具有可测性和可量化性。例如,在研究生导师立德树人效果的评价上,研究生的身体素质(体能、运动技能等)、基础知识掌握情况、研究方法与技能等比较容易测评,但研究生的品德、态度、修养、价值观等人文方面的成长,指挥棒评价则“鞭长莫及”。
(三)滥用评价指挥棒的危害
不考虑导师立德树人工作的特点,动辄通过对导师立德树人成效进行考核评价来调动导师的积极性,属于对评价指挥棒的误用和滥用。过度使用评价的指挥棒功能容易造成指挥棒效应的异化,造成教育评价的价值悖论和身份危机[20]。在导师立德树人成效评价过程中,滥用或过度使用评价的指挥棒功能容易导致以下问题。
1.使立德树人评价陷入“测评悖论”
评价的指挥棒导向使得“测量范式”成为导师立德树人成效评价的主导范式。测量范式的假设是,凡是存在的事物都有其数量,凡是有其数量的事物都可以测量[21]。测量范式作为一种评价范式,本身并没有问题。但当测量范式与指挥棒功能相互嵌套时,便形成了“测评悖论”:可以测量的事物未必是重要的,重要的事物未必可以测量,但可以测量的事物在实践中往往成为事实上的重要事物,而不能测量的事物则在实践中变得不重要。概言之,可测的未必重要,重要的未必可测,但可测的更被重视,不可测的则被忽视。
立德树人成效主要表现为研究生道德品质、人格特质、职业伦理、价值观念、创新能力以及理论素养等方面。然而,这些特征虽然非常重要却又难以直接测量。因此,在指挥棒评价中立德树人往往沦为“理论上重要,实际上不重视”的工作。所以,在导师立德树人评价过程中,指挥棒功能的过度使用不仅加剧了“唯指标”的倾向,更大的危害在于可能使真正的立德树人工作在事实上变得无足轻重。评价指挥棒的质量问责有可能不是真正对质量负责,而是对质量标准负责,陷入“质量危机”,在追求质量指标的过程中最终背离了质量内涵,造成评价的“浮华与贫困”[22]。
2.弱化导师立德树人内部动力
评价指挥棒虽然能够提高导师立德树人外部动力,但这种动力对于立德树人工作而言未必是好事。立德树人本是导师的本职工作,过度强调评价的指挥棒功能,容易引发导师对立德树人客观指标的追逐,反而可能弱化导师立德树人的内部动力。根据动机理论,当外部动机被强化时,容易弱化内部动机[23]。导师立德树人积极性可能由内部动机驱动或者外部动机驱动。但立德树人工作是一份良心事业,只有内在动机才能为导师高质量立德树人提供持续动力。对于导师来说,内部动力比外部压力具有更大的激励作用。导师立德树人主要由自我激励,外部压力可以迫使他们达到最低的标准,但很难使他们达卓越水平[24]。导师高质量立德树人必须依靠充分发挥导师自主性来开展。相关研究表明,基于问责奖惩逻辑的导师评价并未对导师立德树人内在动力产生激励作用[25]。
3.导致立德树人成效“测不准”
如何准确测量和评价导师立德树人成效一直是导师评价的热点、重点和难点。构建科学合理的评价指标和测评工具被认为是导师评价的关键[26]。学界围绕立德树人成效的表现、立德树人工作的特征、政府关于立德树人的政策文件等,设计了一系列评价指标体系[27-29]。这些指标体系看似科学、全面,但在评价实践中要么缺乏可操作性,要么陷入“唯指标”的窠臼。相关研究和实践均表明,出于可操作性考虑的指标设置其评价结果并不能真实反映导师立德树人的实际情况[30]。尽管学界在完善立德树人测评工具上进行了很多探索,但依旧难以提高评价的信效度。在评价指挥棒迷思下,导师立德树人成效陷入“测不准”困境。
“测不准”的根源之一在于对“硬指标”的执迷。评价指挥棒主导的量化评价范式导致评价内容偏向立德树人成效中量的属性,而对于缺乏客观标准的质的属性不够重视。立德树人工作极其复杂,且导师绝大部分工作成效难以量化,导致量化评价表面精确其实模糊[31]。人们已经意识到量化评价对于立德树人事业的不良影响,并对此展开了一系列批判[32]。然而,在绩效指挥棒下,又演变成对量化指标的追求,即使那些人文性、精神性的特质最终也被迫“浓缩”到一串串数字里。立德树人成效中量的属性被无限放大,更为根本也更为隐蔽的质的属性因其难以观测和比较而被舍弃,使得评价结果无法完整表征导师立德树人的真实成效。
“测不准”的根源之二在于评价指挥棒的问责逻辑导致评价信息存在失真风险。在立德树人成效评价中,无论是硬指标,还是软指标,只有处于自然状态下才能用来表征立德树人的真实成效。评价一旦与导师利益挂钩,很容易使得所观测指标受到“污染”,失去表征质量内涵的价值。原本能够获取的真实评价信息由于问责逻辑的介入变得失真,甚至催生造假现象。例如,研究生发表论文数量与层次、研究生获得的奖励与级别等指标一定程度上能够表征导师立德树人成效。而一旦将这些指标纳入考核,就可能存在为了取得好的考核成绩而刻意追求各种立德树人显性指标的倾向,使得质量指标脱离了质量内涵,降低了评价的信效度。
四、破解之道:走出评价指挥棒迷思
目前,导师立德树人评价主要存在两大关键问题:第一,导师立德树人动力问题;第二,评价工具本身的信效度问题。在评价指挥棒迷思下,这两大关键问题陷入无解困境。破解之道在于,首先,要走出评价指挥棒迷思,重新审视导师评价理念,全面准确认识导师评价的丰富内涵与功能。其次,在打破评价–动力路径依赖的基础上,综合运用教育督导等多种管理手段提高导师立德树人动力,充分运用人工智能等数智工具提高评价的信效度。
(一)导师评价理念重审:从“指挥棒”到“导航仪”
教育评价是衡量教育活动达到教育目标程度的一种活动,具有“导航仪”和“指挥棒”的双重功能。在评价指挥棒迷思下,评价的指挥棒功能被无限放大,而评价作为“导航仪”的功能一直被忽视。要走出评价指挥棒迷思,需要重新认识导师立德树人评价的多重属性,回归评价作为导航仪的本体价值。应确立发展性评价理念,导师评价的目的是促进教师发展,而不是惩罚或者奖励教师。与指挥棒不同,作为导航仪的导师评价不涉及动力,只提供方向和路径信息,主要通过收集导师立德树人成效的各种质和量的属性,为导师更好立德树人提供信息基础和改进依据。
(二)非必要不考核:打破评价–动力路径依赖
考核评价属于评价的一种类型,是评价的下位概念,但在评价指挥棒迷思中,评价被窄化为考核评价。应经坚持“非必要不考核”原则,严格限制对导师考核评价的范围和效率,给导师营造宽松的育人空间[33]。所谓非必要不考核是指,如果没有可靠的证明表明某项考核或将某一指标纳入考核是解决该问题的最佳方案,且考核的正功能大于负功能,则不应进行考核。在考核性评价中,行政管理者具有举证义务。例如,当管理者准备将导师的项目、论文、课题经费等指标纳入考核范围时,管理者需要拿出充分的证据表明将这些指标纳入考核能够真正促进导师落实立德树人根本任务,且考核的正功能要大于负功能,而不是为了防范个别问题导师或问题行为就将考核扩展到全部导师,不能“一人生病,全家吃药”。
坚持非必要不考核,有利于打破评价–动力路径依赖,为实现导师评价的发展性功能奠定基础,同时也有助于提高导师评价的信效度。因为没有了考核问责的束缚,在评价过程中更容易对不可量化却又十分重要的指标进行观测和评价,也更容易获得真实的信息,进而提高评价的信度和效度。
(三)综合运用教育督导等管理手段提升导师立德树人动力
动力问题是研究生教育治理中的关键问题。除了考核评价,还可以充分运用教育督导等管理措施解决导师立德树人动力问题。督导是非常重要的研究生教育管理手段。督导是相关部门是根据国家教育法律法规和方针政策,运用行政权力对导师立德树人工作进行价值判断的过程[34]。应充分发挥教育督导的发展性、诊断性功能,打通立德树人事业的“最后一公里”[35]。
通过督导来解决导师动力问题与通过考核评价解决动力问题有着本质不同。考核评价是针对每一个导师,考核结果与导师切身利益挂钩,背后遵循的是问责逻辑。督导则不同。首先,督导队伍由专业人员组成,督导评价比考核评价更专业,评价信息更全面准确。督导不仅要考察量化的指标,给导师和学校打分,更要对学校整体立德树人改革方面的举措做出定性的评价[36]。其次,督导评价结果通常不针对导师个人,而是对导师立德树人工作做出诊断,为提升导师立德树人质量提供决策参考。在督导结果的运用方面,应通过完善报告、反馈、整改、复查、激励、约谈、通报、问责等手段解决导师立德树人动力问题,杜绝导师问题行为,坚决将问题导师清除出导师队伍。
目前导师对教育督导工作价值的认识还存在偏差。如部分导师认为督导就是对教师个人教育教学行为的监视,对督导工作存在天然的心理反感和抵触情绪。当然,这也跟目前督导工作专业性不强,重监督、轻指导有关[37]。因此还要改进督导方式,从经验型督导向研究型督导转型[38],强化督导评价的专业性与权威性。
(四)充分运用人工智能等数智技术提高立德树人评价的信效度
一旦跳出指挥棒迷思,将评价与指挥棒剥离之后,立德树人成效评价中的“测不准”问题就将迎刃而解。在指挥棒评价中无法纳入考核的软指标也没有了失真风险。随着大数据、人工智能等现代信息技术的发展,教育评价的信息获取的手段、方式也变得日益多元。这为全面、准确评价导师立德树人成效提供了良好的技术支持。第一,要充分利用大数据等信息技术,全面准确记录研究生学习、科研以及成长信息,为每一个研究生建立个性化、电子化的成长档案袋。建立基于成长档案袋的评价机制,精准分析每位研究生的成长情况,为研究生自我改进提供参照,也为导师改进育人策略提供参考。第二,研发基于人工智能平台的评价工具。充分运用现代信息技术,可以使导师立德树人工作中的人文属性评价更加准确,实现导师评价的科学性和人文性的统一[39]。通过学生自评、导师自评、师生互评、雇主评价以及同行评价等多种评价方式综合研判导师立德树人的成效、问题,为导师改进立德树人方法,调整立德树人策略提供指导。为了保证评价信息的全面性、准确性和真实性,评价信息及结果应保密,只对相关人员开放,最大限度缓解师生的评价焦虑。评价结果只用于诊断、改进、提高,不作为问责奖惩依据。
参考文献
[1] 郑龙章. 研究生导师评价标准优化设定的思考——基于“立德树人”的考量[J]. 中国高校科技, 2020(10): 21-24.
[2] 李彬, 谢水波, 蒋淑媛. 立德树人视野下高校研究生导师评价体系存在的问题及对策[J]. 教育现代化, 2019, 6(63): 149-153.
[3] 曹洪军, 王娜. 促进研究生导师“立德树人”考评工作的四重维度[J]. 思想政治教育研究, 2017, 33(1): 139-143.
[4] 李元元. 加快构建立德树人体系[N]. 光明日报. 2022-07-12.
[5] 毛金德, 马凤岐. 研究生教育场域: 概念与框架[J]. 高教探索, 2015(10): 29-33.
[6] 陈洪捷.德国古典大学观及其对中国的影响[M]. 北京: 北京大学出版社, 2002: 29-30.
[7] 克拉克. 探究的场所——现代大学的科研和研究生教育[M]. 王承绪, 译. 杭州: 浙江教育出版社, 2001: 221-223.
[8] 田贤鹏, 姜淑杰. 为何而焦虑: 高校青年教师职业焦虑调查研究——基于“非升即走”政策的背景[J]. 高教探索, 2022(3): 39-44,87.
[9] 翟翌, 范奇. “非升即走”背景下支配型导学关系的异化与复归[J]. 学位与研究生教育, 2022(4): 35-42.
[10] 曹淑江. 社会科学类专业研究生导师应该如何指导硕士学位论文[J]. 学位与研究生教育, 2014(6): 20-22.
[11] 刘继安, 徐艳茹. 当前我国科教融合育人的问题与对策[J]. 中国高教研究, 2024(9): 69-74.
[12] 申超, 赵晓雁. 英语世界中的“导师”概念及其职责辨析——兼论中西方“导师”用语及其职责的差别与当代启示[J]. 现代大学教育, 2022, 38(2): 42-49.
[13] 刘志, 刘健康, 许畅. 研究生导师立德树人评价需要平衡三对矛盾冲突[J]. 学位与研究生教育, 2019(4): 8-12.
[14] 刘磊明. 国际大规模教育评价的逻辑反思[J]. 教育研究, 2020, 41(1): 75-85.
[15] 俞昊, 冯修猛, 陈晓双, 等. 回归育人本源, 落实立德树人——谈研究生教育评价改革方向[J]. 上海教育评估研究, 2021, 10(1): 17-20.
[16] 刘振天, 罗晶. 高等教育评价“双刃剑”: 何以兴利除弊[J]. 大学教育科学, 2021(1): 4-12.
[17] 比斯塔. 测量时代的好教育: 伦理、政治和民主的维度[M]. 张立平, 韩亚菲, 译. 北京: 北京师范大学出版社, 2019: 36.
[18] 李立国, 赵阔, 王传毅, 等. 超越“五唯”: 新时代高等教育评价的忧思与展望(笔谈)[J]. 大学教育科学, 2020(6): 4-15.
[19] 毛金德. 我们需要什么样的教育学[J]. 教育学报, 2016, 12(1): 21-28.
[20] 李鹏. 评价改革是解决教育问题的“钥匙”吗?——从教育评价的“指挥棒”效应看如何反对“五唯”[J]. 教育科学, 2019, 35(3): 7-13.
[21] 王书林. 心理与教育测量(上)[M]. 福州: 福建教育出版社, 2008: 3-4.
[22] 叶赋桂. 教育评价的浮华与贫困[J]. 清华大学教育研究, 2019, 40(1): 18-21.
[23] 周玉容, 沈红. 现行教师评价对大学教师发展的效应分析——驱动力的视角[J]. 清华大学教育研究, 2016, 37(5): 54-61.
[24] 陈玉琨. 教育评价学[M]. 北京: 人民教育出版社, 2019: 124.
[25] 高颖. 研究生导师立德树人评价方法探析[J]. 学位与研究生教育, 2024(3): 48-53.
[26] 李力, 金昕. 新时代高校立德树人的内涵、难点及实现路径[J]. 东北师大学报(哲学社会科学版), 2019(2): 149-154.
[27] 柴杰, 齐昌政, 尹美尧. 基于扎根理论的研究生导师评价体系构建[J]. 评价与管理, 2021, 19(4): 4-10.
[28] 赵立莹, 刘晓君. 研究生教育立德树人: 目标体系、实施路径、问责改进[J]. 学位与研究生教育, 2018(8): 58-63.
[29] 马焕灵, 黄丽静. 研究生导师立德树人职责履行评价指标体系的构建[J]. 现代教育管理, 2020(8): 84-92.
[30] 高颖. 研究生导师立德树人评价方法探析[J]. 学位与研究生教育, 2024(3): 48-53.
[31] 周光礼. 大学教师评价改革的逻辑[J]. 中国高教研究, 2022(6): 26-33.
[32] 沈红, 刘盛. 大学教师评价制度的物化逻辑及其二重性[J]. 教育研究, 2016, 37(3): 46-55.
[33] 李立国. 建立符合高校教师工作特点的学术评价体系[J]. 清华大学教育研究, 2019, 40(1): 10-12.
[34] 周文辉, 曹镇玺. 高等教育督导评估: 内涵特征、内在冲突和路径选择[J]. 江苏高教, 2019(5): 28-34.
[35] 薛二勇, 徐友礼. 教育督导的制度创新与实施路径——山东省潍坊市教育政策执行过程研究[J]. 中国教育学刊, 2017(4): 44-49.
[36] 王旭初, 黄达人. 关于新时代高等教育评价问题的一些思考[J]. 中国高等教育, 2020(22): 7-9.
[37] 陈玲, 刘检华, 杨东晓, 等. 高校研究生教育督导的困境破解和实践探索[J]. 学位与研究生教育, 2021(10): 10-16.
[38] 耿有权, 刘道镛, 曹蕾. 实现“四个转型”引导创新人才培养——基于东南大学研究生教学督导的实践[J]. 学位与研究生教育, 2013(5): 5-8.
[39] 冯建军. 测量时代的德育评价: 难为与能为[J]. 中国电化教育, 2022(1): 1-8.
(选自《学位与研究生教育》2025年第4期)
基金项目:国家社科基金教育学2022年度国家青年课题“专业学位研究生教育高质量发展的社会支持研究”(编号:CIA220285)
下文根据语境,简称为“导师评价”或“导师立德树人评价”。
为了表述简洁,本文将此两难困境简称为“不评价,无动力;一评价,唯指标”。如无特别说明,不评价在本文特指不对导师立德树人成效进行考核评价。无动力,特指导师缺乏立德树人的动力。
理论上讲,教育质量问责使教育行动者对公众更加负责,但由于教育活动的重要价值未必可测(即使可测也未必准确),质量标准并不等于真正的质量。最终导致对公众负责的表面目标下真正要求的却是对监管者、质量标准、政府部门负责,与真正的高质量“南辕北辙”,产生“质量危机”。参见:比斯塔. 测量时代的好教育:伦理、政治和民主的维度[M]. 张立平,韩亚菲,译. 北京:北京师范大学出版社,2019:40-55.
任何考核性评价都有利弊,但若考核评价的负功能大于正功能,则失去了考核的必要。