国外考试机构关键岗位的素质要求及其对我国考试行业专业化建设的启示

来源:  发布时间:2020-04-08 09:41

  原载《教育测量与评价》2020年第2期

  作者介绍

  杨志明/湖南师范大学测评研究中心主任、外国语学院教授,博士生导师,香港中文大学博士。

  杨笑颖/湖南师范大学外国语学院硕士生,主要研究方向为外国语言学及应用语言学。

  孔淑仪/湖南师范大学外国语学院硕士生,主要研究方向为英语课程与教学论。

  【摘要】为了提升中高考等大规模教育考试工作的质量,我国考试人才队伍的建设和培养力度亟待加强。文章详细介绍了世界一流考试机构对命题专家和测评专家的素质要求,同时介绍了国外有关高校测评方向的博士研究生培养方案,为改进我国考试人才的培养工作提供了有价值的参考信息。

  【关键词】 新高考改革;国外考试机构;考试命题;考试人才的培养

  眼下,我国各地的初中学业水平考试(中考)基本上是分市州命题,部分省份采用全省统一命题。实施新高考改革后,全国统一高考命题与学业水平选择性考试分省命题将成为新常态。显然,开展好中考、高考等大规模教育考试工作是为国选才、引导学生德智体美劳全面发展、促进社会公平公正等方面的基本要求。不过,由于教育考试命题与测评分析工作具有很强的专业性,参与这项工作的人员不仅较多,而且经常轮岗,因此,许多地方常常出现教育考试工作队伍的知识经验和专业素养不能满足工作要求的情况,给教育考试工作的科学性和公平性带来了巨大挑战。事实上,“命题不当”“分数表达不当”和“分数使用不当”等问题时有发生 [1][2],且已经造成了一些不良影响。为了解决这些问题,降低考试管理成本,预防考试工作中的潜在风险,各地教育考试行政部门应当尽快提高考试命题与测评分析人员的专业知识和技术水平。本文旨在分析国外一流考试机构关键岗位的人才素质要求和部分国外高校的考试人才培养办法,为我国考试人才队伍的建设与培养工作提供具体参考。这项工作不仅对我国高考和中考工作有参考意义,而且对大量旨在为中小学提供考试服务的相关企业也具有参考意义。

  一、国外考试行业关键岗位概述

  国外考试行业的主要特点是考试工作的专业化、市场化和法制化。[3]其中的专业化主要体现在考试机构的专业化运作、考试从业人员的专业化培养,以及考试工作本身的科学化等方面。

  目前,引领世界考试行业学术发展方向的著名考试机构主要有美国教育考试服务中心(Educational Testing Service,ETS)、美国大学考试中心(American College Testing Program,ACT)、美国大学理事会(College Board)和培生(Pearson)公司等。这些专业考试机构的关键岗位主要包括两类,即测验研发岗位和测评分析岗位。其中,测验研发岗位主要是命题专家及其管理者,其岗位名称为测评专家(Assessment Specialist)或测验研发专家(Assessment Developer,AD)。测评分析岗位主要是指统计分析专家和测量分析专家,包括统计分析师(Statistic Analyst 或 Data Analyst)、心理计量学家或心理测量学家(Psychometrician)或者测评研究员(Research Scientist)。

  考试人才的培养主要依赖一些高校的教育测量、心理计量学(Psychometrics)或应用统计学专业方向的博士研究生培养项目。其中,爱荷华大学(University of Iowa)的高级测量评价中心(Center for Advanced Studies in Measurement and Assessment)、加州大学洛杉矶分校(University of California at Los Angeles,UCLA) 的教育测评中心(Center for Educational Assessment,CEA)、马萨诸塞大学安姆斯特分校(University of Massachusetts Amherst)的教育测评中心、北卡罗来纳大学教堂山分校(University of North Carolina at Chapel Hill)的高教研究与评价中心(Office of Institutional Research and Assessment,OIRA)、马里兰大学(University of Maryland)的测评研究中心、密西根州立大学(Michigan State University)和伊利诺伊大学(University of Illinois at Urbana-Champaign,UIUC),等等,都开设了高级测量与评价等方向的博士研究生培养项目。他们为考试行业培养了众多的测评统计与分析人才。下文通过对ETS 等专业性考试机构的人才招聘广告[4][5],以及部分国外高校测评分析方向博士研究生的培养课程,具体分析这些考试行业关键岗位的人才素质要求。

  二、国外考试命题专家的素质要求

  以ETS 为例,命题专家包括考试机构内部的命题人员和外部的签约命题人员两大类型。依照其专业特长,他们一般可以分为各种学科命题专家,如英语学科命题专家、数学学科命题专家等。依照任职者的资历和能力水平,命题专家一般分为初级(assessmentspecialist-Ⅰ)、中级(assessment specialist-Ⅱ)和高级(assessment specialist-Ⅲ)3个层次。现从以下6 个方面解读这些岗位的素质要求。

  1 基本要求

  命题专家能够规划、研发和评估考试项目及其相关的产品,这些产品与目前的课程标准、学生的学习目标紧密关联;能够主导与客户或考试管理部门的研讨工作,明确各学科考试的测评结构;具有很强的学科背景知识,能在题目编写、题目评审和考试组卷方面,以及在考试研发委员会的研讨会上提出有价值的建议;对课程标准及其发展趋势具有深刻的认识。命题专家在考试研发的所有环节,包括题目编写、题目评审、考试组卷、阅卷评分等方面能表现出较高的知识和技能水平。他们既能作为测验研发专家独立工作,又能作为团队中的一员与他人合作,包括与本单位之外专家的合作。此外,本岗位的任职者还需要定期向经验不足的命题人员提供指导和培训。

  2 专业要求

  (1)编写和评审题目:收集各方关于题目质量的反馈信息,并在题目测试之后评估题目的可接受性。

  (2)参与并管理开放式题目(constructed-response items)的评分工作,包括与高校教授顾问或地方政府相关人员进行合作。

  (3)批准可用于正式考试的题目,并评估题目内容及其测量学特性。

  (4)改进外部命题人员所命试题质量的方案;编写命题人员培训材料;计划和主导命题人员培训会议;与外部命题人员合作监管命题工作。

  (5)设计和开发新的测评项目,发明新产品和创造新服务;与产品开发团队和客户一起研制新的考试蓝图和题目类型。

  (6)编写试卷生成系统的规则,为试测、正式测试和/或计算机自适应测试(CAT)构建小题库(pools);审查试卷并参加CAT 模拟研究;协助准备额外的特殊测试。

  (7)对来自高层的督查报告(Supervisor Irregularity Reports,SIR)和考生询查做出回应;审查考生询查答复文件确保答复内容准确恰当;审查可能的侵犯版权行为;审查考试安全事件并提出妥当的问题解决建议。

  (8)与客户委员会合作:能够组织会议、招募和培训委员会成员、推荐委员会成员、组织审查材料、编写培训材料和安排会议议程、总结并解释测量分析结果、对测量问题提供相关的建议。

  (9)与客户方的内容专家代表直接合作,获取对方代表关于题目和试卷质量的签名认可;参加客户的开题会议、工作计划会议和工作进展会议。

  (10)计划和实施考试项目本身及其备考材料解读的出版工作。

  (11)参与命题教师的培训活动。

  (12)计划并实施考试项目的信度、效度或可比性研究。

  (13)培训有关人员运用题目统计量进行组卷的工作。

  (14)在考试组卷过程中与统计、测量学分析团队合作,并获得测量学家关于题目和试卷参数方面的签名认可。

  (15)作为一个或多个考试项目的团队负责人,甚至是整个考试研发工作的团队成员或负责人,担负起考试研发工作的计划、管理和指导责任。

  (16)管理一个或多个考试项目的题目评价工作,能根据专家委员会会议和相关专家的反馈意见,改进相关考试项目的题目质量。

  (17)对存在计分问题的题目提出改进评分质量的建议。

  (18)对员工提供恰当的指导。

  (19)在政策和计划委员会中发挥越来越重要的作用。

  (20)充当本考试机构的发言人,恰当处理考试研发过程中的某些事件。

  (21)直接领导考试项目,委派工作并监控进度。

  (22)创建、实施和监视题目研发计划。

  (23)承担并监管小型特殊发展的项目。

  (24)监管一个或多个考试项目的预算要求。

  (25)遵守道德标准和与岗位功能关联的法律法规。

  3 经验要求

  命题专家必须具有相关学科或专业领域的硕士学位,或具有同等学力和经验的知识和能力水平(学力证书和行业执照等)。以下是命题专家3 个级别的岗位要求。

  (1)初级命题专家:至少需要有3年、职责要求逐年提高的工作经历,具有在初中、高中和/或大学层次机构的教学经验,并从事过写作、编辑和/或测验研发方面的工作;必须具有很强的写作能力、组织能力以及学习新技术的意愿和能力;必须具备全面的相关学科知识,能够胜任相关学科测验的开发工作,可以为同行、专业委员会和客户担任顾问;必须具备与客户、外部委员会进行有效协作的能力。具有测验开发、教育测量和应用统计方面经验者可以优先考虑。

  (2)中级命题专家:至少需要 5~6年、职责要求逐年提高的专业工作经历(如教育测量、应用统计或教学方面的经历),其中两项要求必须是测验研发和教育测量或应用统计。中级命题专家最好具有课堂教学经验并熟悉当前的课程标准,具有较强的口头表达和书面沟通能力,能应用语法规则修改专业性很强的题目;必须具备高水平的组织能力、强大的技术能力,以及强烈的学习新技术的意愿或能力。

  (3)高级命题专家:至少需要 7~8年、职责要求逐年提高的专业工作经历(如教育测量、应用统计或教学方面的经历),其中的几项要求必须是测验研发和教育测量或应用统计;具有较强的写作能力、高超的组织能力以及强烈的学习新技术的意愿或能力;具备相关领域的全面知识,以便能够研发相关科目的测验,并能为同行、相关委员会和客户提供专业水准的建议;具备与客户和外部委员会进行有效协作的能力。精通相关的专业领域,具有深厚的考试和测评知识,能为公司提供专家建议,能为高层出谋划策并代表公司参与教育界和考试行业的各种活动。

  4 管理要求

  命题专家的管理职责主要体现在团队合作、领导力和变通性3 个方面。首先,命题专家在积极参与正式或非正式团队工作,以及理解团队成员各种兴趣方面,具有为团队增值的成长记录(track record);其次,能以客户为中心,能努力与单位内外同事建立相互尊重的关系;第三,办事过程中心里想着客户和其他利益相关者,能顾及自身行为对下游工作环节的影响;第四,具有关于本行业的标准工作流程和最新发展趋势的丰富的知识;第五,能胜任新的测评项目工作,能创新开发新题型,能用新方式开展工作,能成功处理有关争议;第六,为提升个人素质和改善本单位的工作绩效,学习欲望强烈,乐意发展新的技能和能力;第七,能为测评项目的发展方向提供协助;第八,能帮助落实题目研发计划;第九,能为开发特殊项目努力工作;第十,能够解决问题,并能灵活调整工作计划以便按时按质完成工作任务;最后,对自身承担的工作任务能表现出高水准的工作效率和责任心。

  5 学科要求

  主要针对各门学科的知识和能力水平提出具体要求,特别要求学科教师对最新的课程标准有比较深厚的理解。(具体要求略)

  6 其他要求

  对相关领域具有全面了解,研发的试题、试卷和测评产品能与相关学科的课程标准达到一致;在题目研发过程中具有整合课程标准中多个维度要求的能力;有能力协助咨询委员会并在必要时参加客户会议。

  三、国外考试测评专家的素质要求

  国外专业性考试机构的测评分析专家主要来自高校的心理计量学,或教育测量学,或应用统计学等方向的博士毕业生。这些博士毕业生或者从事考试测评的研发工作,或者从事考试科学的研究工作。前者的岗位名称一般为心理测量学家,其主要工作包括:设计考试项目、制定考试蓝图、开展测验试测、估计题目参数、分析测量信度、收集效度证据、实施测验等值、研制测验常模、设定考试标准,报告测验成绩、维护测验题库、回答客户问询,等等。后者的岗位名称一般为测评研究员。研究员一般不直接参与考试项目的开发与运行工作,而是就考试工作中的各种挑战难题进行科学研究。通常,当考试工作遇到难题时,研究员会被要求从数学建模、先导试验(pilot study)、模拟研究等途径探索问题解决的理论方法和可行方案,全力以赴破解难题,支持考试项目的良性运转。比如,当考生的原始得分分布不符合正态分布时,如何科学合理地转换分数而不是简单地把分数做正态化处理,就是一个重点研究课题。当题库中的题目参数等值发生量表漂移(scale drifting)时,考试机构的研究员就需要加大科研投入,拿出问题解决的具体方案等。具体来说,测评专家的职责和经验要求如下。

  1 职责要求

  (1)具有设计并实施测量学分析工作以支持测评项目顺利实施的经验。

  (2)具有分析、研究和解决当前和未来测量学问题的能力,能与人有效沟通这些问题解决的方案。

  (3)精通经典测验理论(classical testing theory,CTT)、题目反应理论(item response theory,IRT)和测验等值技术(test equating),能够熟练使用常见的测量分析软件和统计分析软件(包括SAS 或SPSS、BILOG、LOGIST、WINSTEPS 和 PARSCALE等)。

  (4)能与不同受众进行口头和书面沟通。

  (5)在设计和分析测评项目、开展跨功能小组工作和量化研究方面具有领导能力。

  (6)无论是在教育测评领域,还是在其他领域,都能够积极主动地、创造性地用好测评理论和方法,以便支持并改善本公司的产品或服务质量。

  2 经验要求

  (1)初级职位:具有教育与心理测量、应用统计学、定量分析或认知心理学、生物统计学或其他密切相关量化研究领域的博士学位。具有一年以上的运用心理测量和统计方法的经验;懂得经典测试理论和题目反应理论及其应用。

  (2)中级职位:具有教育与心理测量学、应用统计学、定量分析或认知心理学、生物统计学或其他密切相关量化研究领域的博士学位。具有至少3年以上的运用心理测量和统计分析方法的经验。这个职位必须要有主动性、创造性、科研能力与技术专长。

  (3)高级职位:具有教育与心理测量学、应用统计学、定量分析或认知心理学、生物统计学或其他密切相关量化研究领域的博士学位。具有至少六年以上的运用心理测量和统计分析方法的经验。这个职位必须要有主动性、创造性、高级科研技能与技术专长。能够全身心地投入科研工作和新方法的探索与应用之中;能在运用当今新兴技术、发明创造和研究成果方面,为公司提供切实可行又具有战略意义的指导建议。

  四、国外考试测评专家的培养方案

  测评专家的培养主要是通过高校的博士研究生培养计划来实现的。其中的必修课程主要涉及3 大类型,即应用统计学课程模块,教育测量学课程模块,以及教育心理学、教育评价和研究方法课程模块。现以爱荷华大学的课程设置为例[6][7]进行简要说明。

  1 应用统计学课程模块

  本课程模块包括7 门必修课程。

  (1)中级统计方法(Intermediate Statistical Methods):要求学生了解推论统计的基本原理,会针对特定问题情况和条件选择适当的统计方法,能够实施统计分析并解释统计结果;能够熟练使用SPSS 或SAS 等统计软件,能够创立统计文档、实施统计运算、阅读和解释统计结果,并评价所用统计方法在实践中应用的适宜性。该课程的主题包括概率论、统计检验、抽样理论、效果量计算、t 检验、卡方检验、方差分析(ANOVA)、相关分析、多元回归和部分非参数检验技术。

  (2)相关与回归(Correlation and Regression):本课程首先简要回顾统计和测量的基本概念,并着重介绍使用回归方法进行预测因变量变化和解释控制变量作用两个方面的差异。随后学习双变量过程、多元回归、干扰变量的统计控制与实验控制方法、中介变量、抑制变量、交互作用、非线性回归、虚拟变量、方差分析(ANOVA)和协方差分析(ANCOVA)。此外,预测中的偏差研究、性向与处理交互作用之间交互效应研究、检验力分析、数据的降维处理方法、变量选择和排序策略、因子分析、逻辑斯蒂回归、简单的结构方程模型以及潜变量间的相互作用分析也是学习的内容。

  (3)实验设计(Design of Experiments):内容包括实验研究设计与统计分析的理论和方法;完全随机化设计和重复测量设计中单因素和多因素均值间差异性的假设检验。

  (4)非参数统计方法(Nonparametric Statistical Methods):内容包括部分非参数检验方法、单样本和双样本距离检验(location tests)与估计方法、关联度测量和方差分析;强调与经典参数检验过程的关系。

  (5)因素分析和结构方程模型(Factor Analysis and Structural Equation Models):内容包括探索性因素分析和验证性因素分析的基础;最小二乘法和极大似然估计方法;因子抽取、旋转和解读中的问题;使用LISREL 软件运用结构方程模型;备用方法的前提条件与局限性。

  (6)多元统计方法导论(Introduction to Multivariate Statistical Methods):内容包括矩阵概念基础,多元数据分析中的样本几何和相关概念,多元正态分布和相关的多变量间的显著性检验,主成分分析(PCA),常用因素分析(CFA),判别分析(DA),典型相关分析(canonical correlations analysis,CCA) 和多元方差分析 (MANOVA)。SAS PROC IML 矩阵思维的编程方法也是学习的内容,SAS 程序中的 PROC GLM 和 PROC ANOVA 内容也需要学习。

  (7)教育统计与测量研究专题(Topics in Educational Measurement and Statistics):本专题探讨提供诊断信息的数学建模方法,期待能用新的心理计量学模型提供更好的诊断信息并改进测验设计。本专题的基本关注点是如何用心理计量学模型得到比传统方法更加可信、关联更少的各种子维度的诊断分数。

  2 教育测量学课程模块

  本课程模块包括8 门必修课程。

  (1)评价工具的研发与应用(Construction and Use of Evaluation Instruments):内容包括教育评价工具的设计与研发;编制学业成就测验、态度量表、表现性评价工具和调查问卷;重点在于评价工具的研发以及工具特性的评估。

  (2)教育测量与评价(Educational Measurement and Evaluation):本课程的重点是教育与心理测量的基本原理与方法。它适用于具有一定统计学基础的心理咨询师、心理学家、教师、管理人员和测量专家。有关评价、解读标准化测验结果和调查问卷结果的概念被重点解读。本课程的大部分内容是测验分数的分析、行为标准、常模数据、测量信度和效度,以及评估领域中目前常见的问题,如存在于成就测验、潜能测验、智力测验、个性分析、职业兴趣和态度问卷中的问题。学生在学完一定学习内容后,他们通常会严格评估特定的标准化测验,或者综合和评判常用的用于评估其个人兴趣的测评方法。评分取决于学生在考试、作业和完成课堂项目中的表现水平。

  (3)教育测量的理论与技术(Theory and Technique in Educational Measurement):本课程重点介绍经典测验理论的原理与方法,包括基本概念、计算方法和公式证明。测量学中的一些高深话题也有所介绍,包括Beta-二项式模型、条件误差方差,以及概化理论基础。

  (4)量表标定方法(Scaling Methods):内容包括单维度和多维度量表标定技术;多级计分的题目反应理论模型;可用的量表标定计算机程序;量表标定在教育与心理学研究中的应用。

  (5)题目反应理论:内容包括题目反应理论的基本原理和实际应用;数学模式及其参数估计技术;重点关注当今考试工作中的应用情况和问题;介绍常用的题目反应理论参数估计软件。

  (6)教育测量与评价研讨会(Seminar in Educational Measurement and Evaluation):主要研讨当今教育测量与评价中的现实问题和理论问题,包括媒体所关注的教育测量与评价的热点问题。

  (7)教育考试中的等值与标定方法(Equating and Scaling of Educational Tests):主要内容为测验的等值设计与等值方法,包括线性等值方法、等百分位等值方法和题目反应理论方法。重点关注基本概念、测验软件的使用与科研工作。

  (8)概化理论(Generalizability Theory):本理论是经典测验理论的进一步拓展。其突出特点是通过变异数分析技术,全面估计分数变异的各种来源及其大小。本课程对概化理论的基本概念、数学基础、模型、假设、设计和应用都做了介绍,并考虑了该理论与其他测量理论的关系。

  3 教育心理学、教育评价和研究方法课程模块

  本模块可供选择的课程主要有4门。

  (1)教育心理学(Educational Psychology):本课程包括关于学习和教学过程的心理学原理与方法;学习、教学、动机和评估的理论;青少年发展的概念、儿童的社会化过程、个体差异、学习过程和技术、学习的生物学基础。

  (2)量化教育研究法(Quantitative Educational Research Methodologies):本课程包括计划、实施和报告教育研究的基本步骤;教育研究现行方法的评价;量化研究设计及其分析方法。

  (3)项目评估(Program Evaluation):本课程包括教育与社会评估中的理论问题及其思考;评估设计、方法、元评估和评估应用。

  (4)教育心理学研讨会或当代话题(Seminarin Educational Psychology orCurrent Topics):(省略)。

  五、对我国考试行业专业化建设的启示

  对照国外考试行业命题专家和测评专家两个关键岗位的人才素质要求,以及测评分析人才的博士培养课程设置,我国教育考试人才队伍的建设和培养工作亟待加强。事实上,作为一个考试大国,如果没有专业化的人才队伍做后盾,或者仅仅把考试工作作为一项行政任务来执行,无疑会出现一些无法克服的科学性问题。这不仅会让参与国家考试工作的有关人员承担不必要的风险,而且会在科学选才、公正公平,以及为学生的学业发展提供准确的诊断服务等方面事倍功半。显然,国外考试人才的素质要求和培养模式,对于我国考试行业专业化建设具有很好的启发作用。

  首先,需要确认考试工作的专业性特点。无论是政府的相关管理部门,还是为学校提供考试服务的各大企业,一定要把考试工作作为一项专业性的工作来对待。为此,在人才的培养和使用方面,要把考试人才当成外科医生一样的专业人才来对待。即不能通过跨界指派的方式(如管理部门的人才轮岗等形式)安排非专业的人员来从事专业性极强的考试命题与测评分析工作,也不能认为跨行的高级专家(如中小学高级教师、大学教授、教育学家、统计学家、科学院院士、IT 精英、企业老总等)会自动成为命题专家或考试分析专家。特别地,一些单位让考试专业人员不断轮岗的做法,实质上与安排一位内科医生去做外科手术的做法没有差别,其效果必定不理想,也是一种不负责任的做法。

  其次,考试人才的培养需要有长期全面的严格训练。从美国爱荷华大学测评分析人才的博士培养课程可知,一个考试分析人才的培养,往往需要经历7 门应用统计学方面的课程、8 门教育测量方面的课程和4 门教育心理学等方面课程的系统学习。再从ETS 对命题专家和测评专家的任职要求和经验来看,仅仅学过理论课程的博士毕业生并不可以立即上岗,他们往往需要经历过实习或1~3年的“拜师学艺”实践才能独当一面。这不仅要求学习者优秀、努力,而且要给其成长留下足够的时间。比如,关于分数的表达与转换问题,直接请统计学家给出答案的做法往往具有很高的风险,因为统计学家并没有经历过全面和严格的考试科学训练。事实上,考试分析人才必须懂得统计科学,但懂得统计科学的专家并不能自动变成考试分析专家。其道理与合格的投资专家必须具有统计学知识,而具有统计学知识的专家未必是个合格的投资专家的道理一样。

  第三,考试政策和测验研发方案的制定需要考试专家参与。有关部门在制定考试政策或有关企业在研发考试产品时,其咨询指导委员会或决策团队一定需要吸收一定比例的考试命题专家和测评分析专家。否则,与考试技术要求密切相关的工作一旦做出不恰当的建议或行政规定,则一定会给一线的工作人员带来巨大压力。因为工作在一线的执行单位是没有调整政策权限的,但违背考试科学的行政规定必定会造成考试工作的隐患。结果,许多美好的愿望往往会变成可怕的风险,进而违背考试改革的初衷。

  第四,考试人才需要同时具备专业素养和沟通合作本领。专业的考试人才不仅需要掌握考试命题和测评分析的专门知识和技能,而且在口头与书面沟通、团队合作和落实工作任务等方面应该有突出的表现。考试人才素质要求与我国的敬业爱岗等要求基本一致,不过国外考试机构对考试人才的非专业技能方面的要求做了操作性的细化处理,而不是提出几条抽象的概念性要求。这对于考试人才队伍的建设和培养具有较大的参考意义。

  第五,我国考试人才的培养机制有待改善。从学科建设的角度看,我国的教育测量与评价专业目前还处于弱势地位。它既没有被认可为一门独立的学科,也没有被归类在“教育学”门类下的某个二级学科之中,更没有任何一家相关的学术期刊被评定为CSSCI 期刊,中国人民大学书报资料中心也没有考试评价方面的专门刊物。这一现象亟待改善,否则,无法吸引优秀专家从事考试科学的研究,攻读考试科学专业的博士研究生也没有相应的C 刊发表其研究成果。这与国外许多高校以自己拥有一流的考试人才培养团队而闻名于世的情况大不相同,也与ETS 等考试机构愿意花大价钱聘请几百个世界一流的测评专家专门投入考试理论与技术的创新研究的做法大相径庭。

  第六,考试工作人员的在岗培训工作应当形成制度。新一轮高考改革已经明确要求,除了语文、数学和英语由教育部考试中心统一命题,其他科目的学业水平选择性考试将采用分省命题模式。然而,许多省(区、市)还没有做好分省命题的准备。同时,目前的中考命题工作基本上是分市州命题,部分省份采用全省统一命题,由于大量的命题人员并没有接受过系统的考试科学培训,因此这些决定千千万万考生命运的中考质量并不能得到有力保障。比如,如何在学科考试的命题工作中体现学科核心素养的要求,特别是如何在高考和中考命题中体现立德树人、引导学生德智体美劳全面发展的要求方面,绝大多数命题教师目前并不十分清楚,这种现象令人担忧。另外,许多为中小学提供考试服务的企业,目前已经或正在加大投入建设考试题库,可是在如何保障题库中所有题目参数被转换在统一度量系统方面还存在很多困惑,这很可能导致许多公司的几百万道试题质量无法保障,其结果往往表现为不少学生考试成绩的年级排名一会儿名列前茅,一会儿全年级垫底的现象,这实质上是测评信度低劣和效度不高的表现。这种质量低劣的考试服务祸害无穷。

  总之,国外的经验表明,考试工作是一项专业性很强的工作。考试命题专家和测评分析专家需要具有很强的专业素养,其培养过程不仅漫长,而且需要养成跨学科基础和一定的团队合作与沟通等非学术方面的素质。为了保障和提高我国中高考等大规模教育考试的专业水准,确保人才选拔的公正公平,正面引导中小学生德智体美劳的全面发展,加强考试人才的培养工作、提升考试行业专业化建设水平刻不容缓。国外考试机构对命题专家和测评专家的素质要求,以及国外高校关于测评专家培养的课程设置方案,值得我国相关管理部门和高校参考。

  参考文献:

   联系我们   回到顶部