◇◇◇ 您现在的位置: 学业评价网 >> 互动空间 >> 评价设计 >> 文章正文
中学生历史学科能力的测量与评价
作者:佚名    文章来源:http://www.uebrain.cn/Html/wenzhang/jiaoxue/2007011720220110475.html    点击数:    更新时间:2007-4-18

二、历史学科能力测量工具的编制

历史学科能力测验根据不同的评价目的,可以编制不同类型的试题。我们以总结性评价中为例,制定完整的测验目标体系,同时,以高三学生学科能力项目指标为例,编制一份测验工具。

(一) 测验的目标分析与具体化

历史学科能力测验的目标从总体上看包括三个层次:第一个层次是历史思维能力;第二个层次是学科能力的三个主要部分;第三个层次是综合各学科能力的问题解决能力。在测验目标中,这三个部分为一级指标,其中,思维能力占20%,学科能力占60%,综合性问题解决问题占20%。如果需要单独测验学科能力,只要依据学科能力部分的指标进行编制就行了。 

高中生历史学科能力测验在形成性或总结性评价中都可以使用,测验依据学科能力结构、高中生思维能力发展规律与有关历史学科测验的特点与原则制定(见表75)。

(二) 测验题目的编写

历史学科能力测验与学业测验的试题在编写上有同有异,从选择题来看,学科能力测试在知识方面没有覆盖率的问题,但尽可能选择学生熟悉的知识。在选项方面则要求各个错误选项与正确答案之间尽可能保持等距关系,如果选用知识性选项太难,可以用等距判断词做选项。如完全正确、有一要点正确、有一要点错误、全错等。从问答题来看,要避免学生直接复述课本或教师给定的知识,而应当运用变式或创设问题情境。在评分方面,必须在编制测验试题的同时制定评分等级结构表,要经过预测来检验评分等级与标准的客观性。此外,还需要编制评分说明,对评分中可能出现的情况作统一安排。

选择题举例:

测量目标

1、 归类  1)与下列中国古代明朝城市同一类型的是(  ):宁波、泉州、广州

         A登州 B福州 C上海 D武汉  答案等级:B/3  A/2  C/1  D/0

         2)与下列概念同类的是(  ):贞观之治、交子、《千金方》

         A古钱币 B皇帝 C民族 D黄巾起义  等级:D/3  B/2  A/1  C/0

2、 鉴别  1)甘地在印度领导“非暴力不合作”运动的同时,下列事件也在 

         进行之中的是(  ):

         A苏联正式成立                B英国议会通过威斯敏斯特法

         C国共两党首次合作建立        D华盛顿会议

         答案等级:D/3  A/2  C/1  B/0 

问答题举例:测量目标(阐述能力—驳论、评价能力—观点性评价)

   《三国演义》一书开头有:话说“天下大事,分久必合,合久必分。”请根据中国古代历史发展的总体情况,评价这一说法。

三、历史学科能力测验结果的分析与评价
对历史学科能力测验结果的分析评价包括:(1)对测验工具进行信度、效度检验;(2)项目分析;(3)测验结果的解释与评定。这三项工作的内容十分广泛,几乎涉及到心理与教育统计测量学的所有基础理论与方法。我们选择其中的几项加以介绍,这些方法也适合对学业测验结果的分析。
(一) 信度与效度
信度主要是指测验结果的可*性或一致性。即信度高的测验工具应当意味着在不同时间、不同测验条件下所得分数之间的可*性或一致性强。反之,信度若不高,测验结果就不能代表被试的一致的和稳定的行为,而只是测验样本的偶然性表现。信度一般用相关系数(团体)与标准误(个人)来表示。效度是指测验的有效程度,所谓有效即指一个测验应该能够测到该测验预先制定的测验目标。效度越高,说明该测验在使用时越能反映其测试的功能。历史学科能力测验的效读问题,也就是其测验的分数能否真实地反映学生的历史学科能力水平。因此,效度比信度更为重要。
1
、常用的信度估计方法。(1)重测信度。也称稳定性信度,即使用同一测验,在不同时间对同一团体施测两次,这两次测验分数的相关系数,就是重测信度。历史学科能力测验的间隔时间至少在两个月以上;(2)复本信度。将一个测验编制成两份等值的试卷,来测试同一批对象,两次得分之间的相关系数就是其复本信度。它反映了测验在内容上的等值性,两个等值的测验可以互为复本;(3)半分信度。是指采用半分法(如按奇偶数题号分开,各成等值的一组)估计同一测验中,学生在两半试题各自所得分数之间的相关系数,它代表了两半测验内容取样的一致性程度。这三种信度估计都可采用积差相关系数。前两者所考虑的分别是跨时间与跨形式的一致性,后者考虑的则是测验工具内部的一致性。在历史学科能力测验中,它们比较适合于对选择题的信度进行估算;(4)评分者信度。历史学科能力测验离不开论文式问题的测试,但是,这类试题在评分时的主观性太强,不同的评分者对同一份试题的判断往往不一致,从而成为误差来源之一。解决该问题的简单方法是随机抽取若干份答卷,由两个独立的评分者打分,再计算每份答卷两个分数的积差相关或斯皮尔曼等级相关。若评分者在三人以上,而且采用的是等级记分时,可以采用肯德尔和谐系数(W)来计算评分者信度。
2
、常用的效度估计方法。(1)对照效度。也称推论效度,即把该学科能力测验的结果与另一种测验(最好是标准化的测验,如瑞文智力测验)结果相比较,用它们的相关系数的大小来决定其效度;(2)同时效度。一般是计算学科能力测验的结果与学生学业成绩的结果的相关;(3)难度分析考验效度。考查各项试题的通过率,是否按年龄或年级而增加,即不同年龄组之间是否存在差异。
3
、信度与效度的可接受水平。最理想的信度是rxx=1.00,实际上一般标准的成就测验与能力测验的信度都在0.90以上,人格、兴趣等测验的信度在0.800.85之间。采用预测效度或同时效度时,其效度系数应在0.30以上。如果系数低于这一水平,但系数已有显著性,而受测群体又具有同质性,这样的系数依然有效度,一般把效度显著性系数确定在0.10-0.50以上。
(二) 项目分析
项目分析是指根据被试的反应(即测试结果)对组成测验的各个题目(即项目)进行分析,从而评价该测验工具的功用的程序与方法。它包括定性分析与定量分析两种,定性分析主要包括考虑内容效度,题目编写的恰当性与有效性;定量分析主要指题目的难度与鉴别度(即区分度)。项目分析的目的是为了选择与修改题目,以提高测验的信度与效度。
1
、项目难度。难度即指题目的难易程度,一般用通过率(P)来表示,也就是答对或者通过该题的人数百分比。历史学科能力测验中,选择题难度的计算可用吉尔福德(J.P.Guilford)提出的难度校正公式计算。
2
、区分度。所谓区分度是指测验项目对于所研究的心理特征的区分程度或鉴别能力,即该测验能否将某一心理特征(如能力)的差异体现出来。估算区分度的简单方法是比较效标高分组与低分组的被试,在该题目上通过率的差异。D=PH-PLPH为高分组的通过率,PL低分组的通过率,D为区分度指数)一般情况下,选择分数分布的两端各27%的被试组成高分组与低分组。
3
、难度与区分度的关系。难度与区分度是密切相关的,难度是区分度的必要条件。难度应当在什么范围内最合适呢?难度应以区分度的高低为其标准,试题太难或太易都不能很好地区分被试。对于学科能力测验来说,难度应能够将学生之间能力的高低明显地区分开来为最佳,即测验的平均难度应选择在0.50左右,各题的难度则在0.50+0.20之间,区分度就会比较好,
(三) 测验结果的解释与评价
历史学科能力测验按照测验目标体系进行编题、实施预测,并对其结果进行信度、效度与项目分析检验后,剔除不合格的试题,就可以编成一份具有一定标准化意义的测验工具了。如何使用这一工具呢?教师们可以组织学生参加测验,这样就能得到一组原始分数,它是通过将学生的反应(即答案)与标准答案相比较而获得的。但是,原始分数本身并没有多少意义,它需要经过统计转化为等值的量表分数,才可以进行比较。一般情况下,可以分三种情况处理:(1)将原始分数转化为常模分数,它的解释是通过与他人的行为表现加以比较而获得的,这种方法主要用于各类编制好的量表;(2)依据被试对一个确定范围的内容与技能(如历史学科能力中的阐述能力)的掌握程度来进行解释的内容参照分数,这种比较适合学科能力测验;(3)依据外在效标来进行解释的结果参照分数,它比较适合学科能力测验,同时也适合教师自编测验。从对团体的研究来看,教师们可以用这些方法来研究不同年龄组(或按性别、智商、语文水平等标准来分组)学生在历史学科能力方面的发展规律与特点,研究采用不同教学方法、教学模式的实验对历史学科能力发展的影响,从而为历史教学的改革提供科学的依据。从对个体的研究来看,教师们可以依据这种测验,发现学生个体在历史学科能力中,不同类型能力的发展状况,研究历史学业成绩与其能力发展之间的关系,从而为有效指导学生通过专项学习与训练,提高学科能力水平,并由此而提高历史的学业水平或引导学生的个性化发展。

上一页  [1] [2] [3] 下一页

◎ 相关文章
试题的变化与课改的希望——对海勃湾区中考科学试题的评价
初中历史开放性试题命题回顾思考(三)v
初中历史开放性试题命题回顾思考 (一)
2006年历史学科命题重点知识扫描
cersp 网友评论:(只显示最新5条。评论内容只代表网友观点,与本站立场无关!)
·发表评论 查看全部评论
姓名: E-mail:
评分: 1分 2分 3分 4分 5分
内容:
互动空间最新文章
普通文章中学生历史学科能力的测量与评价
普通文章新课程理念下的中学英语课堂教学评价探析
普通文章美国习惯用语讲座
普通文章[组图]好一道压轴题1  评论
普通文章[图文]2007年高三数学学生课堂学习评价限时训练(十)  评论
普通文章[图文]2007年高三数学学生课堂学习评价限时训练(九)  评论
互动空间推荐文章
推荐文章[黄牧航]2007年历史学科高考命题趋势展望
推荐文章[组图]高中生物新课程必修课测试高中生物新课程必修课测试(
推荐文章高中生物新课程必修课测试(二)———— 测试水平及试卷结构
推荐文章高中生物新课程必修课测试(一)———— 测试水平及试卷结构
推荐文章高中历史必修模块终结性考试测试(三)————试题难度研究
推荐文章高中历史必修模块终结性考试测试(二)————试题的设计
互动空间热点文章
普通文章[组图]高二生物会考知识点归纳(六)
普通文章高考易错成语560例
普通文章[图文]2007年高三英语模拟考试(1)
普通文章[组图]2007届高考热点重点难点专题测试卷·生物
普通文章2007年广东高考英语新题型模拟练习(Ⅲ)
普通文章2007 年广东高考英语新题型模拟练习(II)