zgjxcad 发表于 2014-3-19 23:49:56

项目反应理论 - 基于Intrnt的机械设计辅助教学系统初步研究

    经典测验理论中使用的是线性模型,随着数学研究的进步,测量学家的注意力逐渐转向非线性模型,并由此产生了项目反应理论。项目反应理论的起源是在20世纪30年代中期。由于其所运用的数学知识相当复杂,缺乏有效而方便的计算机程序来对其测验数据进行有效分析,影响了发展速度。经过半个多世纪的发展,特别是其所使用的工具-数学和计算机的发展,使其逐渐成熟并被应用到社会生活的各个领域中。
    在美国,根据项目反应理论编制的测验,已被应用于许多领域的人员选拔工作中,集测验项目呈现、自动计分和数据处理于一身的计算机适应性测验,也被广泛应用。我们所周知的TOEFL和GRE的计算机考试,也是一这一理论为基础的。
    项目反应理论的基本思路是确定考生的心理特质值和他们对于项目的反应之间的关系,这种关系的数学形式就是“项目反应模型”。这种模型并不是确定性模型,而是概率型模型,其原因是考生对于测验项目的反应除了受到某种特定“能力”的支配外,还受到许多随机因素的影响,如焦虑、动机、考试技能等因素。因此,确切地讲,项目反应模型表示的是考生能力和考生对测验项目“正答概率”之间关系的数学形式。所谓“正答概率”,对于成就测验和能力测验就是指正确回答的概率。从某种意义上讲,项目反应理论的核心是数学模型的建立和对模型中各个参数的估计。
1项目反应理论的几个假设
i能力的单维性Unidimnsinoli)t这是一个最重要的假设,它指出,在一个测试所测量出来的能力变量
是处在单维的空间之中,可表示在一个量表中。如图3.1:


为它蕴含在单维性假设中。若速度对测试结果有影响的话,那么至少有两种特质影响了考生的反应,即考生的反应速度和该测验内容所要测量的潜在特质,这就意味着已经违反了单维性假设。
2项目反应理论模型
项目反应理论异于经典测试理论的一个鱼羊明的特色,是把能力和难度置于同一量表中,考生的分数(能力)与题目数及其答对数有关。若L为题目数,r为答对率,则能力可表示为:
Ln{二)又L一r/
题目难度与考生数及其答对率有关。若N为考生总数,s为该题目的考生答对数,则题目难度可表示为:
,`N一:、Lnl—}\S/
这样,就有一个把能力与难度统一起来的测量单位,在IRT中称为对数单位(olgi)t,记答对答错比为O,则答对概率为=P一夕二1+O由此可得项目反应理论的单参数logiscit模型:
只(口卜
e(e一方)D
1+e和一b冲
其中。:受测者能力值b、:第i个题目的难度:D为使计算值正态化而加入的调整因子(csalnigacftor)I〕=1.702川0):能力为0的受测者答对第i题目的概率
双参数模型为:
粼0)一万奋瓦不丁式3.2
在这个量表中,考生A与考生B的位置不同,考生B的能力高于A的能力4个单位。A与B之所以能够相比,是因为它们放在一个单维的量表里面。这里的单一量表并不是指考生的语言能力、数学能力和考试中的其它因素(如认知的、心理的因素)是单维的,而是指统计上的单一,它决定考生在回答试卷里各个题目时是对还是错。11局部独立性假设(L以,1nIdependenee)一个考生对试卷里各个题目的反应在统计上是独立的。这就是说,他对某个题目的反应不应影响他对别的题目的反应;一个题目的反应不应对回答其它题目提供任何提示。局部独立性假设并不意味着试卷内各个题目
之间毫不相干,只要考生的能力之间存在差异,一对题目之间便会有正相关的关系;对于具有相同特质水平的考生,测验中的各项目是不相关的,即统计上是独立的。111题目特征曲线(IetmChaareetrisiteCuver)题目特征曲线是将一个题目的答对率和包括有这个题目的整份试卷所测量出来的能力值相联系起来的数学函数,即一个题目分数对能力的非线
性回归函数。
vi完成测试时间的充分性(Spededeness)
考生有充分的时间完成测试。他答错一个题目是因为他的能力有限,而不是因为时间不够,未能有机会去回答该题目。之所以这样认为,是因型,就能够更好地反映人的心理反应。
4项目反应理论的主要优点
由以上分析可得出项目反应理论的优点如下:
①考生能力的估计值和所施测的项目无关。若有一个很大的题库,其中的题目符合项目反应模型,且项目参数已知,则考生能力的估计值是和所实施的项目无关的,也就是指考生对于这些项目中的任何一部分的反应,估计出来的考生能力值都在同一量表上,具有可比性。项目反应的这只待点为参加不同测验的考生的能力比较提供了基础,适合编制计算机化的自适应测试;
②项目参数的估计值与考生样本组无关。这意味着拿同一批项目对同一全域中不同考生样组进行测验,其项目分析的结果是一样的。这一性质称为项目参数不变性。这为题库建设提供了极大的便利。在经典测试理论中,这是完全不可能的事情。在IRT中,因为某一给定能力的考生答对某个项目的概率并不取决于位于该能力水平的考生人数(即考生样组的组成情况),而仅仅取决于该考生个人的能力水平;
③可以提供考生能力估计值的精确度指标,且在测验前就可知道各个测验项目对于不同能力考生的估计精确度,这对测验的编制者是十分重要的。在且n,中,由于去掉了信度这一经典测验理论中的基本概念,无法找到平行测验的难题就消失了;
④在IRT中,考生能力和项目难度在同一量表中,这为测验的编制、测验分数报告和解释提供了便利。
其中:i第i个题目的区分度
三参数模型为
只(0)=`,+(l一c;)eDa,(夕一吞,)l+eDa(口一氏)式3.3
其中:`,第i个题目的猜测系数
由特征函数可画出题目的特征曲线,下图为三参数模式的特征曲线:
图中横坐标表示考生的能力值,称为能力量表,纵坐标表示考生的正答概率,称为概率量表。
从图3.2中可得出:
①a参数:即题目的区分度,在图中为特征曲线的斜率,它的值越大说明题目对受测者的区分程度越高;
②b参数:题目的难度,即特征曲线在横坐标上的投影;
③c参数:题目的猜测系数,即特征曲线的截跟,此值越大,说明不论受测者能力高低,都容易猜对本题目。3项目反应模型与经典测试模型的区别
二者的主要区别有以下几点:
①经典测验理论采用的是线性模型,项目反应理论采用的是非线性模型;
②经典测验理论采用的是确定性模型,项目反应理论采用的是概率模型。由于人的心理活动的高度复杂性和灵活性,经典测验理论采用的确定性的线性模型显得过于简单和粗糙,而项目反应理论采用非线性的概率模
型,就能够更好地反映人的心理反应。
4项目反应理论的主要优点
由以上分析可得出项目反应理论的优点如下:
①考生能力的估计值和所施测的项目无关。若有一个很大的题库,其中的题目符合项目反应模型,且项目参数已知,则考生能力的估计值是和所实施的项目无关的,也就是指考生对于这些项目中的任何一部分的反应,估计出来的考生能力值都在同一量表上,具有可比性。项目反应的这只待点为参加不同测验的考生的能力比较提供了基础,适合编制计算机化的自适应测试;
②项目参数的估计值与考生样本组无关。这意味着拿同一批项目对同一全域中不同考生样组进行测验,其项目分析的结果是一样的。这一性质称为项目参数不变性。这为题库建设提供了极大的便利。在经典测试理论中,这是完全不可能的事情。在IRT中,因为某一给定能力的考生答对某个项目的概率并不取决于位于该能力水平的考生人数(即考生样组的组成情况),而仅仅取决于该考生个人的能力水平;
③可以提供考生能力估计值的精确度指标,且在测验前就可知道各个测验项目对于不同能力考生的估计精确度,这对测验的编制者是十分重要的。在且n,中,由于去掉了信度这一经典测验理论中的基本概念,无法找到平行测验的难题就消失了;
④在IRT中,考生能力和项目难度在同一量表中,这为测验的编制、测验分数报告和解释提供了便利。
第二节计算机化自适应考试
在传统考试中,对于每个考生而言,题目中只有一部分是符合自己真正能力的,其余的题目要么简单,要么过难。由于项目反应理论具有参数不变性,不受受测样本影响,同时可以根据题目的信息量,选择难度与受测者能力相匹配的题目。依此理论为指导,建立计算机化自适应考试CAT(Co娜uter让edAd叩itveTest)系统是可行的。
AT是指在以TR理论为基础建立起来的题库之上,不断地根据题目的各方面信息和受测者的答题隋况估计受测者的能力,然后从题库中选取符合受测者能力的题目进行测试,直到达到预定的精度要求,即可结束测试。整个过程框图如下:


炼狱火海 发表于 2014-4-3 11:20:21

只是本着“看贴(虽然看不懂)回贴,利人利己的中华民族优秀传统美德”,顺便赚点积分。
页: [1]
查看完整版本: 项目反应理论 - 基于Intrnt的机械设计辅助教学系统初步研究