【考研类试卷】教育心理学心理统计与心理测量（心理测量的基本理论）-试卷2及答案解析.doc

资源描述

1、教育心理学心理统计与心理测量（心理测量的基本理论）-试卷 2及答案解析(总分：50.00，做题时间：90 分钟)一、简答题(总题数：8，分数：16.00)1.如何理解心理测验的特点?（分数：2.00）_2.简述 CCT对实得分数、真分数和测验误差的假定。（分数：2.00）_3.什么是测量的信度?影响信度的因素有哪些?（分数：2.00）_4.什么是测量的效度?影响效度的因素有哪些?（分数：2.00）_5.什么是内容效度?测验编制者和使用者应怎样把握内容效度?（分数：2.00）_6.简述标准参照测验的项目分析。（分数：2.00）_7.确定常模团体时应注意些什么?（分数：2.00）_8.简述经典测验

2、理论的优缺点。（分数：2.00）_二、论述题(总题数：2，分数：4.00)9.心理测量的误差来源主要包括哪些?（分数：2.00）_10.试论述项目反应理论和概化理论。（分数：2.00）_三、多项选择题(总题数：15，分数：30.00)11.与经典测量理论的真分数模型有关的假设是( )。（分数：2.00）A.真分数和观察分数之间的相关为零B.真分数和误差分数之间的相关为零C.各平行测验上的误差分数之间相关为零D.多次观察分数之和接近真分数12.信度是指测验结果的( )。（分数：2.00）A.可靠性B.有效性C.特殊性D.一致性13.如一个测验难度太低，测验分数会出现( )。（分数：2.00）A.

3、地板效应B.天花板效应C.聚在高分端D.分数分布太窄14.分析被试对测验项目的反应的统计方法，主要包括( )。（分数：2.00）A.信度B.效度分析C.难度分析D.鉴别力分析15.在鉴别力分析中，主要的估计指标包括( )。（分数：2.00）A.项目的通过率B.项目与测验总分的相关C.项目间的相关D.没有回答该项目的比例16.下列情况哪些是系统误差( )。（分数：2.00）A.在测验分数公布之后，发现制定的标准答案出了错误B.读卡机选择题的程序中少编进了最后一道小题C.阅卷老师身体不适D.有几张数学考卷中，小数点印刷不清17.经典测量理论的基本思想是把任何一个测验成绩都看作是( )的和。（分数：

4、2.00）A.真分数和系统误差B.真分数和随机误差C.真分数、随机误差和系统误差D.有效变异数、系统误差和随机误差18.测验实施中的干扰因素有( )。（分数：2.00）A.主试者的因素B.被试者的影响因素C.对于效标效度，测量与效标二者实施间隔时间没有什么意义D.有第三因素的影响19.根据经典测量理论，常用的测验等值方法有( )。（分数：2.00）A.全距等值B.等百分位等值C.线性等值D.方差等值20.某项测验中，绝大部分题目的难度值 P较大，那么被试的分数( )。（分数：2.00）A.集中在高分端B.平均数小于中数C.中数小于众数D.分布呈现负偏态21.项目的难度水平( )。（分数：2.0

5、0）A.对于选择题来说，P 值应接近 050，而各题难度在 0502 之间B.对于是非题来说，P 值为 075 最合适C.对于是非题来说，P 值为 060 最合适D.对于是非题来说，P 值为 063 最合适22.项目的区分度的计算方法之一是( )。（分数：2.00）A.鉴别指数且常以测验总分代替B.将按所侧总分数的 27的比例分别抽选确定为高分组与C.计算鉴别指数，D0，D 越大，区分高低分组的程度越高D.计算鉴别指数，D0，D 越大，区分高低分组的程度越低23.发展顺序量表( )。（分数：2.00）A.是根据儿童的心理特质(如智力、技能等)随着成长时间以有规律的方式发展进行评估的发展常模B.

6、格塞尔发展程序表即是其中之一C.可按月份显示儿童在运动水平、适应性、语言、社会性方面评估的大致发展水平D.可显示智力年龄24.信度的指标表示方法有( )。（分数：2.00）A.信度系数，即真分数方差与实得分数的方差的比值B.信度指数，其平方即是信度系数C.测量标准误，其与信度呈负相关D.标准分数25.如果间隔一段时间对某测验的两个复本再进行信度评估( )。（分数：2.00）A.称为重测复本信度B.稳定与等值系数C.是更为严格和更为广泛的应用D.没有应用价值教育心理学心理统计与心理测量（心理测量的基本理论）-试卷 2答案解析(总分：50.00，做题时间：90 分钟)一、简答题(总题数：8，分数：

7、16.00)1.如何理解心理测验的特点?（分数：2.00）_正确答案：(正确答案：(1)心理测量的间接性。研究者无法直接测量人的心理，只能测量人的外显行为，也就是说只能通过一个人对测量题目的反应来推论他的心理特质。 (2)心理测量的相对性。在对人的行为做比较时没有绝对的标准，也就是没有绝对的零点，有的只是一个连续的行为序列。所谓测量，就是看每个人处在这个序列上的什么位置。 (3)心理测量的客观性。测量的客观性实际上就是测量的标准化问题。首先，测量用的题目或作业、施测说明、施测者的言语态度及施测时的物理环境等均要经过标准化；其次，评分、计分的原则和手续要经过标准化；最后，分数的转换和解释都要经过

8、标准化。)解析：2.简述 CCT对实得分数、真分数和测验误差的假定。（分数：2.00）_正确答案：(正确答案：CCT 对实得分数、真分数和测验误差的假定： (1)实得分数与真分数存在线性关系。这种线性关系可以用一个简单的公式表达出来，即：XTE，式中 X表示实得分数或观测分数，即某被试在一个测验形式上的得分；T 表示真分数；E 表示测验误差，即在测验某一具体形式上产生的随机误差。 (2)测验误差的期望值为 0。或误差的平均数为 0，即：E(E)0，即针对一组被试而言的，对一组被试，其测验误差的和为。平均数也为 0。由上面两个假定可得一组被试真分数的平均数与实得分数的平均数相等。 (3)误差的真

9、分数独立。E 是测验中产生的随机误差，只与偶然因素有关，而与真分数 T的大小无关，也就是说，测验误差并不随被试能力或心理特质水平的变化而出现有规律的变化，即真分数与误差分数的相关系数为 0。用 YTE表示被试真分数与误差分数的相关系数，则有 r TE 0，该式也可表示真分数与误差的协方差为 0，即 Cov(T，E)0。 (4)实得分数方差等于真分数方差与随机误差方差之和。若以表示实得分数方差，以表示真分数的方差，以表示误差方差，则有 )解析：3.什么是测量的信度?影响信度的因素有哪些?（分数：2.00）_正确答案：(正确答案：(1)信度是指测量的一致性或可靠性程度，是测量结果的稳定性程度

10、。 (2)影响信度的因素：受试者方面。就单个被试而言，其身心健康状况、动机、注意力、持久力、求胜心、作答态度等会影响测量误差。就团体被试而言，整个团体内部水平的离散程度以及全体的平均水平相差不大时，其得分分布必定会较窄，以相关为基础计算出来的信度值必然会小，这时有可能低估真正的信度值。此外，若团体的平均水平太高或太低，同样会使测验总分的分布变窄，低估测量的真正信度。主试者方面。不按规定实施测验，制造紧张气氛，给以特别协助，评分主观等。测验内容方面。试题取样不当，内部一致性低，题数过少，题意模糊等。施测情景方面。测验现场条件，如通风、温度、光线、噪音、桌面好坏、空间宽窄等。测量工具方面

11、。试题的取样、试题之间的同质性程度、试题的难度等都是影响测验稳定性的主要因素。如果一个试题的试题取样不当，则难以测查到被试心理特质的全面情况。若是被试采取押题方式应考，则所得结果的随机性更大。这时测量的信度就必然不高。相反，当一份测验中的同质性的题目数量增多之后，同一心理特质被考查到的次数就会增多，被试的成绩也就能被有效地拉开，整个团体的测验分数分布就会更广，从而提高测量的信度。如果一个测验的话题取样不当，则无法使测量的内部一致性系数提高。如果测验的题目太难，则会引起被试的随机猜答，并使得大部分人的得分偏低，整个分数的分布变窄，从而影响测量的信度。如果题目太容易，则大部分被试都将获得高分

12、，这同样会使测验分数的分布变窄，影响测量的信度。间隔时间。以再测法或复本法求信度，两次测验相隔时间越短，其信度系数越大，间隔时间越久，其他变异介入的可能性越大，受外界的影响越多，信度系数便越低。)解析：4.什么是测量的效度?影响效度的因素有哪些?（分数：2.00）_正确答案：(正确答案：(1)效度是指测量的正确性，即一个测验或量表能够测量出其所要测量的东西的程度。效度要回答的两个基本问题是：一个测验测量什么性质?它所要测量的特性测得有多准?在选用标准测验或自行设计编制测量工具时，必须首先评鉴其效度，考虑其目的和功能，检验所测的结果是否符合该测验的目的。 (2)效度的影响因素：测验组成方面。

13、试题是构成测验的要素，测验之效度取决于试题性能。凡测验的取材、测验长度、试题的区分度、难度及其编排方式等皆与效度有关。要想提高测验的效度，须谨慎选择测验材料，适当安排测验的长度，使试题具有相当的鉴别力而且难易程度适中。测验实施方面。测验的实施程序是影响效度的重要因素。若主试能适当控制测验情境，遵照测验手册的各项规定而实施，就能避免外在因素对测验结果的影响。在测验实施的过程中，如果场地的布置、材料的准备、作答方式的说明、时间的限制等任何一方面不遵照标准化的程序进行，都会使效度降低，失去测验的意义。被试反应方面。被试的兴趣、动机、情绪态度和身心健康状况等，都能影响他在测验情境中的行为反应。被试

14、是否充分合作，也会影响测验结果的可靠性与正确性。所选效标的性质：由于同一个测验可以有不同的效标，同一个观念效标也可以有不同的效标测量，所以在评价测量效标时，所选效标的性质是很重要的考虑因素。)解析：5.什么是内容效度?测验编制者和使用者应怎样把握内容效度?（分数：2.00）_正确答案：(正确答案：(1)内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。而所要测量的内容或行为领域是依据测量的目的而定的，它通常包括预测的知识范围以及该范围内各种知识点所要求掌握的程度两方面。 (2)应用范围：内容效度主要应

15、用于成就测验，某些用于选拔和分类的职业测验，但是不适合用于能力倾向测验和人格测验，还要避免与表明效度(某个测验从表明上看好像实测某种心理特质的一种现象)相混淆。内容效度的确定方法主要是逻辑分析法，其具体步骤是：明确欲测内容的范围，包括知识范围和能力要求两个方面，这种范围的确定必须具体详细，并要根据一定目的规定好各纲目的比例。确定每个题目所测的内容，并与测验编制上所列的双向细目表相对照，逐题比较自己的分类与制卷者的分类并做记录。制定评定量表，考查题目对所定义的内容范围的覆盖率，判断题目难度与能力要求之间的差异，还要考查各种题目数量和分数的比例以及题目形式对内容的适当性等，对整个测验的有效

16、性作出总的评价。此外，克伦巴赫(Cronbach)还提出过内容效度的统计分析方法。其具体方法是：从同一个教学内容总体中抽取两套独立的平行测验，用这两个测验来测同一批被试，求其相关。若相关低，则两个测验中至少有一个缺乏内容效度；若相关高，则测验可能有较高的内容效度。还有一种判断内容效度的方法就是再测法，其操作过程是：在被试学习某种知识之前做一次测验，在学过该知识后再做同样的测验，这时，若后测成绩显著地优于前侧成绩，则说明所测内容正是被试新近所学内容，进而证明该测验对这部分内容而言具有较高的内容效度。)解析：6.简述标准参照测验的项目分析。（分数：2.00）_正确答案：(正确答案：(1)难度分析

17、。所谓难度，就是测验项目的难易程度。一个项目的难度大小，除了与所测内容本身的难易程度有关以外，还与测验的编制技术和被试的知识经验有关。标准参照测验可以采用常模参照测验的方法来计算难度，但是在筛选题目时，对难度水平的要求与常模参照测验不同。对于是非题、选择题等采用二分法记分的项目，难度通常用通过率来表示，即以答对或通过该题的人数的百分比作为指标：P 100 式中 P为项目的通过率，R 为答对或通过该项目的人数，N 为全体被试人数。用通过率代表难度时，P 值越大其难度越小，P 值越小其难度越大。当被试人数较多时，可以先将被试依照测验总分从高到低排列，然后将总分最高的 27和最低的 27的被试

18、定位高分组和低分组，分别计算两组在某一项目上的通过率。最后用下式计算该项目的难度： p 式中，P H 、P L 分别为高分组与低分组的通过率。在选择题中，由于允许猜测，备选答案数目越少，机遇的作用越大，就越不能反映题目的真实难度。为了平衡机遇对难度的影响，可用下面的公式校正： CP 式中，CP为校正后的通过率，P 为实得通过率，K 为备选答案数目。对于论述题等不用二分法记分的项目，常常用下面的公式来计算难度： P )解析：7.确定常模团体时应注意些什么?（分数：2.00）_正确答案：(正确答案：(1)群体构成的界限必须明确。在确定常模团体时必须清楚地说明所要测量的群体的性质与特征。因而，若

19、群体过大，群体内部也需有许多小团体，他们在一个测验上的表现也时常有差异，假如这种差异较为显著，就必须对每个小团体分别建立常模。 (2)常模团体必须是所测群体的一个代表性样本。当所要测量的群体较小时，将所有的被试逐个测量以得到常模。在群体较大时，则不可能如此，只能测量一部分被试作为群体的代表，此时就存在取样是否具有代表性的问题。如果常模团体缺乏代表性，将会使常模资料产生偏差，从而影响到测验结果解释的准确性。为了克服取样偏差，保证具有代表性，一般在抽样时应遵循随机化原则，采用统计学的方法抽取样本。 (3)取样的过程必须明确且有详尽的描述。目的是为了使测验的使用者不致于误用测验和错误的解释测验结果。

20、 (4)样本大小要适当。在决定样本大小时应注意总体的数目。总体数目小，则样本可相应小一些，但不应过小，若总体过小，则可能将全部被试入选；当总体较太时，相应的样本也大。 (5)群体的性质。如果群体性质单一，则样本不必太大；若群体性质复杂，则样本容量就应大一些。 (6)测验结果的精确度：根据统计学原理，降低抽样误差，必须加大样本容量。 (7)常模团体必须是近时的。建一个常模不能一劳永逸。 (8)注意一般常模与特殊常模的结合。)解析：8.简述经典测验理论的优缺点。（分数：2.00）_正确答案：(正确答案：(1)经典测验理论的优点：经典测验理论以随机抽样理论为基础，建立在简单的数学模型之上，其理论直

21、观易懂，易于被人理解和接受，且计算简便容易推广。理论假设较弱，对实施条件要求不严格，适用性广，不论客观性测验还是主观性测验、单维测验还是多维测验，对其结果都能方便地予以分析。在多数情况下经典测验理论是足够精确的，测验结果是可信的。 (2)经典测验理论的缺点：经典测验理论信度估计精度不够。根据真分数理论假设，测验原始分数 X线性分解为测验真分数 T和误差分数 E两部分，并且进一步假设真分数是测验原始分数的期望，误差分数与真分数相互独立，从而导出测验信度为真分数方差与原始分方差之比。但是，在这个定义中除原始分数方差可以获得以外，真分数方差与误差分数方差都是没有途径获得的。为了实际估计测验信度

22、，经典测验理论提出了平行测验概念或者条件弱一点的等价测验概念，从而推演出若干信度估计公式。但是，严格的平行测验是不存在的，等价的测验也是很难获得的，由此造成了实际估计的信度精度就比较差。基本假设难以成立。真分数与观测分数之间存在线性关系的假定不合理；平行测验的假设难以成立；误差与真分数独立的假设难以满足。项目统计量严重依赖于被试样本，但被试样本的能力水平不同时，项目的难度和区分度就不同。对被试能力的估计依赖于测验题目的难度。对测验值、适应性测验、标准参照测验的编制等问题不能给以满意的解决。)解析：二、论述题(总题数：2，分数：4.00)9.心理测量的误差来源主要包括哪些?（分数：2.0

23、0）_正确答案：(正确答案：(1)测量的随机误差来源：与施测过程有关的误差： a物理环境：如施测现场的温度、光线、声音、桌面好坏、空间宽窄等； b主试者方面：主试者的年龄、性别、外表、施测时的言谈举止、表情动作等； c意外干扰； d评分的不客观和计分的出错等。由受测者本身引起的误差： a测验的经验如受测者对测验的程序和技能的熟悉程度。 b练习因素：任何一个测验在第二次应用时，都会有练习效应而使成绩提高。在能力测验方面，对于智力较高者练习效果较为显著。着重速度的测验，练习效果较明显。再做同一个测验比做复本的练习效果明显。两次测验之间的时距越大，练习效果越小，相距 3个月以上，练习效果可忽略不

24、汁。 c应试动机：被试的动机会引起偶然的不稳定的反应，造成随机误差。 d测验焦虑：是指受测者在应试前和测试中出现的一种紧张的不愉快的情绪体验，对测验的焦虑会影响被试的成绩。 e定势反应：也称反应的方式或反应风格，是指独立于测验内容的反应倾向，即由于每个人回答问题习惯的的不同，而使有相同能力的被试获得不同的分数。 f生理因素：如生病、疲劳、失眠等生理因素也会影响测验成绩。 (2)测量的系统误差来源及控制。测量的系统误差主要来源是题目取样的不当：当测验题目较少或取样缺乏代表性时，被试的反应受机遇影响较大，当几个测验复本不等值时，接受不同的题目，就会获得不同的分数。其来源还有题目用词的模棱两可，对反

25、应步骤说得不清，题目过难引起猜测，时间短使被试仓促作答等。)解析：10.试论述项目反应理论和概化理论。（分数：2.00）_正确答案：(正确答案：(1)项目反应理论：含义。项目反应理论又称项目特征曲线理论，或潜在特质理论，是近 20年来在西欧和北美各国教育与心理测量领域里得以迅速发展和广泛应用的一种新的教育和测量理论，它指出了个体某些特征与个体某种反应类型的概率之间的关系。在项目反应理论中，“潜在特质“是一个重要概念。所谓特质，是指被试某种相对稳定的、支配其相应的测验做出反应并使反应表现出一致性的内在特质。由于特质是不能直接观察到的，所以人们通常称之为潜在特质。项目反应理沦就是要研究被试的这种

26、特质与其对项目的反应之间的关系。特点： a测量指标与被式的潜在特质联系在一起。 b用数学函数确定项目特征参数。 c通过项目信息函数来推算测量信度和标准误。项目信息函数以所有项目参数作为基础，表示出测验项目对于不同潜在特质的测量效力，项目反应理论即以此来推算测量的信度和标准误，为测量指标提供稳定的测量参数。 d在项目水平上进行分析。项目反应理论不是在测验的水平上建立测量模型，而是在项目水平上做出分析，并运用定量化的项目与能力参数，对项目反应作出定性解释。项目反应基本假设： a知道一正确假没。如果被试知道试题的正确答案，他将做出正确的答应或回答；如果被试答错了题或者对试题做了错误的反应，我们则

27、认为他不知道这个题的正确答案。但是这个假设的逆命题在项目反应理论中并不成立，即没有以下的假设：如果被试做对了试题或给出了正确的答案，他一定知道试题的答案。 b局部独立性。被试对某题作出正确反应的概率与对其他题的反应无关，即只有潜在特质才影响对项目作出的反应，因此假设中的“局部”是指对固定的特质水平成值。这个假设告诉我们，在测验问题中，如果前一个项目的内容为后一个项目的正确反应提供了暗示或其他有效的信息，局部独立性假设就会遭到破坏。 c关于潜在特质空间的纬度。在项目反应理论中，所谓几维潜在特质空间；是指有几个潜在特质组成的集合。项目反应理论的主要方法就是借助于一定的数学模型，在测得的数据与被试

28、的特质之间建立某种函数关系，以确定值和其他特征值。目前，项目反应理论通常假设潜在特质空间是一维的，即被试的反应结果只取决于一种特质(即单个值)。 d项目特征曲线的形式。项目反应理论的一个关键是在被试对项目做出的反应与被测试者的潜在特质之间建立某种函数关系，即所谓项目特征曲线就是相应函数的图像。项目反应理论关于项目特征曲线的假设主要有三点：第一，曲线的下端渐近线。如果某项目能够凭猜测做出正确反应的概率为 C o (即猜测参数值)，那么项目特征曲线的下端渐近线为 YC o ，这里的 Y指坐标系中的纵坐标，其含义为对项目做出反应的概率，即 P()。如果假设在测验中不存在猜测因素的作用，则取 C

29、o 0，那么项目特征曲线以 YO(即 P()0)为其下端渐近线。第二，曲线的上端渐近线。通常假设曲线上端渐近线为 P()1(Y1 时)，是指当值足够大时，被试的正确反应率趋近于 1。第三，曲线的升降线。项目反应理论假定曲线严格单调上升，即仅存在一个曲变点(又称拐点，曲线在此处的一阶导数为零)。项目反应理论的模型与应用：主要的项目反应理论模型有：双参变数的常态奥吉夫模型、双参变数的逻辑斯谛模型、三参变数的逻辑斯谛模型、单参数的逻辑斯谛模型。项目反应理论在心理与教育科学研究中主要应用于测验中的项目分析、成绩评估量表的设计、态度问卷的设计、题库的设计等。 (2)概化理论：含义。概化理论(

30、简称GT)运用方差分析技术将来自不同测量条件的误差分解，从而选择合理的测验设计方案以减少误差，提高测量的精度。它与项目反应理论一起被称为现代测验理论，代表了测验理论发展的一大趋势。概化理论的基本框架： a测量的目标与测量的面。测量的目标是指所要测量的心理特质，如被试的阅读理解能力等；测量面是指测量的一组条件，也就是影响测量过程和测量结果的各种情景。在测量时，我们总希望由测量目标所引起的测验结果的变异达到最大，而由测量面所弓起的变异最小。一个测量面类似于方差分析的一个自变量，也有不同水平。概化理论把每个测量面的水平所对应的总体叫做测量的全域。测量的面还有随机和固定之分，固定面指的是面的各个水平

31、都是固定的，在以后的测量中不再变化，当测量面固定时，一次测验的结果就可以直接推广到另一次测验中去。随机面是指在每一次测量中面的水平都是随机选取的，因此测量的条件都不会相同。一旦一个面固定了，它就成为测量目标的一部分，固定面不再属于误差的来源。随着固定面的增多，测量误差来源就会变少，测量的信度就会提高。如果测量的所有面都固定了，测量的误差虽然达到了最低限度，但测验也失去了任何可推广的余地。因这种测验是完全标准化的，测验结果只能在标准化条件下进行解释和应用，离开了这一标准化的条件，测验结果也就失去了意义。b测量的设计。概化理论的研究中首先要按照一定的测量设计方案安排测验，并对收集到的资料进行方差

32、分析，分解出各种误差成分。测量的设计有交叉的、嵌套的和混合的。交叉设计。是指一个测量面所有水平与另一个测量面或测量目标的每一个水平都发生了关系，比如在一次测量中所有的评分员(r)都对试题(i)进行了评定，则评分员与试题就是交叉的，交叉设计可记为 pi。嵌套设计。是指一个测量面或测量目标只与另一个面或测量目标的部分水平发生了关系。如在一次测验，n 各被试每人都做了 n个不同的测题，则称被试与测题是嵌套安排的，即为 i：P，即试题 i嵌套于被试 P中。混合设计。当一个设计中既有交叉关系又有嵌套关系，这一设计就是混合设计。如 10名被试都做了全部的试题，但每个评分员只对两个被试的全部试题评分，

33、因而被试是嵌套于评分员之中的，而被试与试题又是交叉的，这一设计就是交叉设计，记为 i(p：r)。 cG 研究与 D研究。概化理论一般分为两步进行，即先进行 G研究，再进行 D研究。G 研究就是通过 G研究的设计，借助于方差分析技术将误差分解，估计出不同来源的方差成分的大小。D 研究即决策研究，常包括以下内容：首先，确定推广全域，它是指研究者要将 G研究中的结论在哪些面上推广，及推广到这些面的哪些水平上去，即推广的范围。其次，确定 D研究面水平的取样的大小。最后是确定 D研究的设计。D 研究的设计也可采用 G研究中的三种设计。 d信度的估计。与经典测验理论中的信度指标一样，概化理论也给出表示测验

34、结果可靠性的指标，常用的有概化系数与依存性系数。)解析：三、多项选择题(总题数：15，分数：30.00)11.与经典测量理论的真分数模型有关的假设是( )。（分数：2.00）A.真分数和观察分数之间的相关为零B.真分数和误差分数之间的相关为零 C.各平行测验上的误差分数之间相关为零 D.多次观察分数之和接近真分数解析：12.信度是指测验结果的( )。（分数：2.00）A.可靠性 B.有效性C.特殊性D.一致性解析：13.如一个测验难度太低，测验分数会出现( )。（分数：2.00）A.地板效应B.天花板效应 C.聚在高分端 D.分数分布太窄解析：14.分析被试对测验项目的反应的统计方法，主要

35、包括( )。（分数：2.00）A.信度B.效度分析C.难度分析 D.鉴别力分析解析：15.在鉴别力分析中，主要的估计指标包括( )。（分数：2.00）A.项目的通过率 B.项目与测验总分的相关 C.项目间的相关D.没有回答该项目的比例解析：16.下列情况哪些是系统误差( )。（分数：2.00）A.在测验分数公布之后，发现制定的标准答案出了错误 B.读卡机选择题的程序中少编进了最后一道小题 C.阅卷老师身体不适D.有几张数学考卷中，小数点印刷不清解析：17.经典测量理论的基本思想是把任何一个测验成绩都看作是( )的和。（分数：2.00）A.真分数和系统误差B.真分数和随机误差 C.真分数、随机

36、误差和系统误差D.有效变异数、系统误差和随机误差解析：18.测验实施中的干扰因素有( )。（分数：2.00）A.主试者的因素 B.被试者的影响因素 C.对于效标效度，测量与效标二者实施间隔时间没有什么意义 D.有第三因素的影响解析：19.根据经典测量理论，常用的测验等值方法有( )。（分数：2.00）A.全距等值B.等百分位等值 C.线性等值 D.方差等值解析：20.某项测验中，绝大部分题目的难度值 P较大，那么被试的分数( )。（分数：2.00）A.集中在高分端 B.平均数小于中数 C.中数小于众数D.分布呈现负偏态解析：21.项目的难度水平( )。（分数：2.00）A.对于选择题来说，

37、P 值应接近 050，而各题难度在 0502 之间 B.对于是非题来说，P 值为 075 最合适 C.对于是非题来说，P 值为 060 最合适D.对于是非题来说，P 值为 063 最合适解析：22.项目的区分度的计算方法之一是( )。（分数：2.00）A.鉴别指数且常以测验总分代替 B.将按所侧总分数的 27的比例分别抽选确定为高分组与C.计算鉴别指数，D0，D 越大，区分高低分组的程度越高 D.计算鉴别指数，D0，D 越大，区分高低分组的程度越低解析：23.发展顺序量表( )。（分数：2.00）A.是根据儿童的心理特质(如智力、技能等)随着成长时间以有规律的方式发展进行评估的发展常模 B.格塞尔发展程序表即是其中之一 C.可按月份显示儿童在运动水平、适应性、语言、社会性方面评估的大致发展水平 D.可显示智力年龄解析：24.信度的指标表示方法有( )。（分数：2.00）A.信度系数，即真分数方差与实得分数的方差的比值 B.信度指数，其平方即是信度系数 C.测量标准误，其与信度呈负相关 D.标准分数解析：25.如果间隔一段时间对某测验的两个复本再进行信度评估( )。（分数：2.00）A.称为重测复本信度 B.稳定与等值系数 C.是更为严格和更为广泛的应用 D.没有应用价值解析：

展开阅读全文