1、考研心理学统考心理学专业基础综合(心理统计与测量)-试卷 9 及答案解析(总分:66.00,做题时间:90 分钟)一、单选题(总题数:18,分数:36.00)1.单项选择题(分数:2.00)_2.在概括理论中,所有影响得分的条件因素称为(分数:2.00)A.测量目标B.全域分数C.观测全域D.测量侧面3.关于概化系数(E 2 )和可靠性系数()描述正确的是(分数:2.00)A.E 2 和可靠性系数是一个系数的两种说法B.E 2 解释常模参照测验分数较为恰当, 解释标准参照测验分数较为恰当C.E 2 解释标准参照测验分数较为恰当, 解释常模参照测验分数较为恰当D.E 2 中包含了绝对误差方差,
2、中包含了相对误差方差4.在概化理论研究中,研究者依据观测全域对所有侧面和测量目标以及它们之间的交互作用作方差分量的估计,这个估计过程被称为(分数:2.00)A.概化研究B.决策研究C.推断研究D.潜在特质研究5.“凡是客观存在的事物都有其数量”的观点为心理测量的可能性提供了支持。提出者是现代心理测量学创始人(分数:2.00)A.波林B.推孟C.桑代克D.麦柯尔6.命名量表不适合进行统计的是(分数:2.00)A.百分比B.计算频次C.卡方检验D.求中位数7.孔子曾说:“不得中行而与之,必也狂狷乎?狂者进取,狷者有所不为也。”这里把人分成狂者、中行和狷者,实际上相当于测量学中的(分数:2.00)A
3、.称名量表B.顺序量表C.等距量表D.比率量表8.测验题目的区分度和难度有一定关系,一般来说区分度较大的项目,其难度越接近于(分数:2.00)A.0B.05C.08D.19.下面哪一个不属于项目的区分度的指标(分数:2.00)A.鉴别指数 DB.测验题目和总分的二列相关C.测验题目和总分的点二列相关D.测验题目的通过率10.关于测验题目区分度的说法正确的是(分数:2.00)A.项目鉴别指数法大于 02 的题目一般可以保留B.各种方法计算出的区分度可以相互比较C.区分度的大小与样本特点无关D.项目鉴别指数不会受被试分组影响11.在确定问卷中的题目是否保留时,符合下列哪种情况的题目最易被保留(分数
4、:2.00)A.难度值越大的题目B.区分度值越大的题目C.难度越小的题目D.区分度越小的题目12.在真分数理论中,真分数意味着(分数:2.00)A.欲测量的心理品质B.包含随机误差的欲测心理品质C.包含系统误差的欲测心理品质D.包含随机和系统误差的欲测心理品质13.用两个平行或等值的测验,间隔适当时距施测于同一组被试得到两组测验分数,求这两组测验分数的相关,其相关系数就是(分数:2.00)A.复本信度B.重测信度C.评分者信度D.内部一致性信度14.使用同一测验间隔适当时距施测于同一组被试得到两组测验分数,所得的相关系数是(分数:2.00)A.复本信度B.重测信度C.评分者信度D.内部一致性信
5、度15.下列信度系数里面,能反映测验的时间取样误差的是(分数:2.00)A.重测信度B.内部一致性系数C.分半信度D.评分者信度16.使用因素分析法鉴定所测的心理特质,获得的是测验的(分数:2.00)A.内容效度B.表面效度C.结构效度D.效标效度17.下列中不是真正效度的是(分数:2.00)A.内容效度B.结构效度C.表面效度D.效标效度18.基于测验所做出的预测是否能被证实的效度验证属于(分数:2.00)A.内容效度B.表面效度C.结构效度D.效标效度二、多选题(总题数:10,分数:20.00)19.下列量表中,不具有绝对零点的是(分数:2.00)A.称名量表B.顺序量表C.等距量表D.比
6、率量表20.测量的基本要素包括(分数:2.00)A.参照点B.量表C.行为样本D.单位21.对其度量的数据可进行积差相关系数计算的量表是(分数:2.00)A.称名量表B.顺序量表C.等距量表D.比率量表22.心理测验应当具备的基本条件包括(分数:2.00)A.行为样本B.标准化C.难度D.信度和效度23.关于真分数模型表述正确的是(分数:2.00)A.该模型未能区分各种测量误差B.该模型对样本具有依赖性C.该模型以弱假设为基础,这些假设容易验证D.该模型忽视了被试的反应组型24.主要误差来源是内容取样的信度估计方法有(分数:2.00)A.重测信度B.分半信度C.等值性系数D.同质性信度25.时
7、间取样是误差来源的信度估计方法有(分数:2.00)A.重测信度B.稳定性与等值性系数C.分半信度D.同质性信度26.因评分者人数不同和评价对象人数不同而使用的不同的计算评分者信度的方式有(分数:2.00)A.积差相关B.等级相关C.肯德尔和谐系数D. 2 检验27.实证效度包括(分数:2.00)A.效标关联效度B.同时效度C.预测效度D.表面效度28.区分度的计算方法有(分数:2.00)A.项目鉴别指数法B.相关法C.难度推算法D.Z 检验法三、简答题(总题数:5,分数:10.00)29.简述经典测量理论的优点与局限性。(分数:2.00)_30.什么是测验的效度?影响效度的主要因素有哪些?(分
8、数:2.00)_31.什么是内容效度?什么是结构效度?什么是效标关联效度?简述它们之间的关系。(分数:2.00)_32.简述提高测验效度的方法。(分数:2.00)_33.简述概化理论研究中 G 研究和 D 研究的含义及其研究内容。(分数:2.00)_考研心理学统考心理学专业基础综合(心理统计与测量)-试卷 9 答案解析(总分:66.00,做题时间:90 分钟)一、单选题(总题数:18,分数:36.00)1.单项选择题(分数:2.00)_解析:2.在概括理论中,所有影响得分的条件因素称为(分数:2.00)A.测量目标B.全域分数C.观测全域D.测量侧面 解析:解析:在概化理论中,测量目标是测量者
9、期待测量的心理特质。所有影响测验得分的条件因素是测量侧面。在实际观测过程中,测量目标依存的所有测量侧面条件全域的集合是观测全域。被试在具体测量条件某种潜在特质水平的分数是全域分数。因此本题选 D。3.关于概化系数(E 2 )和可靠性系数()描述正确的是(分数:2.00)A.E 2 和可靠性系数是一个系数的两种说法B.E 2 解释常模参照测验分数较为恰当, 解释标准参照测验分数较为恰当 C.E 2 解释标准参照测验分数较为恰当, 解释常模参照测验分数较为恰当D.E 2 中包含了绝对误差方差, 中包含了相对误差方差解析:解析:概化系数和可靠性系数都类似于经典测量理论中的信度系数,但二者的公式是不同
10、的。概化系数和可靠性系数的公式分别是: 4.在概化理论研究中,研究者依据观测全域对所有侧面和测量目标以及它们之间的交互作用作方差分量的估计,这个估计过程被称为(分数:2.00)A.概化研究 B.决策研究C.推断研究D.潜在特质研究解析:解析:在概化理论研究中,研究者依据观测全域对多由侧面和测量目标以及它们之间的交互作用作方差分量的估计,这个估计过程是概化研究,简称为 G 研究。在概化研究之后,研究者若对各测量侧面、测量目标以及它们之间的交互作用关系做出方差分量的再估计及推断性研究,这个研究过程被称为决策研究,简称为 D 研究。因此本题选 A。5.“凡是客观存在的事物都有其数量”的观点为心理测量
11、的可能性提供了支持。提出者是现代心理测量学创始人(分数:2.00)A.波林B.推孟C.桑代克 D.麦柯尔解析:解析:1918 年现代心理测量学创始人之一、美国心理学家爱德华.桑代克提出“凡是客观存在的事物都有其数量。”故本题选 C。6.命名量表不适合进行统计的是(分数:2.00)A.百分比B.计算频次C.卡方检验D.求中位数 解析:解析:由于命名量表只是对事物的类别进行赋值,相应的数据仅表示分类,因而不能求中位数。故本题选 D。7.孔子曾说:“不得中行而与之,必也狂狷乎?狂者进取,狷者有所不为也。”这里把人分成狂者、中行和狷者,实际上相当于测量学中的(分数:2.00)A.称名量表B.顺序量表
12、C.等距量表D.比率量表解析:解析:孔子对人的分类:狂者相当于外向的人、中行相当于中间型、狷者相当于内向的人。三种类别具有连续性质,可以按照顺序大小进行赋值。故本题选 B。8.测验题目的区分度和难度有一定关系,一般来说区分度较大的项目,其难度越接近于(分数:2.00)A.0B.05 C.08D.1解析:解析:测验项目的难度越接近于中间水平,即 05 左右,其区分能力越大。故本题选 B。9.下面哪一个不属于项目的区分度的指标(分数:2.00)A.鉴别指数 DB.测验题目和总分的二列相关C.测验题目和总分的点二列相关D.测验题目的通过率 解析:解析:测验题目的通过率表示了该题目的难度水平。故本题选
13、 D。10.关于测验题目区分度的说法正确的是(分数:2.00)A.项目鉴别指数法大于 02 的题目一般可以保留 B.各种方法计算出的区分度可以相互比较C.区分度的大小与样本特点无关D.项目鉴别指数不会受被试分组影响解析:解析:不同方法计算的区分度是不能直接比较的;区分度大小受样本群体的多少以及异质性程度的影响;使用项目鉴别指数作为区分度的指标时,是会受到被试分组大小的影响的。故本题选 A。11.在确定问卷中的题目是否保留时,符合下列哪种情况的题目最易被保留(分数:2.00)A.难度值越大的题目B.区分度值越大的题目 C.难度越小的题目D.区分度越小的题目解析:解析:在项目分析中,应保留难度值中
14、等、区分度较大的题目。故本题选 B。12.在真分数理论中,真分数意味着(分数:2.00)A.欲测量的心理品质B.包含随机误差的欲测心理品质C.包含系统误差的欲测心理品质 D.包含随机和系统误差的欲测心理品质解析:解析:经典测验理论或真分数理论假定实测分数中分为真分数和随机误差,而不区分欲测心理品质和系统误差。故本题选 C。13.用两个平行或等值的测验,间隔适当时距施测于同一组被试得到两组测验分数,求这两组测验分数的相关,其相关系数就是(分数:2.00)A.复本信度 B.重测信度C.评分者信度D.内部一致性信度解析:解析:本题考查了复本信度的概念。本题选 A。14.使用同一测验间隔适当时距施测于
15、同一组被试得到两组测验分数,所得的相关系数是(分数:2.00)A.复本信度B.重测信度 C.评分者信度D.内部一致性信度解析:解析:本题考查了重测信度的概念。本题选 B。15.下列信度系数里面,能反映测验的时间取样误差的是(分数:2.00)A.重测信度 B.内部一致性系数C.分半信度D.评分者信度解析:解析:重测信度表明测验在不同时间点施测的稳定性,反映了时间取样的误差。本题选 A。16.使用因素分析法鉴定所测的心理特质,获得的是测验的(分数:2.00)A.内容效度B.表面效度C.结构效度 D.效标效度解析:解析:因素分析法可以作为测验结构效度的验证方法。本题选 C。17.下列中不是真正效度的
16、是(分数:2.00)A.内容效度B.结构效度C.表面效度 D.效标效度解析:解析:表面效度是测验看起来所要测量的东西,并不是测验的真正效度。本题选 C。18.基于测验所做出的预测是否能被证实的效度验证属于(分数:2.00)A.内容效度B.表面效度C.结构效度D.效标效度 解析:解析:基于测验所做出的预测是否能被证实的效度是校标效度。本题选 D。二、多选题(总题数:10,分数:20.00)19.下列量表中,不具有绝对零点的是(分数:2.00)A.称名量表 B.顺序量表 C.等距量表 D.比率量表解析:解析:能够使事物的特征数量化的数字连续体就是量表。根据测量的不同水平以及测量中使用的不同单位和参
17、照点,可以将测量量表分为称名量表、顺序量表、等距量表和比率量表。称名量表只是用数字来代表事物或对事物进行分类。顺序量表给个体赋值,使数值的大小次序与个体在所测量的心理特性上的多少、大小、高低等的次序相符合。等距量表不仅能够指代事物的类表和等级,而且具有相等距离的测量单位,但等距量表没有绝对零点。比率量表是最完善的测量量表,它除了具有类别、等级和等距的特征外,还具有绝对零点。因此本题选 ABC。20.测量的基本要素包括(分数:2.00)A.参照点 B.量表C.行为样本D.单位 解析:解析:任何测量都必须具备的两个基本要素是参照点和单位。参照点是测量中量的起点。参照点有两种,一种是绝对参照点,即绝
18、对零点;一种是人定的参照点,即相对零点。理想的测量单位应该具备两个条件,一是要有确定的意义,二是要有相等的价值。因此本题选 AD。21.对其度量的数据可进行积差相关系数计算的量表是(分数:2.00)A.称名量表B.顺序量表C.等距量表 D.比率量表 解析:解析:适合于对称名量表进行统计分析的统计方法有百分比、次数、众数和卡方检验。适合于顺序量表的统计方法有中位数、百分位数、等级相关系数和肯德尔和谐系数。适合于对等距量表进行统计分析的统计方法有平均数、标准差、积差相关系数、等级相关系数以及 t 检验和 F 检验。适合于对比率量表进行统计分析的统计方法除了与等距量表相同外,还包括几何平均数和变异系
19、数的计算。因此本题选 CD。22.心理测验应当具备的基本条件包括(分数:2.00)A.行为样本 B.标准化 C.难度 D.信度和效度 解析:解析:一个心理测验应该具备四个基本条件:(1)行为样本。指从总体行为中抽取出来的、能够实际反映个人特定心理特质的一组行为,可以依据对这一组行为的测量结果推断其心理特质。(2)标准化。指测验编制、实施、记分以及测量分数解释程序的一致性。(3)难度或应答率。难度太低或太高都不能有效地将不同水平的个体区分开来,从而也不能保证测验的科学性。(4)信度和效度。评价一个测验是否科学的重要指标是它的信度和效度。信度指一个测验的可靠性,效度指一个测验的有效性。因此本题选A
20、BCD。23.关于真分数模型表述正确的是(分数:2.00)A.该模型未能区分各种测量误差 B.该模型对样本具有依赖性 C.该模型以弱假设为基础,这些假设容易验证 D.该模型忽视了被试的反应组型 解析:解析:真分数模型是以弱假设为基础的,因此这些假设容易验证并易于被绝大多数测验数据资料所满足。这是真分数模型的优点。同时真分数模型也存在若干局限性,如该模型未能区分各种测量误差,对样本具有依赖性,忽视了被试的反应组型等。具体解释详见简答题第 1 题。因此本题选 ABCD。24.主要误差来源是内容取样的信度估计方法有(分数:2.00)A.重测信度B.分半信度 C.等值性系数 D.同质性信度 解析:解析
21、:重测信度是使用同一个测验在不同时间施测两次,因此主要误差来源是时间取样。而分半信度、等值性系数(复本信度中的一种,复本测验是同时连续施测的)、同质性信度都会因测验内容而产生误差。对分半信度而言,将一个测验分成两半的方式有无数种,分半后两半测验就涉及同质性问题。对复本信度而言,需要构造两个平行测验,这也涉及内容取样带来的误差。对同质性信度而言,内容取样决定了测验题目是否测的是同一种心理特质。因此本题选 BCD。25.时间取样是误差来源的信度估计方法有(分数:2.00)A.重测信度 B.稳定性与等值性系数 C.分半信度D.同质性信度解析:解析:重测信度是在不同时间使用同一测验对同一组被试进行施测
22、,因此相隔时间的长短会影响信度的估计。稳定性与等值性系数是复本信度的一种,它与等值性系数的不同之处在于,两个复本测验是间隔一段时间分两次施测的,因此时间间隔是影响信度值的一个因素。因此本题选 AB。26.因评分者人数不同和评价对象人数不同而使用的不同的计算评分者信度的方式有(分数:2.00)A.积差相关 B.等级相关 C.肯德尔和谐系数 D. 2 检验 解析:解析:当评分者人数为两个时,评分者信度等于两个评分者给同一批被试的答卷所给分数的相关系数,根据所给分数的性质,可计算积差相关或等级相关。当评分者为 320 人,被评对象为 37 个时,评分者信度可用肯德尔系数进行估计,并直接查表进行检验。
23、当被评对象超过 7 个时,计算肯德尔和谐系数之后还要计算 2 值,进行 2 检验。因此本题选 ABCD。27.实证效度包括(分数:2.00)A.效标关联效度B.同时效度 C.预测效度 D.表面效度解析:解析:实证效度也称效标关联效度。根据效标搜集的时间差异,实证效度可以分成同时效度和预测效度两种。效标资料与测验分数同时搜集时称为同时效度。效标资料是在测验之后根据实际工作成绩确定时是预测效度。因此本题选 BC。28.区分度的计算方法有(分数:2.00)A.项目鉴别指数法 B.相关法 C.难度推算法D.Z 检验法解析:解析:对于二分法记分的测验项目可采用项目鉴别指数法计算区分度。在大规模或标准化测
24、验中,多采用相关法,即以项目分数与效标分数或测验总分的相关作为项目区分度的指标。相关越高,项目区分度就越高。因此本题选 AB。三、简答题(总题数:5,分数:10.00)29.简述经典测量理论的优点与局限性。(分数:2.00)_正确答案:(正确答案:(1)经典测量理论的优点 真分数模型是以弱假设为基础的,因此这些假设容易验证并易于被绝大多数测验数据资料所满足。经典测量理论在此基础上建立了一整套理论及统计分析方法。经典测量理论浅显易懂,便于在实际测验情境(尤其是小规模资料)实施,是目前测量学界使用与流传最广的理论依据。在测验实际工作中有着强大的影响力,发挥着重要的指导作用。 (2)经典测量理论的局
25、限性 该模型最突出的弱点就是把所有的测量误差都归为一类,而没能区分测验情景中的各类测量误差,也没有说明这些测量误差究竟来自哪些误差源及各自产生的误差的大小。 该模型的第二个弱点是样本依赖性。经典测量理论的统计分析方法得到的各项指标,如难度、区分度和信度等,依赖于它们所来自的特定的被试样本。这些指标会因接受测验的被试样本的不同而不同,因此,同一份试卷很难获得一致的难度、区分度或信度。 在真分数模型中,问题的核心是实测分数 X(以及真分数 T)并不位于等距量表上,因而无法比较两组测验的得分。 真分数模型已经指出测量误差的存在,以一个相同的测量标准误作为每位被试的测量误差,显然这种做法的适当性受到怀
26、疑。 在测验结果的精确程度上,是以测验信度和测量误差的方差来表示的,忽略了单个被试在项目上的得分。 结果应用的局限性。经典测量理论的测验信度是建立在严格平行测验假设基础上的,即两测验是以相同的程度测量同一心理特质。然而,这一理论假设在实际的测验情景中却难以满足,我们常常无法保证不同测量间得分的平均值和方差都相等,也没有个统一的标准来判断究竟在多大程度上才是“平行测验”。同时经典测量理论指导下的测验还要求测量条件完全标准化,从施测指导语到测验记分都有严格而明确的规定,对于非复本但功能相同的测验所测得的分数间,无法提供有意义的比较,从而使测量目标变得狭小,这样就不能对测验进行有效改进。 信度估计的
27、不精确性。经典测量理论对信度的假设是建立在平行测验的假设上,但是这种假设往往不存在于实际测验情境里。 经典测量理论忽视被试的试题反应组型,认为原始得分相同的被试,其能力必定一样。其实不然,即使原始得分相同的被试,其反应组型亦不见得会完全一致,因此,其能力估计值相应会有所不同。 能力量表与难度量表的不一致性。在经典测量测验理论中,能力量表与难度量表没有定义在同一个参照系上,这样就找不到验证某个项目是否匹配某种能力水平被试的计量方法,这使得选题带有一定盲目性。被试能力的估计依赖于他完成测验各项目的情况。不管他做错什么题目都影响对他能力的估计,因此,他必须仔细,否则不可能得高分。对被试能力水平的估计
28、精度也无法调节。)解析:解析:经典测验理论的局限性使新的测验理论得以产生,因此,要理解经典测验理论的局限性,就需要与项目反应理论、概化理论等新的测量理论联系起来分析。30.什么是测验的效度?影响效度的主要因素有哪些?(分数:2.00)_正确答案:(正确答案:(1)效度的含义 效度是指一个测验或量表实际能测出其所要测的心理特质的程度。(2)影响效度的因素 凡是与测量目的无关的、稳定的和不稳定的变异来源都会影响测量的效度。测验本身的构成、受测被试的特点、施测的过程、阅卷评分、分数的转换和解释等一切与测量有关的环节都可能影响测量的效度。 测验的构成 当组成测验的试题样本没有较好地代表欲测内容或结构时
29、,测量的内容效度或结构效度必然会不高。同时,若题目语义不清、指导语不明、题目太难或太易、题目太少或安排不当等,都会降低测量效度。一般而言,增加测验的长度可以提高测量信度,进而为提高测量效度提供可能。由于同一个测验可以有不同的效标,同一个观念效标也可以有不同的效标测量,因此在评价测量效度时,所选效标的性质是很重要的考虑因素。 测验的实施过程 一个测验在实施过程中,如不遵从指导语的要求,或出现意外干扰,或评分、计分出现差错等,都会降低测量效度。 接受测验的被试 被试的应试动机、情绪、态度和身体状态等都会影响测量信度,造成较大的随机误差,进而影口向测量的效度。就整个被试团体而言,如果缺乏必要的同质性
30、,则很可能会得到不恰当的效度资料。)解析:解析:一个测验能够真正测到它想测的心理特质,最重要的因素当然是测验的构成。另外,测验过程是否规范、测验过程中被试的状态也会影响到测验的效度。31.什么是内容效度?什么是结构效度?什么是效标关联效度?简述它们之间的关系。(分数:2.00)_正确答案:(正确答案:(1)内容效度的含义 内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。 (2)结构效度的含义 结构效度是指一个测验实际测到所要测量的理论结构和特质的程度。(3)效标关联效度的含义 效标关联程度也称实证效度,是指一个测验对处于特定情境中的个体的行为进行估计的有效性。 (4)三种效度
31、之间的关系 内容效度和结构效度的共同之处 两者都要验证测验是否符合内容域,符合内容域的结构,两者均可使用实验干预的方法来进行验证。 内容效度和结构效度的区别 内容效度的验证,一个重要的假设是测验所属内容域具有比较清晰的界定,其结构框架,内部的比例关系基本确定。 结构效度需要验证的是没有得到清晰界定的内容域,它的组成、结构、框架需要探索和研究。可以说,内容效度验证的是测验对完善理论的匹配程度,而结构效度则是对不完善理论的探索和验证。 效标关联效度与内容效度和结构效度的区别 与内容效度和结构效度相比,效标关联效度更关心依据测验做出决策的问题,关心根据测验结果做出预测的后果和效用。)解析:解析:由于
32、测量效度是就测量结果所达到测量目的的程度而言的,因此测量效度的评估在很大程度上取决于人们对测量目的的解释,内容效度就是从测量的内容来说明测量目的,结构效度就是用心理学上的某种理论结构来说明目的,而效标关联效度则从工作实效来说明目的。32.简述提高测验效度的方法。(分数:2.00)_正确答案:(正确答案:(1)控制系统误差 从变异的角度来看,效度就是总变异中由于测量的变异引起的有效方差所占总方差的百分比。因此要想提高效度,就要控制系统误差以提高有效方差在总方差中的比例。(2)精心编制测验 注意测验项目取样的代表性,注意测验对内容域的符合和对构想的匹配,注意测验的内容和形式,提高必需的表面效度,而
33、在特定情况下降低表面效度,测验项目应具备合适的难度、区分度。(3)测验过程标准化 严格按照手册进行实测,强化测验实施过程中的标准化。主试指导语要统一,测验时被试的环境要接近,避免各种无关干扰,控制测验时间。 (4)扩大样本容量 效度验证工作采集样本适当扩大,可更好地模拟实际分布,样本量扩大,增加对总体的代表性,减少了个体的误差,也有利于提高效度。在取样中,随机抽样的方法更能保证样本的代表性。 (5)合理处理信度和效度的关系,适当增加测验长度 信效度之间存在关系,如果已知测验信度和效度指标,可通过增加测验长度来提高效度。)解析:解析:要提高测验的效度,首先就要从精心编制测验入手,这也包括控制系统
34、误差。 另外,因为信度是效度的必要条件,因此提高信度的方法也是提高效度的方法,例如增加测验长度、扩大样本容量、测验过程的标准化。 如何提高测验的效度要和影响测验效度的因素结合起来分析。33.简述概化理论研究中 G 研究和 D 研究的含义及其研究内容。(分数:2.00)_正确答案:(正确答案:(1)G 研究的含义 如果研究者依据观测全域对所有侧面(文体、评分者)和测量目标(作文能力)以及它们之间的交互作用作方差分量的估计,我们就把这个估计过程称为概化研究(Generalizability Study),简称为 G 研究。 (2)D 研究的含义 在 G 研究阶段,由于测量结果是在一定的观测全域条件
35、下估计出来的,因而对结果的解释和应用就不能离开相应的条件背景因素。但心理测量的目的就是要做出预测和推断,GT 对此做出了有力的回答。GT 把概括推论测验结果时所涉及的测量侧面条件全域的集合叫做概括全域(Universe of Generalization)。 在此基础上,对各测量侧面、测量目标以及它们之间的交互作用关系做出方差分量的再估计及推断性研究,就叫做决策研究(Decision Study),简称为 D 研究。 (3)G 研究的内容 确定测量对象和测量目标; 确定测量侧面和观测全域; 确定测量设计和测量模式; 收集样本资料: 方差分析。 (4)D 研究的内容 确定概括全域: 概括全域下各效应的方差分析: 绝对误差方差和相对误差估计; 信度分析: 重新确立概括全域并重复上述步骤。)解析:解析:概化理论研究包括 G 研究和 D 研究,G 研究是对观测全域的研究,D 研究是对概括全域的研究,D 研究是在 G 研究的基础上进行的,属于推断性研究。