信度和效度的理解与案例-部分补充

先举个通俗的例子:如果你在体重秤上连续称三次,读数都不一样,说明这个秤不靠谱。

二、学习相关的例子:一份问卷,被试没有认真填写,据说这份问卷没有任何可靠性。

1.通俗的例子:如果你在另一个秤上连续称三次,读数都一样,说明这个秤是可靠的。但是,如果三个一致的读数都不准确,就说明量表不够有效或者没有。这时使用了另一种称重秤,连续三次读数一致准确,说明这种秤既可靠又有效。

二、学习相关的例子:一次很简单的数学测试,很多被试答对了,说明数学测试是靠谱的,但是不能测试被试的数学能力。如果我们换一套难度适中的数据测试题,很多科目答对的题数可能是不一样的。如果能将这些科目的成绩分为好、中、差,就可以认为试题具有良好的效度。

是指使用同一测量工具,以一定的间隔对同一组被试进行重复测量,考察两次测量结果的相关程度。可以直接用相关分析,得到的相关系数就是重测信度系数。

是指同一组被试一次填写两份平行的问卷,计算两份数据的相关系数。duplicate的可靠性要求两份问卷除了问题不同之外要完全一致,这在实际操作中很难操作。

它是指将一份问卷分为两部分,计算这两部分的相关系数,即半信度系数,以此来衡量整个问卷的信度。

它是衡量内部一致性可靠性最常用的方法。计算出的克朗巴赫α系数是所有可能半信度的平均值,取值在0-1之间。系数越高,一致性越好,说明数据的真实性越高。α系数是检验问卷数据真实性的最重要指标。

它是一个定性的评价标准,主要通过经验判断,主要通过专家和有经验的业内人士。也可以在正式使用前小范围使用问卷,根据结果修改条目,说明问卷的有效性。内容效度一般不需要使用SPSS进行数据分析,而是需要专家和权威老师的指导,对修订过程进行预试,最后对问卷的内容效度进行说明。

指测量项目与测量方向的对应关系。

测定结果被人为指定为“准确度标准”,并考察其他待测结果是否与之一致。比如试卷中的选择题会有准确的答案,所以每道题的正确率就是这节课对这道题的有效性。