信度和效度的理解与案例-部分补充

先举个通俗的例子:如果你在体重秤上连续称三次，读数都不一样，说明这个秤不靠谱。

二、学习相关的例子:一份问卷，被试没有认真填写，据说这份问卷没有任何可靠性。

1.通俗的例子:如果你在另一个秤上连续称三次，读数都一样，说明这个秤是可靠的。但是，如果三个一致的读数都不准确，就说明量表不够有效或者没有。这时使用了另一种称重秤，连续三次读数一致准确，说明这种秤既可靠又有效。

二、学习相关的例子:一次很简单的数学测试，很多被试答对了，说明数学测试是靠谱的，但是不能测试被试的数学能力。如果我们换一套难度适中的数据测试题，很多科目答对的题数可能是不一样的。如果能将这些科目的成绩分为好、中、差，就可以认为试题具有良好的效度。

是指使用同一测量工具，以一定的间隔对同一组被试进行重复测量，考察两次测量结果的相关程度。可以直接用相关分析，得到的相关系数就是重测信度系数。

是指同一组被试一次填写两份平行的问卷，计算两份数据的相关系数。duplicate的可靠性要求两份问卷除了问题不同之外要完全一致，这在实际操作中很难操作。

它是指将一份问卷分为两部分，计算这两部分的相关系数，即半信度系数，以此来衡量整个问卷的信度。

它是衡量内部一致性可靠性最常用的方法。计算出的克朗巴赫α系数是所有可能半信度的平均值，取值在0-1之间。系数越高，一致性越好，说明数据的真实性越高。α系数是检验问卷数据真实性的最重要指标。

它是一个定性的评价标准，主要通过经验判断，主要通过专家和有经验的业内人士。也可以在正式使用前小范围使用问卷，根据结果修改条目，说明问卷的有效性。内容效度一般不需要使用SPSS进行数据分析，而是需要专家和权威老师的指导，对修订过程进行预试，最后对问卷的内容效度进行说明。

指测量项目与测量方向的对应关系。

测定结果被人为指定为“准确度标准”，并考察其他待测结果是否与之一致。比如试卷中的选择题会有准确的答案，所以每道题的正确率就是这节课对这道题的有效性。