深度原创|一篇文章讲清楚业绩分析指标。

考试是检验学生学习情况的有效手段。对考试成绩进行统计分析,可以帮助教师发现教学和命题中的不足,更好地改进教学。总结常用的性能分析指标,利用这些指标构建在线性能分析系统,并给出系统应用的具体实例。实验结果表明,这些指标能够很好地评价考试效果。

关键词得分分析;指标;在线性能分析系统

考试是考察学生知识和能力的重要手段。为了充分发挥考试的功能,使其真正为提高教育质量服务,如何评价考试是非常关键的。统计分析是运用科学的定量和定性的方法对统计数据进行分析或评价,做出科学的结论,得出对事物本质和规律的认识。基于统计分析理论的学生成绩评价系统可以用来评价和监控考试结果,可以有效地发现教学和考试中的不足,及时进行改进。

结论通过统计分析对学生成绩进行科学严谨的评价,可以获得丰富的教学信息,为从整体上把握考试质量提供理论依据。成绩分析系统的应用提高了命题水平,大大提高了教学质量。

难度是反映试题或考试难度的重要指标。

难度反映的是考生是否适合考试。试题太难或太容易,不能反映考生的实际水平。试题太难,不是所有考生都能做的;试题如此简单,以至于所有的考生得分几乎相同。

比如中考和高考的难度要适中。中考试题难度为0.30 ~ 0.80,全卷难度为0.6 ~ 0.70。高考题难度0.30 ~ 0.70,全卷难度0.5 ~ 0.60。

难度:题目的难度。

反映的是考生是否适应试题和考试,试题太难或太容易都不能反映考生的实际水平。难度值在0到1之间。P & gt0.8试题太容易;P & lt0.2的时候,试题太难了。一份试卷应该由不同难度的试题按一定比例组成。一般来说,P & gt0.8、P & lt0.2试题各占10%;P = 0.2 ~ 0.4,P = 0.6 ~ 0.8分别占20%;P & gt0.4、P & lt0.6的中等难度试题要占60%。整套试卷的平均难度在0.4-0.6之间。

①预测难度:命题人对试题的预测难度。

②实际难度:考试结束后,根据测得的数据,利用相关公式计算难度。

实际难度计算公式为:p = x/m。

难度的计算

一般认为P

区分度是指试卷对学生实际水平的区分程度或辨别能力。高区分度的卷子可以区分不同知识水平和能力的学生,让能力高的学生得高分,能力低的学生得低分;区分度低的试卷不能很好的区分学生的能力,使得高水平和低水平的学生成绩差别不大或者没有规律可循。区分度可以用极端分组法计算。先将考生试卷总成绩由高到低排序,将前27%的学生作为高分组,后27%的学生作为低分组。分别计算高分组学生和低分组学生的平均分。如果试卷满分为W,则试卷的区分度为0 ~ 1。一般认为D≥0.4的试题区分度为“优秀”;0.3 ≤ d < 0.4为“好”;0.2 ≤ d < 0.3为“可以”;D < 0.2的试题的区分度为“差”。

区分度与试题难度有关。一般来说,难度适中的试题区分度会更好。

比如中考、高考一般要求试题的区分度在0.30以上,也就是说高分考生比低分考生可以多考30%。

区分度越高,越能区分不同层次的被试,这个题目的价值就越大。所以,题目难度中等时,区分度最高。

当试题的难度系数在一定范围内,且具有相对较高的区分度时,该试题被认为是质量好的试题,试题的质量由试题的难度和区分度构成。

区分度是试题区别于考生实际水平的程度。是评价试卷质量、筛选试题的主要指标和依据。

通常用D表示,取值在-1.00到1.00之间。D值越大,试题的辨别能力越强。

当d为正值时,表示试题正分化,即高分组通过率高,低分组通过率低。

当d为负时,说明试题是负分化的,高分组通过率低,低分组通过率高。

当D为0时,试题没有区分作用。

区分度的计算

测试可靠性分析:一份高质量的试卷必须保证测试结果的可靠性,即测试的可靠性。它是反映考试成绩稳定性和可靠性的指标,表明一项考试反映被试稳定水平的程度。

信度是反映考试一致性或可靠性的指标。

可靠性高意味着测试结果更准确,误差更小;可靠性低表示误差大。

信度低的考试无法正确评价考生的知识水平和智力素质。

比如中考和高考一般要求客观题的信度在0.9以上,主观题的信度在0.7以上,全卷的信度在0.8以上。

可靠性:即可靠度,是指用同一方法对同一对象重复测量时,结果一致的程度。高可靠性意味着测量更精确,测量误差更小;可靠性低表示测量误差大。信度低的考试无法正确评价考生的知识水平和智力素质。中考一般要求全卷信度在0.8以上。

另一方面,信度是反映一项检查(或测量)的可靠性或准确性的指标。试题中题目的区分度、每道题的满分差异以及题目之间的异质性都会影响信度。

计算公式:

比如“图书馆利用与满意度问卷”第一部分的问题1,如果相隔三天问同一个人同一个问题,如果回答者第一个答案选A,第二个答案选C,第三个答案选D,说明调查结果的可靠性较低,因为调查结果差异较大。如果三次选择同一个答案或差别不大的答案,在排除系统误差的情况下,调查结果的可靠性较高。

计算公式:

S-P表诊断是对教学过程进行精细化管理和评价的工具。它将测试和练习的测试分数数据排列成列表,并用可视化图表对学生和问题的特征进行结构化分析。其目的是获取学生的学习诊断信息,用图形化的分析结果来反映学生的特点和问题P(即学习反应信息)。S-P表分析诊断模块不仅可以分析小组试题的反应倾向,还可以分析诊断每个学生的反应倾向。标准普尔表的评估功能包括:

利用S线和P线的位置和形状,可以从不同的方面分析学生的学习和考试设计。

箱线图是美国统计学家约翰·图基在1977年发明的。它由五个数值点组成:最小值(min)、下四分位数(Q1)、中值(median)、上四分位数(Q3)和最大值(max)。您也可以将平均值添加到箱线图中。如下图。下四分位数、中间数和上四分位数形成一个“有隔间的盒子”。在上四分位数和最大值之间建立一条延长线,这条延长线称为“须”。

箱线图的价值

通过箱线图,在分析数据时,箱线图可以有效地帮助我们识别数据的特征:

箱线图通常用于显示数据的分散性。具体来说,就是计算一组数据的中位数、25%分位数、75%分位数、上界和下界,将数据由大到小排列,直观地展示数据的整体分布。

正常数据大部分在盒子里,异常数据在上下限之外。

计算上下边界的公式为:

参数描述:

计算过程:

设置类型,默认为21实际分数2%,建议统一设置为2%;

涉及的统计数据项包括实际参加考试的人数、试卷总成绩、在线人数(如在线1、在线2、在线3)和在线人数(如在线1、在线2、在线3)的百分比;

按教育局、学校、班级分类统计;