1.3统计

一.数据

1.数据是人类有意收集、记录和保存的一些特殊类型的信息,统计数据可以概括为量化的证据或依据。数据是人类对信息进行选择和处理的结果。数据具有以下特征:

第一,数据是一种特殊的信息,它是数字的或可以数字化的形式;

第二,数据一般只包括文字、符号、数字、数字、数值等类型,个体信息巨大的音频、视频、图像不包括在内;

再次,随着电子信息技术的发展,一些原本不被传统视为数据的非数字数据,如文字、图形、图像、声音等,经过越来越多的编码后,可以转化为计算机可以识别的数据类型,但要遵循性价比原则。

判断题的数据一般只包括字符、符号、数字、数字、数值等类型,个体信息巨大的音频、视频、图像不包括在内。(√)

答案是正确的

2.为了区别于普通的信息,我们将数据(包括统计数据)中的实体明确区分为个体(整体相似的实体),将属性名重命名为变量名,将属性表达式重命名为变量值。相应地,统计信息被重新命名为统计数据。

真假话是一种数据。

答案是正确的

第二,变量

(一)概念

在属性相同的前提下,不同个体的属性表现或属性值并不都是一样的,似乎是随个体而变的。

注:统计信息与统计数据相关概念的对应关系。

统计=实体+属性名称+属性表示

统计=个体(或总体)+变量名+变量值

(2)分类

因为属性可以分为数量属性和质量属性,变量可以分为数量变量和分类变量。

1.量变项

数量变量是指其值可以自然地直接用数值表示的变量。

2.分类变量

分类变量是指其值不能直接用数字自然表达的变量。

注:由于现代科技的发展,几乎任何变量都可以用数字间接表示。比如前面提到的编码,就是一个用数字间接表示非数值变量的明显例子。再比如身份证号代表人,数码照片实际上是由海量数字来代表的。

选择题对应数量属性中的变量()和质量属性中的变量()。

A.离散?连续b .值?分类c .顺序?分类d .价值?顺序

答案b

第三,离散变量和连续变量

数字变量在数学上分为离散变量和连续变量。

离散变量

一般表示为整数,定义域有限或可数,所有分类变量都可以编码为离散变量。比如板材的强度,燃料的热值,人体的身高体重,灯泡的寿命,试验田的积温,观测点空气中的二氧化碳含量。

此外,如果分类变量被编码或分配代码,它们可以正式改变为离散变量。

特点:编码为离散变量的分类变量只有可数、不可排序、不可加,其他离散变量介于两者之间,可数、可序或可加,但不可积。

(B)连续变量

一般用实数表示,其定义域是实数轴上的连续区间或整个实数空间。比如合格品数量、废品数量、快递包裹破损数量、电脑无法正常启动数量、发动机叶片气孔数量、铸件砂眼数量等。

特点:连续变量在数学运算中不仅可数、可序,而且可加、可乘,甚至可微。