1.3统计
1.数据是人类有意收集、记录和保存的一些特殊类型的信息,统计数据可以概括为量化的证据或依据。数据是人类对信息进行选择和处理的结果。数据具有以下特征:
第一,数据是一种特殊的信息,它是数字的或可以数字化的形式;
第二,数据一般只包括文字、符号、数字、数字、数值等类型,个体信息巨大的音频、视频、图像不包括在内;
再次,随着电子信息技术的发展,一些原本不被传统视为数据的非数字数据,如文字、图形、图像、声音等,经过越来越多的编码后,可以转化为计算机可以识别的数据类型,但要遵循性价比原则。
判断题的数据一般只包括字符、符号、数字、数字、数值等类型,个体信息巨大的音频、视频、图像不包括在内。(√)
答案是正确的
2.为了区别于普通的信息,我们将数据(包括统计数据)中的实体明确区分为个体(整体相似的实体),将属性名重命名为变量名,将属性表达式重命名为变量值。相应地,统计信息被重新命名为统计数据。
真假话是一种数据。
答案是正确的
第二,变量
(一)概念
在属性相同的前提下,不同个体的属性表现或属性值并不都是一样的,似乎是随个体而变的。
注:统计信息与统计数据相关概念的对应关系。
统计=实体+属性名称+属性表示
统计=个体(或总体)+变量名+变量值
(2)分类
因为属性可以分为数量属性和质量属性,变量可以分为数量变量和分类变量。
1.量变项
数量变量是指其值可以自然地直接用数值表示的变量。
2.分类变量
分类变量是指其值不能直接用数字自然表达的变量。
注:由于现代科技的发展,几乎任何变量都可以用数字间接表示。比如前面提到的编码,就是一个用数字间接表示非数值变量的明显例子。再比如身份证号代表人,数码照片实际上是由海量数字来代表的。
选择题对应数量属性中的变量()和质量属性中的变量()。
A.离散?连续b .值?分类c .顺序?分类d .价值?顺序
答案b
第三,离散变量和连续变量
数字变量在数学上分为离散变量和连续变量。
离散变量
一般表示为整数,定义域有限或可数,所有分类变量都可以编码为离散变量。比如板材的强度,燃料的热值,人体的身高体重,灯泡的寿命,试验田的积温,观测点空气中的二氧化碳含量。
此外,如果分类变量被编码或分配代码,它们可以正式改变为离散变量。
特点:编码为离散变量的分类变量只有可数、不可排序、不可加,其他离散变量介于两者之间,可数、可序或可加,但不可积。
(B)连续变量
一般用实数表示,其定义域是实数轴上的连续区间或整个实数空间。比如合格品数量、废品数量、快递包裹破损数量、电脑无法正常启动数量、发动机叶片气孔数量、铸件砂眼数量等。
特点:连续变量在数学运算中不仅可数、可序,而且可加、可乘,甚至可微。