一、抽样的定义从欲研究的全部样品中抽取一部分样品单位。其基本要求是要保证所抽取的样品单位对全部样品具有充分的代表性。
二、抽样的目的
抽样的目的是从被抽取样品单位的分析、研究结果来估计和推断全部样品特性,是科学实验、质量检验普遍采用的一种经济有效的工作和研究方法。
三、基本概念
所考察对象的某一数值指标的全体构成的集合看作总体,构成总体的每一个元素作为个体,从总体中抽取一部分的个体所组成的集合叫做样本,样本中的个体数目叫做样本数量。
(一)总体或抽样总体:
总体通常与构成它的元素共同定义:总体是指构成它的所有元素的集合,而元素则是构成总体的最基本单位。
比如,当我们开展对某批发市场蔬菜农产品质量安全监测时,该批发市场的某一车普通白菜就是我们研究的总体,而该车上的每一颗普通白菜便是构成总体的元素。
(二)样本:样本与总体相对应,是指用来代表总体的单位,样本实际上是总体中某些单位的子集。样本不是总体,但它应代表总体,以抽样的标准就是让所选择的样本最大程度地代表总体。
(三)抽样单位或抽样元素:
抽样单位或抽样元素是指收集信息的基本单位和进行分析的元素。在农产品质量安全监测中,常用的抽样单位是个体的植株或果实,它也可以是一定类型的群体。抽样单位与抽样元素有时是一致的,有时是不一致的。如在简单抽样中,它们是一致的,但在整群或多阶段抽样中,抽样单位是群体,而每个群体单位中又包含许多抽样元素。
(四)参数值与统计值
参数值也称总体值,是指反映总体中某变量的特征值。例如某蔬菜大棚中所有番茄果实的三唑酮平均含量。但参数值多是理论值,难以具体确定。通常是根据样本的统计值来推论总体的参数值。
统计值也称样本值,是指对样本中某变量特征的描述。它通常是实际统计分析的数值。例如,根据某一样本资料可计算其三唑酮含量等。用样本统计值去推论参数值时,二者是一一对应的。
(五)抽样误差
样本统计值与所要推论的总体参数值之间的均差值就称为抽样误差。这是由抽样本身产生的误差,它反映的是样本对总体的表性程度,故又称代表性误差。
(六)置信水平与置信区间
置信水平和置信区间是与抽样误差密切相关的两个概念。
置信水平,又称置信度,是指总体参数值落在某一区间内的概率。
而置信区间是指在某一置信水平下,用样本统计值推论总体参数值的范围。其大小与误差密切相关,置信区间越大,误差也越大。