您好,欢迎来到好走旅游网。
搜索
您的当前位置:首页抽样调查与实验设计

抽样调查与实验设计

来源:好走旅游网
第四章 抽样调查

第一节 抽样调查的基本概念与术语 一、抽样调查的意义

抽样调查是人类以统计调查和分析为工具,深入认识客观世界的一种科学方法。它有两个层次的重要内容:

(1)研究如何科学地抽取受调查总体的部分单位作为样本。

(2)研究如何根据已取得的样本资料科学地推断未知总体参数的数量特征。 二、抽样调查的发展简介

抽样调查的应用先驱之一是法国著名数学家Laplace。早在十八世纪(1786年),他利用人口出生统计样本资料,估计了当时全法国的人口总数,开创了应用抽样调查资料作出科学推断的先河。15年,另一位欧洲的统计学家,挪威的A.K.Kiaer,首次在全国范围里釆用科学的抽样方法,抽选并调查了一定数量的有代表性的城市和乡村,推算了当时挪威全国的国民收入和财富,由此而写成的论文引起了当时世界各国和统计学界的极大重视。

三、抽样调查的常用术语 1、总体、个体(抽样单位)与样本

这章所涉及到的总体都是由有限单位构成的总体,称为有限总体。是非假定的、肯定存在的,并且具有一定的容量,其单位可以计数出来,因而必须随机抽出。一般构成这种总体的所有个体(即抽样单位)数目以N表示,称为总体容量;而从总体抽取的一部分个体或抽样单位则构成样本,其数目以n表示,称为样本容量。

例如:

总 体 所需特性、性状资料 一块小麦田 产量、株高、千粒重

一批大豆种子 水分、含油量、含蛋白质量农场某号田 土壤有机质、氮、含量 一个苹果园 某种病害为害率 2、抽样分数:

一个样本所包括的抽样单位数与其总体所包括的抽样单位数的比数称为抽样分数,以f表示。f=n/N。例如上述麦田测产的抽样分数:f=35/1000=1/28.6或3.5%,有限总体抽样所获样本平均数的方差必须乘以一个矫正项:(1 - f)。这项称为有限总体的矫正项。这里f = n/N,即为抽样分数。一般如果这一分数很小(5%)则可以忽略,不必进行矫正 3、总体抽样单位编号

将总体内的所有抽样单位按其所处的位置或其他特征进行编排号码,以便于抽取样本,这称为总体编号。 4、复置抽样与不复置抽样

凡每个已调查观察后的抽样单位要以重复归入总体内,以后有再度被调查之可能的抽样方法称为复置抽样。凡每个已调查观察后的单位不再归入总体内,即不再调查,称为不

复置抽样。前一种抽样方法,每一抽样单位从总体中被抽取的机会是相等的;后者是不相等的。凡有限总体进行不复置抽样均须进行有限总体矫正项的矫正。 5、真值、估计值抽样误差

假定从一块小麦田进行测产,麦田包括有N个抽样单位,从这些单位产量可计算总体平均产量,这是真值。倘从总体随机抽n个单位构成样本,从样本可计算样本平均数,这是估计值。这个从样本所得的估计值和总体的真值是有差异的,这个差异一般称之为抽样误差。

为了使样本估计值有较高代表性,必须降低抽样误差,因此,必须研究影响抽样误差的抽样技术。所以抽样调查的要求是从总体中获得有代表性的样本,从而获得可靠的估计值;而且要求有抽样误差的计算,以便用它来推断真值所在位置范围。 6、属性抽样与变数抽样

抽样调查按所研究的总体性质,可分为属性抽样与变数抽样两大类。对于属性抽样,一般是从总体估计百分数或成数,所以又称成数抽样。例如,在玉米田调查玉米螟为害玉米植株的百分数或为害率。变数抽样是从总体估计平均数与总和数,例如小麦田测产估计1m2面积方框的平均产量以及在1000个抽样单位(即1.5亩)的总产量。

第二节 几种主要的抽样方法

一般按抽选观察单位方法的不同而将抽样方法分为三大类:

第一类:系统抽样(顺序抽样、机械抽样或等距抽样) 按照某种既定的顺序抽取一定数量的抽样单位组成样本。例如,按总体各单位编号中逢1或逢5或一定数量间隔依次抽取;按田间行次每隔一定行数抽取一个抽样单位等等。

田间常用的有对角线式、棋盘式、分行式、平行线式、“Z”字形式(图4.1) 顺序抽样在操作上较方便易行。

对角线式

棋盘式 分行式 图4.1 常用的顺序抽样方式 平行线式 “Z”字形式 第二类:典型抽样 按研究目的从总体内有意识地有目的地选取有代表性的典型单位或单位群,至少要求选取的单位能代表总体的绝大多数。用这种方法选取的样本称为典型样本。

第三类:随机抽样 在抽选单位时,应该使总体内所有各个单位均有同等机会被抽取,换句话说,都具有相等的被抽取的概率,因此随机抽样又称为概率抽样。

常用的随机抽样的方法有:①简单随机抽样,②分层随机抽样,③整群抽样,④两阶及多阶抽样,⑤双重抽样等

一、简单顺序抽样及简单典型抽样法

简单顺序抽样通常只计算平均数作为总体的估计值。

[例4.1] 设成熟期对水稻汕优2号测产,该田块约1/3hm2,生长较均匀。采用棋盘式抽样,10个点,每点由12行间距计算平均行距。其中任选2行测查2m长度内的穴数及有效穗数。再在其中连续拔5穴,将稻穗分成大、中、小三级,按比例选取20穗,结合考察其他性状计数每穗总粒数及空瘪粒数,从而算出结实粒数。每点其余稻穗脱粒,称取千粒重。

将10点数据汇总后求得每亩平均穴数4.2万,每穴平均有效穗数9.2个,每穗平均结实粒数53.7粒,平均千粒重25.2克。计算平均的公式为 x  。本例中土地利用系数定为98%,则估计每亩产量为:

1000100010001000420009.253.725.298%513.75(kg/亩)xnx 每亩穴数每穴有效穗数每穗结实粒数千粒重(g)土地利用系数简单典型抽样法的分析同样只计算 x  n 二、简单随机抽样

这种抽样方法指抽样单位是直接从总体中随机出的。它要求有一个总体所有单位的全部编号,而且必须是完整的,此外,对总体不必有其他附加的知识。样本容量是固定的,每一个可能样本均有同等概率被抽取。在统计分析上,这种方法可获得无偏的总体平均数、总和数或成数估计值,同时也可得出抽样误差的无偏估计。

以小麦田测产为例,随机决定测框位置。设田块长300m,宽170m,取5点,各点的长、宽位置分别随机决定为(125,88),(240,9),(26,53),(80,71),(231,129)等。(见示意图)

50 100 50 100 150 200 250 300 150 • (一)简单随机抽样结果的统计分析

• 假定以xi(i = 1,2,… N)所研究总体变数,则有限总标准差s的定义如下式 N (xiX)2 i1N1

X 为总体平均数。

• 倘用简单随机抽样抽取一样本,平均数( X )的标准误(样本容量为n)为 σNn

xnN(1f)n• (1-f)为有限总体矫正项。如抽样单位数目n等于总体N,即全部总体抽取,则  x  0 如果f = n/N < 10%,则矫正后的结果与不矫正的很接近。

• 在实际抽样研究中s为未知数,所以样本平均数的标准误 sx 为 • ssxn(1f)

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- haog.cn 版权所有 赣ICP备2024042798号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务