时间:2023-06-12 09:37:46
引言:寻求写作上的突破?我们特意为您精选了12篇抽样调查的主要方法范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
引言:小微企业[1]作为国民经济发展中的新兴力量,生产经营活跃,遇到的困难和问题也不少。当前,政府和社会各界越发关注小微企业的成长发展,小微企业调查统计数据的重要性越来越突出。小微企业单位众多等特点,决定了抽样调查成为其统计调查的主要方式。
当前,国内针对小微企业的抽样调查,主要由国家统计局组织开展。小微企业的抽样调查主要由国家统计局各调查总队负责组织实施,保证了调查工作的顺利开展。对小微样本企业的调查主要以调查员面访和企业报送报表相结合的方式。
小微企业的各项抽样调查项目主要有:规模以下小微工业企业抽样调查[2],建筑业小微企业抽样调查,限额以下批零住餐行业的小微企业抽样调查,规模以下服务业小微企业的抽样调查,以及小微企业的采购经理抽样调查。规模以下小微工业企业抽样调查开展较早,该项抽样调查方案相对更为成熟。因此,本文主要介绍此项调查方案,并在此基础上触类旁通,介绍其他几项抽样调查的主要框架。
一、规模以下小微工业企业抽样调查方案介绍
(一)调查目的。主要目的是推算规模以下小微工业企业的主要指标,反映基本总量和生产经营的状况。
(二)调查范围。调查包括企业和个体工业经营单位两部分。具体来说,企业总体细分为目录企业和非目录企业两个总体。目录企业是指企业抽样框中所包含的企业;非目录企业是指抽样框以外的企业。
(三)调查内容。主要包括:企业的基本生产经营情况以及遇到的困难和问题等;个体户的用工和经营状况,等等。
(四)调查方法。针对企业和个体工业经营单位采取不同的抽样方法。目录企业部分采用分层抽样方法,即从抽样框中直接选取企业样本。利用选取的一套样本,可以分别以省或行业为总体,对总体目标量进行推算估计。非目录企业及个体户采用地域整群抽样方法,即在地域抽样框中直接抽取村(居委会)作为地域样本单位,并在地域样本内对非目录企业和个体户进行逐一统计调查。
(五)目录企业样本的抽取。(1)建立抽样框。在抽样调查中,抽样框的建立尤为重要。具体而言,调查中应建立两个抽样框:目录企业抽样框和地域抽样框。目录企业抽样框是企业的名录库,用来抽取目录企业的样本;地域抽样框是由国家和各地区共同建立的以行政村、居委会为基本记录单元的名录库,代表了全国地域,供抽取整群样本时使用。(2)目录企业的样本抽取主要包括目录企业样本量测算、样本分配、样本抽取及权数计算等步骤。1)目录企业样本量测算。根据简单随机抽样的样本量公式,单独计算各地区和各行业的样本量。根据分地区测算的总样本量与分行业测算的总样本量,依据就大原则,确定全国样本总量。2)样本分配主要包括:首先,利用迭代法把样本初步分配到各地各行业;接着,在地区行业的格子中再分层;最后一个步骤,在地区行业格子的各层之间分配样本量。3)在分层工作及各最终层样本数确定后,方可选取样本。在抽样的最终层中,利用永久随机数排序的技术选取该层的样本企业单位。4)权数计算包括基础权数和调整后权数两个步骤。
(六)地域样本的抽取。具体来说,包括整群地域样本量的确定分配、样本的抽取和权数的计算等各个步骤:1.以地区为总体,根据公式,初步测算整群地域样本量;再依据经验及实际计算的精度,调整样本量。2.对抽样框中的地域单位,根据规模大小确定分层的界限,再在各层分配地域样本量。3.地域样本的抽取与目录企业类似,同样利用永久随机数排序的技术在层内根选取本层的样本。4.权数计算包括基础权数和调整后权数两部分,地域样本内的个体工业经营单位和非目录企业的权数,等于其所在村(居委会)地域整群样本的权数。
(七)总体目录量的估计。利用权数放大相应的指标,即可得到总体目标量的估计。
二、建筑业小微企业的抽样调查介绍
从方案的推进进度而言,调查仍在积极试点。调查的主要目的是及时、准确反映建筑业小微企业生产经营现状和面临的难点问题,为党政领导进行决策和企业的生产经营提供依据和建议。具体而言,调查的内容有:企业的基本名录状况,效益情况、实际生产和经营状况及发展趋势等。调查方法主要采用分层PPS抽样方法,在全国范围内选取建筑业小微企业作为样本单位。
三、限额以下批零住餐行业的小微企业抽样调查
调查通过运用抽样调查方法,计算社会消费品零售总额。调查范围主要包括限额以下的批发和零售业、住宿和餐饮业四类行业中的法人单位和个体户。本项抽样调查方案由两个主要部分构成:以区县为总体的抽样方法和以省为总体的抽样方法。
(一)以区县为总体的抽样方法。以区县为总体,采用一阶段的分层随机抽样方法。依据不同的单位属性和行业属性分成不同且相互不交叉的调查层,然后各自在自身的调查层中采用简单随机的抽样调查方法选取样本。
(二)以省为总体的抽样方法。针对该总体,方案采用二阶段的分层抽样调查方法。第一阶段对全省各个区县进行分层,选取一定数量的区县作为样本;第二阶段在抽中的样本区县内开展以区县为总体的抽样方法。
四、规模以下小微服务业企业的抽样调查
调查的目的主要在于:反映企业生产经营状况及面临的外部经济环境,及时提供政策依据。调查范围包括各省级区域内的小微服务行业的法人单位,具体而言,包括居民服务、交通运输等行业。本调查采用目录抽样的方法。根据单位所在行业和自身规模分层,采用永久随机数排序的技术选取样本,对抽样调查的精度有所保障。
五、小微企业的采购经理抽样调查
调查的目的主要是通过建立小微企业的采购经理抽样调查制度,及时追踪反映企业生产运行的具体状况,加强监测与预警,提供政策参考依据。调查范围包括制造业、建筑业、批发和零售业等行业在内的的企业法人单位以及依据法人单位进行调查统计的产业活动单位,分为制造业和非制造业两个组成部分,主要是体现经理人在企业采购以及生产经营活动等方面的主观判断情况。该项抽样调查方案主要采用PPS抽样方法,依据行业的规模分层并分配样本量,在各自层内部采用与企业规模成比例的概率抽样方法进行样本的选取。
总结:小微企业的抽样调查方案具有很高的科学性,调查效率较高,并且抽样调查的相关结果备受关注。本文系统总结了当前开展的各项小微企业抽样调查方案,当前的调查有些部分需要进一步改进。今后,抽样调查方案的发展改进应逐渐弱化经济指标的调查,而在问卷设置方面多下功夫,充分考虑如何有效通过问题的设置,使得调查对象对调查表式看得懂、能理解、易填报,进而通过抽样调查能够及时准确反映小微企业在生产经营活动中遇到的突出困难和问题,大力加快推进小微企业的快速稳定发展。
中图分类号:C811 文献识别码:A 文章编号:1001-828X(2015)024-0000-01
在现代社会当中,随着信息技术应用的进步,“大数据”已经成为社会发展的重要趋势。在“大数据”环境下,政府统计的重要性日益突显,提高政府统计工作准确性、可靠性势在必行。抽样调查作为一种有效的政府统计工作手段,充分认识到其存在的不足并纠正,提高抽样调查工作水平,对我国政府统计工作发展和进步有着十分重要的意义。
一、我国政府统计抽样调查存在的问题分析
(一)技术方面问题
抽样调查是一个复杂的过程,包括许多环节,比如设计、数据处理等,这些环节都属于技术层面内容,任何一个环节发生问题,都会给整个抽样调查结果质量造成负面影响。抽样调查技术方面问题具体有:
首先,抽样设计环节问题。一是抽样框编制存在不足,存在重复覆盖或者覆盖不全等问题,设计的抽样框并不具有代表性,造成样本老化,极大地降低了调查数据的可靠性和准确性;二是样本随机性无法实现,在抽样过程中,受现实各种因素影响,样本的随机性会受到干扰,进而对调查结果可靠性带来一定影响。
其次,数据处理环节问题。数据处理是一个十分重要的环节,主要包括权数确定和缺失数据处理两个方面,存在的问题有:权数问题重视不足,缺乏合理的权数设计方法;对缺失数据的技术处理没有形成有效规范和程序,影响调查结果的可靠性[1]。
第三,报告表达环节问题。在抽样报告的表达当中,各项说明并不详细,经常忽略一些内容,比如回答率情况、统计推断精度、设计效应等,在一定程度上降低了调查报告的质量。
(二)体制方面问题
就我国政府统计抽样调查体制现状来看,主要存在两方面问题,一是缺乏有效的统一协调,既有国家实行的,也有地方政府实行的,彼此之间没有良好的沟通、协调,调查的项目无法满足多层次推断需求,在执行过程中,抽样调查异化为全面调查,失去了其调查意义。
二是抽样调查容易受到政府干扰,在基层统计部门执行抽样调查过程中,地方政府为保证自身政绩,会通过行政措施干预统计部门工作,迫使其弄虚作假,导致抽样调查的数据真实性受到影响,降低抽样调查的可靠性。
二、我国政府统计抽样调查的改进措施分析
(一)完善抽样调查的体制
首先,建立独立自主的抽样调查工作机制。在抽样调查工作中,要保证基层统计部门的相对独立性,提高其地位,改善工作环境,制定相应的制度来预防地方政府对基层统计部门的干预,保证抽样调查的客观、实际,从而确保统计工作的真实、有效,为经济建设、社会发展提供良好服务。
其次,做好统计系统与其它部门间的协调。在抽样调查工作中,要良好协调统计系统、政府其他部门的关系,保证统计口径、方法等的统一,加强彼此之间的交流与沟通,避免发生口径或数据不一致问题,提高抽样调查的效率。
第三,协调统计系统内部上下级间的关系。在抽样调查执行过程中,要做好统计系统内部上下级关系的协调,提高抽样调查方案的可行性、科学性,减少基层统计部门的重复性工作,确保抽样调查的本质不会变为全面调查[2]。
(二)改进抽样调查的技术
首先,加强抽样设计的完善。抽样设计是抽样调查工作开展的重要依据,在抽样设计过程中,要根据调查对象、目标的差异,制定可行、全面的抽样方案,同时,还要从可移植性方面来对抽样方案进行改进设计。如果抽样调查规模较大,需要注意样本老化问题,及时调整轮换调查样本,提高样本可靠性,并在实施前进行全面、充分论证,为抽样调查结果可靠奠定良好基础。
其次,做好调查方法的改进。在抽样调查方法上,要运用现代计算机技术,对传统方法进行有效改进,保证调查样本的随机性,并借鉴国外面访、电话调查的相关经验,综合各种调查方法的优点,有效避免单一调查方法的弊端,提高调查效率,保证调查结果的准确可靠。
第三,提高抽样推断的水平。推断是抽样调查工作的一个重要环节,是以调查结果为基础,得到总体估计的过程,推断水平高低会直接影响到总体估计结果的真实度。在抽样推断当中,需要充分做好缺失数据处理、样本权数计算和目标量方差估计,最大程度的提高调查结果精度,并运用模型推断的方法,结合调查设计效应经验,得到最佳推断结果,才能有效发挥抽样调查的作用,提高政府统计工作的效果。
第四,加强数据质量的评估。调查数据的质量是政府统计可靠与否的关键性因素,加强数据质量的评估,提高数据质量水平,是保障政府统计的有效途径。在数据质量评估当中,需要推进数据质量管理技术手段的改革,提高数据管理书评,建立完善、科学的数据质量管理体系,构建相应的数据质量评估指标体系,从而有效提升数据质量,为政府统计的准确可靠创造良好条件。
三、结语
综述所述,政府统计是一项十分重要的工作,保证统计的可靠、准确有着重要意义。在政府统计工作当中,抽样调查是一种主要的统计手段,提高抽样调查水平是保障政府统计工作成效的重要途径。在当前抽样调查工作中,还存在种种不足,采取相应的措施进行改进,是政府统计工作应当重视的内容。
参考文献:
关键词 抽样调查 统计 公路运输
一、抽样调查的意义
抽样调查,顾名思义,就是从全部调查对象中抽选其中的一部分进行调查,并由此对全部调查研究对象作出相应的评估及判断的一种非全面调查方法,其目的是通过抽样调查获取反应总体情况的信息,因此也能起到全面调查的作用。在公路运输统计的抽样调查,是以科学的原理和计算为依据,从广大公路交通运输事物中,抽取一部分车辆样本以进行调查,在采集数据的基础上,建立抽样调查数据模型及数据的处理方法,以此推断出公路运输经济工作中的运量、运输周转量、汽车燃油消耗等主要指标的数值,反映该时期公路运输行业的经济工作运转情况,从而为行业的宏观调控及各种规划的制定提供重要依据。公路运输统计中运用抽样调查具有极为重要的意义,由于公路交通运输分布范围大,涉及面广,若是开展全面调查,则需要花费大量的人力及物力,而实行抽样调查的样本单位较少,具有较强的代表性,调查结果准确性高,具有其它非全面调查所不具备的特点,诸如按随机的原则抽取样本,在总体中每一个单位被抽取的机会是均等的,调查样本的数量经科学计算确定,具有可靠性等,抽样调查堪称公路交通运输行业中最为完善,最具科学依据的调查方法。
二、公路运输抽样调查的步骤
首先,明确抽样调查的目的,在充分贯彻行业统计工作规定的基础上科学有效地开展统计工作,以所在地区公路运输的特点为依据制定抽样调查的方案。其次,确定调查范围与抽样单元,确定总体车辆库,原则上应包括从事营业性运输非独立核算的单位、从事非营业性运输的单位及私人所拥有的车辆,可按车籍所在地的车辆为调查对象来确定总体车辆,再以此为依据,确定抽样单元,由计算机随机抽取样本。再次,确定调查的内容,公路运输统计中的抽样调查主要是对公路运输量、车辆运用情况和油耗等方面的内容进行抽样统计调查,包括客(货)运量、客(货)周转量、总车日、总行程、重载行程、汽(柴)油车油耗、车辆运力、运输量、营业收入、营业支出等。最后由调查人员下到基层调查记录样本车辆营运的原始数据,对样本车户进行具体调查登记,收集样本户运输量等方面的资料,可采取到企业、业户上门调查搜集数据、问卷调查等多种方式,对样本车辆进行调查并拍取样本照片,从而推算出全社会的公路客货运输量,以此来全面了解和掌握所在地区道路运输业发展水平和货运交通量情况,为道路运输业的发展和向现代服务业转型提供强有力的信息支撑和决策依据。
三、如何有效开展抽样调查工作
抽样调查在公路运输统计中的重要作用是显而易见的,然而在实际运用中难免存在对样本代表性产生片面认识,滥用抽样方法,总体目标量估计不足,遗漏外挂车辆的抽样调查等各种问题。因此,在实际工作当中,应注意抽样调查工作得有效性开展。
(一)完善抽样调查制度
一套完善并且科学而严格的公路统计调查制度是有效开展抽样调查工作的保证。我们的公路运输部门应充分认识到完善抽样调查制度的重要性,以科学性与可行性相结合,确保数据质量及分步推进的原则,制定出切合实际,易于操作准确率高的调查制度,建立负责制度,明确责任部门,确保责任及措施的到位,实现分工协作、全程控制的抽样调查组织网络,还应加强调查数据质量的控制与检验,保证抽样调查数据准确性,同时在人员力量、资金等方面做好配套工作,重视抽样方法与理论的研究,使抽样调查的自身理论得以提升,确保抽样调查工作的顺利进行。此外,还应建立健全的公路运输统计数据质量审核评估制度,加强对原始数据质量的检查,通过对各项指标的综合分析,强化数据质量的控制。
(二)多种调查方式并举
在实际公路交通统计过程中,统计人员应根据抽样调查工作中的实际情况,灵活运用不同的调查方式,实现多种调查方式并举。抽样调查过程中,如果有与调查指标相关的辅助变量供使用,且总体单元是根据辅助变量的大小顺序排列,可使用系统抽样的方法,提高估计的精确度。进行多指标调查时,可将标识作为辅助变量,使用PPS抽样,或采用对简单随机样本使用比估计、回归估计等方法。为确保抽样调查的质量,避免由于样本点代表性差而引发的偏差问题,可采取样本轮换的方法,定期更换样本。多层次推断的抽样及估计方法,诸如样本追加的方法,能有效估计下一层目标量,实现结果的精确性,提高估计的精度。为使抽样调查能满足多层次的需要,除了进行分层抽样外,还可采用抽样后分层之类的域估计方法。另外,对于外挂车辆的抽样调查,调查人员可结合典型调查进行数据核实,确保数据的全面性。随着信息时代的到来,抽样调查还可引入信息技术手段,例如实施网络调查,平台短信调查,GPS监控调查等方法,相比调查人员亲自跟车的调查方式,引入信息技术手段的调查方式不仅提高了数据的准确性,还能提高抽样调查的效率,节约人力物力资源,实现调查的目的。
(三)提高调查的服务质量
统计人员的责任心、业务素质,工作质量是保证抽样调查数据的准确性及可靠性的关键。公路运输统计部门应完善自身的激励机制,做好统计人员的选配,培训工作,加强对统计人员的专业培训及知识更新工作,统计人员亦通过自学、借鉴经验等途径,强化自身的业务知识,掌握吨位利用率,实载率,百车公里油耗是否合理等各项调查指标知识,调查过程中及时查看样本指标。除了必备的业务知识外,调查人员还应以耐心细致的工作和服务,打消被调查车主的疑虑,与他们搞好关系,从而提高抽样调查工作的效率和调查数据的质量。注重在实际工作中对发现的问题进行实时协调和解决,在具体的调查活动中提高和锻炼一支业务精,能力强的统计队伍。
参考文献:
我国是一个人口众多的国家,经济发展的状况比较复杂,在经济的发展过程中多种所有制并存,近些年来由于我国经济的飞速发展,对于统计工作的要求也越来越高,我国的统计方法最初是照搬外国统计经验开展的,而国外的统计方法是根据自己本国的需要制定的,很难适应中国经济发展的需要,所以我国的统计工作者在实践中根据我国经济的特点,打造出适合中国情的统计方法。经过多年的探索我国已经走出了一条以抽样性调查为主体,以周期性普查为基础,并且以与重点调查、统计报表等调查方法相结合的科学的统计调查方法体系。如下图所示。
图1 统计调查方法
一、统计调查方法的主要结合模式
经济发展需要我们根据新的经济形势对统计方法进行变革以适应各级政府以及各类企、事业单位了解收集各类信息,及时的了解新情况,做出正确的决策。新统计调查方法体系是对过去单一化的统计方法的完善,也是统计方法的重大变革,根据实践经验可以将调查方法下列几种模式。
(一) 重点调查与普查相结合
这种调查方式适用于只需掌握总体数量特征不需要详细的进行了解,而且变化比较稳定的少数的重点单位。
重点调查与普查相比具有具有速度快、投入少的特点,而通过定期普查可以确定统计调查的单位名录,或者是重点单位进行必要的调整,以便于工作的开展。这种调查方式是计算重点单位的标志比重、数量比重不可缺少的重要依据。重点调查的作用在于不仅可以在非普查年份,对重点单位相关的调查资料获取需要的资料数据,并且利用这些数据与资料与其他的资料结合在一起进行有效地推算;还可以对非重点对象进行调查以获得需要的数据或者是资料。其结合点可以从结果、过程、时间或者是指标等方面着手。
(二)抽样调查与普查相结合的方法
这种方法主要适用于专题性的统计调查或者是国情国力方面的调查如物价指数的统计调查、工资总额的增减调查等。
抽样调查与定期普查相结合是统计调查方法体系内的一个最基本的框架。人们把这种结合起了一个生动形象的名字叫做长短表结合,两者相结合的优点主要有两个,第一,抽样调查需要的辅助变量资料、抽样框名录以及排队标志可以通过多标识分组的普查获得。第二,抽样调查可以了解普查进行之前需要了解的必要情况,,通过普查还可以对普查资料进行修正或者
补充,除此以外还可以为普查提供更多的翔实有用的非普查年份资料,这些资料可以为制定普查方案提供可靠的参考。这种结合方式由于其比较稳定、规范所以具有较强的适应性,应用范围也比较广泛。可以根据调查的需要采取区域结合、指标结合、层次结合或者是质量结合的方式进行调查。
(三)重点调查、普查、抽样调查相结合,‘”
这三种方法结合进行调查的优点在于不仅可以进行科学的统计分析、保持调查资料的连贯性而且还可以相互验证、及时获取准确的资料,还可以不间断的观察现象总体的变化进程,以便及时准确的对现象总体进行监控,并以此采取正确的应对措施。这三种方式的结合可以完成多个调查目的,所以应把这种结合方式在第三产业统计以及工业统计等方面进行大力的推广,使之应用的更加广泛。
(四)统计报表与抽样调查结合
这两种方式的结合使用于变量离散程度大、高度偏态而且具有识别标志的社会经济现象总体。
抽样调查和统计报表的结合从表面上看是两种统计调查方法的结合,但在实际的操作中其实是抽样调查、统计报表、重点调查三者调查统计方法的结合,与原来采用单一的全面统计报表相比,这种结合方式使统计调查工作具有了较大的灵活性,其主要表现是既可以掌握重点单位的情况,又可以掌握宏观情况,这种结合方式与单一的统计方式相比还具有投入少,产出多的优点,也就是用比较少的投资获得比过去更为准确的资料。而且还弥补了使用重点统计调查的方法的缺点,所以具有较大的实用性可以在固定资产投资统计领域、工业以及批零贸易业等进度性统计等方面广泛推广与应用。除此以外这种结合方式还可以使用在层次结合中,即不同的层次使用不同的统计调查方法,对于规模比较小的企、事业单位可以使用抽样调查的方式进行统计,大规模的企事业单位可以采用统计报表的方式进行调查统计。比如,对县级以上进行增加值统计的时候可以采用统计报表的方式进行调查统计,而县级以下则可使用抽样调查的方式获取需要的数据。
二、提高抽样调查的使用效果
在所有的统计调查方法中抽样调查是一种使用频率较高的调查方法,其在具体的实施中根据实际情况的不同主要分为两大类概率抽样法与非概率抽样法。这两大类下面又分为四个小类。如右图:
图2 统计抽样方法
为了提高调查的效率除了要与多种形式的统计方法互相结合以外,还可以利用自身多种多样的组织形式与估算方法进行科学合理的结合也可以有效地提高这种方法的使用效率。主抽样调查的组织形式要根据统计调查的实际情况进行灵活运用。比如把整群抽样与等距方法有机的结合起来可以加强群抽取的合理性;提高估计的精明度可以把整群抽样与分层技术结合起来这两种组织形式结合后就可以达到这个目标。除此以外还可以样本轮换、多项抽样、穿插样本等专门技术与组织形式都可以极大地提高抽样调查的使用效果。
抽样估计方法的适当运用可以有效地精简工作量,还可以提高抽样调查的精确度。主要的估算方法有回归估算法、一般估计法、比率估计法等。组织形式与估计方法的结合形式也是多种多样的,需要根据实际情况进行确定,在进行实际的抽样操作的时候可以根据需要选用一种、两种甚至三种估算方法,二者的结合使抽样调查的效益达到了最大化,进而推动了抽样调查的推广运用。
三、结语
各行各业的发展都离不开科学的统计调查,目前统计调查工作还存在着一些不足,需要广大的统计工作者充分发挥每种统计方法的特点,通过不同统计方法的结合使之在各个行业与各个政府部门发挥最大的作用,在工作实践中不断的改进,进一步完善不足,从而提高统计工作的效率,使统计工作更好的为经济的发展、社会的进步服务。
参考文献:
一、提高思想认识
粮食是国家经济安全的基础,是国家进行宏观调控、改善民生的基本保障。开展县级粮食产量抽样调查,有利于提高县级粮食产量数据质量,有利于国家和省建立粮食利益补偿机制,客观、公正执行国家和省各项粮食补助、奖励政策,对促进粮食稳定增产,保护国家粮食安全具有重要意义。近期,国家统计局、国家发改委、农业部联合下发了《关于做好县级粮食产量抽样调查工作的通知》,省政府办公厅转发了调查总队等部门《关于做好县级粮食产量抽样调查工作的意见的通知》,分别对县级粮食产量抽样调查工作提出了具体要求,各有关镇办事处、各有关部门要从确保粮食生产安全的高度切实提高认识,按时按质按量地完成各项调查工作。
二、抓好组织实施
(一)调查内容、方法与范围。根据上级统一安排,从年秋粮开始,我市开展粮食产量抽样调查工作。调查内容包括主要粮食作物和小品种粮食作物两部分。对小麦、玉米、大豆等主要粮食作物的播种面积和单位面积产量,采用抽样调查方法;对其他小品种粮食作物播种面积和产量,利用小区域估计等方法进行估算,最终推算出全市夏粮、秋粮及全年粮食产量。
(二)调查的组织实施。由市统计局牵头,会同市发改局、农业局、有关镇办事处,对我市被抽中的20个样本小区(名单附后)内种植的粮食作物面积进行调查,按照抽样原理在小区内确定等量、等面积的小样本,对调查作物进行实割实测,采集样本数据;调查数据由统计局汇总后统一上报国家统计局调查队,作为推算全市粮食产量的依据。
政府统计系统首先必须满足政府管理部门的需求,层层管理经济的模式直接影响着现行的统计调查方法体系。因此,“中央政府需要什么指标,县政府也需要什么指标”成为我国中小企业经济管理中的一种特殊现象。我国大多数统计指标都是如此,国家、省一级直至县一级都是一个完整的统计总体。我国中小企业统计机构设置与中小企业经济管理机构的设置是吻合的,从国家到县一级都设有中小企业统计机构,与中小企业经济管理需要相匹配。传统的全面统计报表制度能够比较好地适应这种体现层层管理的统计模式。从县中小企业统计机构开始采集全面数据并层层汇总,既可满足县级政府管理的需要,又可满足县以上各级政府(地区、省、国家)的需要。但此种模式存在着两个弊端,其一,调查方式过于笨重、工作量太大;其二,干扰统计数据的问题难以解决。
2.中小企业抽样调查面临问题
(1)抽样框问题。抽样框是进行抽样调查的基础,设计任何一项抽样调查都必须考虑的一个重要问题是可利用的抽样框的状况。抽样框的重要性主要表现在如下两个方面:
其一,抽样框是选取样本单位的基础。无论采用什么抽样技术,确定和选取样本单位总是离不开抽样框。
其二,抽样框是估计总量指标的基础。我国中小企业统计中的绝大多数指标都是总量指标,采用抽样调查技术估计总量指标必须有合适的放大因子,即先估计总体的平均指标,然后通过总体单位总数进行放大,最后获得总体总量指标。
可见,较为完善的抽样框是进行抽样调查的重要前提,而目前我国的中小企业名录库无论是在时效性还是完整性方面都尚难以满足需要。
现实情况是,中小企业中全民、集体企业的名录库比较健全,但口径过窄,而为数众多的个体企业没有名录库,加之个体中小型企业变化非常快,因而很难拥有完备的可利用抽样框,同时,专门为为数众多的小型企业建立名录库既不可能,也无必要。
(2)多目标抽样涉及的优化指标问题。所谓多目标抽样调查,是指在一次抽样调查中组织者为了满足多个目的的需要,在一次调查访问中由同一被调查单位回答多个问题,且对多个标志值(调查指标)的计量通过同一样本元素进行。
多目标抽样代表性问题是抽样调查工作中长期存在的问题,特别是在我国,由于报表中的指标较多,因而多目标问题就更为突出。过去人们试图依靠适当增加样本量的方法来减少多目标,但问题测算结果并不理想,到目前为止,尚未有一个比较简便易行的方法。
将一项大的调查分解为若干个小调查,是从调查制度上解决多目标问题的一个可行的办法。不同的调查,采用不同的方法独立抽选样本,样本企业可以有重复交叉。从抽样理论上讲,采用这种分解调查的模式肯定能提高各种指标的抽样精度,在相当大的程度上解决了多目标问题。但是,由此带来的样本量增大的问题也将十分严重,而且很难通过直接采取某些技术上的处理来解决。
二、中小企业抽样调查体系的确立原则
抽样设计是抽样方法与现实情况的有效结合。在我国建立中小企业抽样调查体系应遵循“一切从我国的实际情况出发,科学性与可行性相结合”的指导思想。具体地说,应遵循如下原则:
1.整体推进,分步实施
目前,随着我国经济体制改革的深化,统计工作必须跟上改革的步伐。一方面,政府直接管理经济的职能必然减弱,全面统计报表制度存在的基础已发生变化;另一方面,精简政府机构必然会涉及到中小企业统计机构,无论从人力或物力看,采用全面统计报表制度都已力不从心。因此,在中小企业统计领域全面推行抽样调查技术是统计改革的必然趋势。从现在开始,国家中小企业统计机构应着手研究并制订规划,尽快从整体上以抽样调查取代全面报表制度。
然而,由全面统计报表制度全面过渡到以抽样调查为主体尚是一项很艰巨的任务,还有许多问题有待解决。其中,有主观方面的问题,很多的管理者以至许多统计工作者对抽样调查方法还持有怀疑态度;有客观方面的问题,目前我国中小企业统计系统还缺乏从事抽样调查管理、设计和调查方面的有经验人员。因此,在全面推行中小企业抽样调查方法过程中,一是加大宣传和培训力度,使管理者充分认识到抽样调查是科学、可行的,使统计工作者更新知识,逐步掌握基本的抽样方法。二是在推行抽样调查方法改革时必须统筹规划,根据轻重缓急确定先后次序,抓住重点,适时突破,带动全局。制定抽样调查方案要经过试点、试算和充分论证,有计划、有步骤地推行。
2.国家需要与地方需要相结合
就我国目前情况看,如果仅考虑国家需要,即以国家为总体,只推算国家一级的总量指标,这与中国的管理现实差距过多,不仅各省没有了积极性,而且可能无法满足国家管理的需要,因为中央政府管理经济也常常需要分省数据。但如果以县或地区为总体,层层调查、推算,一方面人力、物力和财力无法保证,另一方面会失去抽样调查的灵活性,而且难以排除层层干扰的危险。
因此,将国家和省的需要结合起来,以主要满足中央和省一级政府管理的需要为目标是目前我国开展企业抽样调查工作的一个比较好的选择。将这一原则具体体现在中小企业统计抽样调查方案的设计中,抽样总体定在省一级,同时满足国家和省的需要,兼顾地区和县的需要。在中小企业抽样调查方案中可提供两个抽样精度供各省选择,若某省不需该项调查的指标,可将最大相对误差定为25%,否则,应将最大相对误差定为10%。
3.目录抽样与区域抽样相结合
在中小企业抽样调查中,目录抽样方法是以企业名录库为抽样框,区域抽样方法则是以某种行政区划或地理区划为抽样框。相对地说,目录抽样方法具有设计简单和精度高的特点,但前提是需要有较为完整的企业名录库;区域抽样方法设计比较复杂,在同样的样本量下精度不如目录抽样,但对抽样框的要求较低。
缺乏企业名录库是目前我国开展中小企业抽样调查工作的难点之一,现有的较为完整的企业名录库都只限于一定的范围,如仅有集体企业名录库。然而,我国有着非常系统的行政区划,这非常有利于采用区域抽样技术。例如,在我国广大的农村地区,行政村是一级很有中国特色的行政区划单位。
因此,在设计我国中小企业抽样调查方案时,若有企业名录库,则应尽可能采用目录抽样技术;若缺乏企业名录库,则应充分利用我国现有的行政区划,合理采用区域抽样技术。
我国的中小企业数量众多。其中小型中小企业占绝大部分,这些小企业的特征,一方面是数量巨大,另一方面是变化很快,为其全面建立名录库不仅不现实,也没有必要。因此,对于我国众多的小型企业,有必要采取目录抽样和区域抽样相结合的模式:对于已经建有企业名录库的企业,毫无疑问应采用目录抽样;对于有一定规模并有条件建立企业名录库的企业,应尽可能建立企业名录库,并采用目录抽样技术;对于没有名录库,同时也没有条件建立名录库的企业,采用区域抽样。
4.因地制宜,多种抽样方法并举
抽样调查是根据部分实际调查结果来推断总体的数字特征的一种统计调查方法,属于非全面调查的范畴。它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
与其它调查一样,抽样调查也会遇到调查的误差和偏误问题。通常抽样调查的误差有两种:一种是工作误差,一种是代表性误差。但是,抽样调查可以通过抽样设计,通过计算并采用一系列科学的方法,把代表性误差控制在允许的范围之内;另外,由于调查单位少,代表性强,所需调查人员少,工作误差比全面调查要小。特别是在总体包括的调查单位较多的情况下,抽样调查结果的准确性一般高于全面调查。因此,抽样调查的结果是非常可靠的。
抽样调查数据之所以能用来代表和推算总体,主要是因为抽样调查本身具有其它非全面调查所不具备的特点,主要是:
(1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
(2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。
(3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。
(4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。
一、抽样方法的选择
(一)提高估计精度
总体是由大量具有相同性质的个体所组成的一个集合体,在共性的基础上,个体之间又存在许多方面的差异。总体内在差异性是指调查总体中所研究的指标或变量在每个不同个体上的差异程度。这种差异体现为各个体的标志值或变量值与它们的平均数不相等,存在着离差。有些个体的离差相对大些,有些个体的离差相对小些。很显然,如果每个个体的离差都较小,那么从这样的总体中抽取少量样本所计算的样本均值就会很接近总体均值,即能够保证调查估计值有较高精度;总体指标无变异时,只需抽取一个个体作样本即可取得完全可靠的估计值,但各个体的变量值与总体均值之间的离差都比较大,即总体内在的变异程度增大时,就必须抽取较大样本量,才能保证调查估计值有较高精度。
抽样包括,概率抽样和非概率抽样,其中概率抽样包括;1.简单随机抽样,简单随机抽样是一种广为使用的概率抽样方法。是最完全的概率抽样。如前面提到的,随机抽样就是总体中每个单位在抽选时有相等的被抽中的机会。2.系统抽样,在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。3.分层抽样,定量调查中的分层抽样是一种卓越的概率抽样方式,在CMRC公司以往的调查中经常被使用。4.整群抽样,以上各种抽样类型全部是按单位抽取的,即按样本单位数,一个单位、一个单位地抽取。在整群抽样中,样本是一组单位、一组单位地抽取。在整群抽样下,我们假定群中单位与总体一样存在异质性。如果一群中单位的特征非常相似,如果由于共同环境使群内差异小而群与群之间差异大。一般来说,要解决这个问题可以扩大群数,然后从各个群中抽取少量单位数,以保证样本的代表性。5.多阶段抽样,将抽样分为好几个步骤,每一步用上面提到的抽样方法进行抽样。非概率抽样包括;偶遇抽样,判断抽样,定额抽样,滚雪球抽样。
(二)多阶段抽样的情况后几个阶段尽量简单,前两阶段尽量科学
对于规模较大的抽样,我们为了使抽样方便,我们往往会选取多阶段抽样与其他抽样相结合的复杂抽样方法,抽样调查采用严格的概率抽样,特别是当抽样单元大小不等为提高抽样效率而采用不等概率抽样时,技术性很强,因此抽样方法对抽样工作人员的专业素质要求很高。尽管在大规模抽样调查前需对工作人员的专业素质进行培训,但多阶段最后阶段要求较高。对多阶段抽样的误差起决定作用的是前两个阶段,越往后误差的影响较小。对于多阶断抽样的前两阶段需要更进一步考虑,适合的、科学的控制整体的误差尽量小,后两个阶段尽量选择更专业的人员。
(三)置信度
置信水平表示区间估计的把握程度,置信区间的跨度是置信水平的正函数,即要求的把握程度越大,势必得到一个较宽的置信区间,这就相应降低了估计的准确程度。
根据置信度与显著性水平的关系, 若置信度选取太小, 显著性水平较大, 就是说, 判断失误的几率就较大, 这时, 往往因舍去“ 误差较小的数据过多” , 把本来不属于错误的测定误判为错误而舍去, 故易犯“ 拒真” 的错误。 如置信度选取太大时, 判断失误的机会小了, 但是往往因实用意义不大, 并且因“ 保留误差大的失误数据过多” 这时往往把本来不属于正确的测定误判为正确而保留, 故易犯“存伪”的错误。在分析工作中, 处理分析数据的结果, 应首先控制犯“ 拒真” 错误的判断为最小, 其次, 再设法使“ 存伪” 的错误判断降到最低。我们在分析工作中, 一般取95%的置信度, 基本上综合考虑了以上这两方面的因素。以上是在分析方法可靠的情况下进行的讨论。若分析方法不能满足实际生产的误差要求,那就不只是置信度的选取问题了, 则必须首先考虑改进分析方法的问题。
二、样本量的确定
(一)估计精度
调查估计值的精度要求与样本量大小密切相关。不难发现,样本容量越大它所包含的个体越多,那么它所包含的能体现总体特征的各种信息就越多,对抽样估计就越有帮助,抽样估计精度也就会越高。特别地,当样本容量和总体容量相等时,样本所包含的信息就是总体本身的全部信息,抽样调查就成了全面调查抽样估计就成了全面统计,所得的结果自然就完全准确,即估计精度100%。相反,若样本容量比较小,它所包含的个体比较少,那么样本中的个体种类就可能不完整,样本的分布形状就会与总体有较大不同。这时,样本对总体的代表性就可能很低,从而使抽样估计有较大的误差。可见样本容量成了调节或控制抽样估计精度高低的最直接、最有效的手段。但在抽样调查中,有时为取得令人满意的抽样调查结果,通常需要在抽样前根据调查目的或决策的重要性确定一个适宜的精度,再根据这个精度要求来抽取样本量,从这个角度看,样本量的确定要服从于抽样精度。过高的精度不但没有必要,反而导致费用的增加,过小的精度不能满足调查目的的需要,可见抽样精度这时是确定样本量的一个最重要的因素。在不考虑其他因素时,要求的抽样估计精度越高,抽取的样本量要越多;要求的抽样估计精度越低,抽取的样本量要越少。定出一个适宜的精度要求,一般应考虑用户对调查结果的使用以及数据分析对估计的要求。例如,用户能接受多大的风险,如果用户将根据调查结果进行重大决策或者作有较大风险的决策,就需要估计值有较高精度,反之较低精度就可满足用户需要。
(二)置信度
抽样估计中我们希望在估计精度一定的情况下抽取适当样本量所得的样本指标值都能够落在所允许的误差范围内,但这并非都能实现的事情。由于抽样指标值随着样本的变动而变动,它本身是个随机变量,因而抽样指标和总体指标的误差仍然是个随机变量,并不能保证误差不超过估计精度所规定范围的条件是必然的,以概率论和大数定律作为理论依据,该事件只能给以一定程度的概率保证,即概率保证程度。可见抽样估计精度是一定概率保证程度基础上的精度。在不考虑其它因素影响,样本量一定的情况下,抽样估计精度要求越高,即允许的误差范围越小,抽样指标值落入范围内的概率越小,概率保证程度越小。同样在不考虑其它因素影响,抽样估计精度一定的情况下,概率保证程度越高,即要求抽样指标值落入允许误差范围的概率越高,那么只有要求随机变量抽样指标值和总体指标的误差越小,满足这一条件的途径和解释抽样估计精度和样本量关系原理一样只有抽取的样本量越大越好;反之,可以少些。特别地,当样本容量和总体容量相等时,样本所包含的信息就是总体本身的全部信息,抽样调查就成了全面调查,抽样估计就成了全面统计,所得的结果自然就完全准确,即估计精度达到100%的同时概率保证程度达到100%。
(三)经费因素
任何一项调查所确定的样本量,必须能够在预定的时间内完成,并且有足够经费支持才是可行的。否则必须调整样本量,以保证调查的顺利完成。样本容量过大,会使调查费用显著增加,人力及管理费用加大,从而也难以体现抽样调查的优越性。当调查经费很少时,就难以去搜集辅助信息,样本布点就不能很均匀分散,样本容量就不会太大。因此,在讨论样本量确定问题时,调查费用是一个不可忽略的内容。
注:本成果受北京市财政和北京市教委‘人才培养项目’资助。
注:首都经济贸易大学2012年度产学研联合培养研究生基地项目。
参考文献:
[1].冯士雍.抽样调查应用与理论中的若干前沿问题[M].统计与信息论坛.2007.
[2]刘太平.浅谈抽样调查的准确性[M]. 南昌高专学报.2003.
中图分类号:C829 文献标识码:A 文章编号:1674-1723(2013)03-0198-03
当今社会是个信息化时代,信息数量之多,变化之快是以往任何一个时代都无法比拟的。在纷繁复杂的社会活动中,如何能及时、准确地搜集有用的信息是统计研究者们的首要任务。通过传统的调查方法(也称一次性调查)已不能满足人们对统计信息的时效性需求,取而代之的是连续性抽样调查越来越普遍。
在进行抽样调查时,几乎所有的调查总体都在随时发生着变化。总体中包含的总体单位的特征随着时间的推移而不断发生着变化,比如居民消费。或总体本身的内部结构也在随时发生着变化,比如人口结构的变化。如果我们进行调查的总体单位特征和总体内部特征不发生变化的时候我们考虑用一次性抽样,但是如果调查总体单位特征或总体内部特征发生变化时我们用一次性抽样不能够满足我们对调查信息的需要。这时我们就要采取连续性抽样调查,在不同时间点上对总体进行估计。
一、连续性抽样调查方法
连续性抽样根据其调查的目的和调查对象的不同,可分为四类。
1.重复样本调查(或渗透抽样):每期从同一个总体中独立地抽取一个样本进行的连续性抽样调查方法。
2.固定样本调查(或纵向调查):每期调查都用同一个样本进行连续性调查。
3.轮换样本调查:样本单元在经过连续几轮的调查之后,将会退出调查,同时新的样本单元将会产生并开始接受调查。
4.分裂样本调查:将固定样本抽样同重复样本抽样或轮换样本抽样相结合的一种连续性抽样调查。
四种方法的比较:在连续抽样调查中,轮换样本调查时使用最为广泛的一种连续性抽样设计,目前存在各种类型的轮换模式。轮换样本调查既吸收了重复样本调查和固定样本调查的优点,同时也克服了两者的缺点。具体说来主要存在以下几个优势:
首先,定期替换一样本单元既可以提高轮换样本对调查总体的代表性,又可以有效地降低被调查者的回答负担,从而减少因为样本老化而带来的非抽样误差。
其次,每次调查都保留一定单位的固定样本,减轻调查组织者的工作负担,并节省调查费用。
最后,在连续性的样本轮换中,可以有效地利用前后各期轮换样本之间的相关关系,来提高现期目标量的估计精度,从而提高连续调查数据的准确性和连贯性。
本文就分层抽样下样本轮换的设计过程的理论及操作步骤进行系统性的描述。
二、分层抽样下的样本轮换模型
所谓分层抽样是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本的方法。分层抽样保证了样本结构和总体结构的一致性,提高了样本对总体的代表性和估计精度,因此也被应用到连续性抽样调查中,在连续性抽样调查中使用分层抽样就会涉及到样本轮换的问题。
(一)分层抽样下样本轮换的估计量
1.两个时期的样本轮换。我们首先考虑两个时期的样本轮换策略。假设两个抽样时期的样本都为n,分别称为前期抽样n1和当期抽样n2,显然n=n1=n2(这里我们把前期样本用下标1来表示,当期样本用下标2来表示)。样本轮换是将一部分样本m必须保留,另一部分样本u必须替换,其中u=n-m。由于必须保留的样本m与上期样本有重叠的地方,所以重叠率s=m/n,替换率t=u/n。
设所需研究的变量为y,第一期所要研究的变量记为y1,第二期所要研究的变量记为y2,对应的估计量分别为1和2。保留m1个单元的前期样本均值为,而现期样本均值为。新轮换进当期的样本单元为,他们均是总体的无偏估计。前后两期调查指标具有较高的正相关关系。设r为前期后两期的样本相关系数,我们视容量为n的前期样本为第一相样本,视现期样本中保留的前期样本m2个样本单元视为第二相样本,根据回归估计的二相抽样理论,取回归估计量,其中回归系数b=。
由于总体均值是由上期保留下来的样本单元m2和本期新添加的轮换样本单元u2所组成,则总体均值的估计量是与的加权,即。其中的选取应使的精度最高,即使V()达到最小。V()=,为使V()达到最小,对求偏导数,并令其为0。解得代入则,Vmin()=
2.两个以上时期的抽样。我们对两个以上时期的抽样,可以从第三次抽样起,用前一次样本回归估计量替代得到第h次总体均值的估计量。
(h>2),V()=,其中,为第h次抽样轮换样本的层权,为第h次抽样固定样本的层权。
(二)分层抽样下样本轮换的最优轮换率
在不考虑第i层子总体的前期样本全部被轮换掉(=0)或第i层子总体没有进行样本轮换(=1)这两种情况下的样本轮换率。进行样本轮换的条件是:0
三、案例分析
随着电子信息时代的到来,人们的生活习惯也随之发生改变。从传统的纸质阅读到现在的电子阅读。在兰州阅读情况调查中采用样本轮换能够很好地反映电子信息迅猛发展人们阅读方式的改变。一般情况下一旦用户开始使用电子阅读方式接受调查,这种使用方式基本不会改变。因此我们主要考虑固定权重或增加电子阅读调查户权重的样本轮换策略。
在这种情况下我们首先分析城市居民电子阅读方式抽样调查的一些基本理论,包括样本轮换下均值和方差的估计以及最优样本轮换率等。分别讨论两个时期抽样和两个以上时期抽样的样本轮换策略。我们首先将电子阅读方式和纸质阅读方式进行分层,为了讨论方便,我们特将电子阅读方式和纸质阅读方式分别进行样本轮换。由于抽样总体的总体单位数N很大,每次抽取各个样本量是相互独立的。
(一)样本轮换时间的确定
样本轮换时间主要考虑三个因素:总体随着时间的推移发生变化的快慢、调查员或被调查员对连续调查的调查时间和调查次数的反感以及调查成本的限制。
首先,我们对年龄在18周岁以上兰州市城市居民的阅读情况查。由于兰州是一个不发达的地区,人口流动性不强使总体抽样框中的抽样单元基本不发生变化。其次,在我国城镇住户统计报表制度中,报表体系分为基层定期报表和基层年度报表。其中年度报表要求是年度的完整资料,还要求各个不同年份之间的进行相互比较。最后,从时间,数据处理,经费,调查员的积极性,调查户的配合等多个角度考虑,样本轮换时间不宜太短。同时,如果样本轮换时间也不宜过长,过长会降低样本轮换的效果。
考虑上述因素我们对兰州市城市居民的阅读情况调查每三年进行一次调查。其中由一相抽样获得信息将被调查者有电子阅读习惯和纸质阅读习惯进行分层。然后按比例,从各层中进行随机抽样。抽取的样本就是二相样本。也就是说,样本轮换时间为一年,三年内样本轮换次数为三次。
(二)样本轮换率
样本轮换率主要是由相关系数决定。当前后两期指标具有一定程度正相关性时,无论是不进行样本轮换还是全部进行样本轮换,估计量精度都不如对样本进行部分轮换较高,即最优样本轮换率取值于(0,1)内(张宁,2008)。一相调查是一个多指标调查,这时我们只考虑一个主要指标如学历、工作等与其他指标为正相关关系。所以我们可以充分利用前期样本中保留样本的信息作为后期调查的辅助信息来对现期调查做回归估计,从而来确定样本轮换率。一般情况下,比较适合的样本轮换率在1/3到1/2之间。考虑到被调查户数较多,易于操作,我们先确定样本轮换率选取固定值1/3。
(三)样本轮换组数及轮换组的单位数
拟采用二相抽样和多阶段抽样相结合的方式进行调查。首先用pps法随机抽选街道,再抽中的街道内随机起点等距选着住宅。对选中的一相样本进行调查。就被调查者的收入、学历等辅助信息来研究是否有电子阅读的习惯。我们假设在兰州市内抽取90个经常调查户,一般一相抽烟总体单位数是经常性调查户的5~6倍,这里选取经常性调查户的6倍即540户为一相样本的调查户数。这样在每个轮换组内的调查户数为30户的情况下。具体的样本轮换组数为540/30=18。
进一步,我们分别来讨论电子阅读调查户与纸质阅读调查户的样本轮换组数。假设在兰州市所抽取的90户经常调查户中有12户采用电子阅读方式,另有78户采用纸质阅读方式。样本轮换率均为1/3。
首先考虑电子阅读调查户的情况。需要选取的一相样本的调查户数为经常性调查户12户的6倍,即72户。电子阅读调查户轮换组的单位数应为12×1/3,即4户。电子阅读调查户的样本轮换组数为72/4,即18组。对于采用纸质阅读调查方法进行调查,需要选取的一相样本调查户数为经常性调查户78户的6倍,即468户。纸质阅读调查户轮换组的单位数应为78×1/3,即26户。纸质阅读调查户的样本轮换组数为468/26,也是18组。
(四)样本轮换操作流程
1.电子阅读调查样本轮换流程。一相调查每三年进行一次,需要选取的一相样本为72户有条件接受网络调查的调查户。采取简单随机抽样的方法,将总体72个单位分成18组,每组4个调查户。从这18个组中按照不重复抽样每次抽取一组出来,依次编号为①、②、…、18。在进行一相调查以后的第一年,选出三个轮换组进入调查。比如说,选取①、②、③三个轮换组调查一年以后,第二年①号轮换组退出,④号轮换组进入调查;第三年②号轮换组退出,⑤号轮换组进入调查,依次类推。三年以后进行第二个一相调查,按照随机抽样抽取18个调查组,依次编号为①、②、…、18。
表1 电子阅读调查样本轮换流程
2.纸质阅读调查样本轮换流程。每三年进行一次一相调查,选取468户接受非网络调查的调查户。采取简单随机抽样的方法,将总体468个单位分成18组,每组26个调查户。按照电子阅读调查同样的办法分组及对轮换组进行编号。
表2 纸质阅读调查样本轮换流程
服装市场调查是指对适应服装市场供求变化的诸因素进行系统收集、分析,为企业预测市场发展趋势,掌握供求变化规律以及合理制定营销策略提供依据。其中与企业市场营销活动直接和间接相关的因素包括:市场特性和结构不可控因素调查;市场可控因素调查等。不同的抽样方法在服装市场调查中的应用范围不尽相同。
(1)对于全面调查无法解决的现象在实际工作中,对于某些现象可能需要全面了解情况,但又由于现象自身的特性无法通过全面调查获取资料。此时可使用抽样调查。服装市场中该类现象主要有:①产品质量的破坏性检验例如:服装缝迹的性能试验;服装面料的抗拉、抗皱强度试验。②无限总体的调查例如:为制定服装号型标准而进行的人体测量抽样检查。③包括未来时序的总体调查例如:人口增长与服装需求的关系调查。
(2)对于理论上可作全面调查,实际上难以组织全面调查的现象①有些现象虽属于有限总体,但由于总体范围过大,单位数目过多且过于分散,事实上不可能作全面调查。例如:大量连续作业的某些产品质量的非破坏性检验。②有些现象由于受时间或其他条件的制约,不能组织全面调查。例如:自然灾害造成的服装物资需求情况的调查。
(3)对于时效性要求高、又不需作全面调查的现象例如:服装流行趋势调查。
(4)对于全面调查结果进行检验和修正任何调查都可能存在误差,全面调查也不例外。而且由于全面调查涉及面广、工作量大、费用高、参加人员多、汇总传递环节多、调查结果处置不当容易出现差错。因此,可在全面调查之后再进行一次抽样调查,根据抽样调查结果对全面调查结果进行检查和修正,从而提高全面调查的质量。例如:人口普查或经济普查。
(5)对工业生产过程的稳定性进行监测和质量控制世界上许多国家广泛采用的工业产品质量控制系统,如在服装产品成批或大量连续生产过程中,利用抽样调查方法对产品的质量实施动态检测,及时提供有关信息,变事后监督为事中控制,并通过编制质量控制图进行监控。
(6)对于抽样假设的检验抽样调查方法可对总体进行假设检验,以判断这些假设的真伪,为管理决策提供依据。如:一类服装在某一地区销售状况良好,这是否意味着这类服装在其他地区也有很好的销路呢?由于不同地区的消费者对服装的接受程度不尽相同,这种程度常会受到一些因素的影响而呈现出不确定性。因此,可以利用抽样调查的结果,对接受程度是否存在显著性的统计差异进行检验,以判断该类服装在其他地区销售的可能性,并据此作出是否推广的相关决策。
二、服装市场抽样调查样本容量的确定方法
目前服装市场抽样调查中确定样本容量的方法大致可分为四类[1]:
(1)直接或间接地由调查经费确定样本虽然这种方法在一定程度上缺乏科学依据且过于武断,但它在无法离开财务预算编制的整体环境下确实存在。例如对长三角地区纺织服装企业母子公司关系的研究,需要对相关企业进行实地调研,项目总经费为10万元。其中,与样本容量无关的固定费用(包括管理人员的工资、调查表的设计及组织领导、通讯联系等必要的费用)为4万元;平均调查一个样本单位的变动费用为1000—1500元/份,样本调研费用随调查单元数的多少而变动,如调查表的印刷、调查员的差旅费、报酬、礼品费用等,由此可推算出必要的抽样单元数目为40—60家企业。这就要求调查人员寻求多种数据搜集方案并谨慎衡量信息的价值及成本,以及利用有限的资源提供有利于决策的高品质样本选取方案。
(2)根据以往的经验或相似调查确定样本经验型数值在设计调查方案时具有广泛的应用,这种确定方法一方面考虑了抽样误差,另一方面参考以前的调查经验,根据项目内容进行调整。若样本容量不能满足精度要求,则适当地增加样本量以减少调查结果的偏差。
(3)由总体样本的各个子群数目的预期容量确定分类是市场研究中的一个基本方法,这一方法是对总体进行分层抽样,总体样本按照不同的特征细分为各个子群,调查人员通过分类发现细分市场,由此确定产品的市场定位等。假定对同一类服装消费人群进行调查,在一定精度与置信度下,只要100个样本量就足够;在期望用性别区分了解消费者市场时,则样本容量可能需要增至200个以上;若进一步希望通过划分年龄层进行调查,则可以将消费者分为:20岁以下,20—30岁,31—40岁等,这时样本容量亦将相应增加。使用这种方法,必须考虑各个子群的样本数目,总体样本在此基础上进行调整。
(4)采用传统的统计方法确定结合应用统计学,利用统计学公式确定样本容量。这种方法科学性强、精确度高,目前在市场调查中已有使用,是确定样本容量的主要方法。由于大部分限制约束条件不便于量化,很多时候只能在估计精度和可供调查使用费用之间进行权衡。通常在这一原则指导下,确定的样本容量表示在最大限度地满足规定精度要求及尽可能节约调查费用的前提下,所抽取到的样本量最少。表1所示在不同受限条件下估计总体均值和估计总体比例的确定方法[2]。对一般的抽样设计,会给定比例估计P的精度,可用4个步骤计算样本容量[4]。(1)计算初始样本容量n1=Z2P(1-P)E2(2)对总体大小进行调整n2=n1NN+n1(3)若抽样设计不是简单随机抽样,则对样本容量进行调整,B是设计效应n3=Bn2设计效应说明简单随机抽样是衡量其他复杂抽样技术效果的标准,通常采用经验法或历史数据法估计,计算时用B表示。当抽样设计为简单随机抽样时,B=1;当抽样设计为分层抽样时,B<1;当抽样设计为整群抽样时,B>1。(4)调整抽样调查不可避免地存在无回答现象,因此,在实际调查中,必须对上述样本容量进行调整[5]。调整后样本量=调整前样本量有效回答率计算时预计回答率用r表示,则最终的样本容量为n=n3r假定:某服装杂志出版商希望调查读者对该杂志的综合满意度。通过邮寄调查,出版商可以联系到所有2500个客户。但由于时间的限制,出版商决定使用简单随机抽样进行电话调查。试确定访问多少个客户合适?分析:使用简单随机抽样,假设可接受的误差E为0.10;调查估计值的置信度为95%,因此Z=1.96;预计回答率r=0.65;由于事先没有关于顾客满意度的比例估计精度P,方差应取最大,即P=0.5。解答:(1)计算初始样本容量:n1=Z2P(1-P)E2=(1.96)2×0.5×0.5(0.10)2=96(2)根据总体大小调整样本容量(这一步针对中小规模的总体进行):n2=n1NN+n1=9625002500+96=92(3)根据抽样的设计效应来调整样本容量:n3=Bn2=n2=92假定采用简单随机抽样设计B=1(4)根据无回答情况进行调整,确定最终的样本容量:n=n3r=920.65=142即至少应访问142个客户。
三、服装市场消费者行为调查的案例分析
(一)调查案例设计
虽然根据公式可以从理论上确定样本容量的上限,但由于实际工作中受费用和时间的限制,使用最大样本量的可能性很小,而且实际调查通常涉及多个目标,需对多个指标的误差进行控制,而不是简单地考虑单一指标。因此,在实际的服装市场研究中,必须综合考虑,采用多种方法来确定样本容量。
(1)调查目的和目标市场的选择本文选取的案例为2007年12月受企业委托参与的男衬衫消费者行为调查[6],旨在了解目标消费者的基本信息、生活消费观念、购买行为及影响消费者购买决策、网络购物特征、品牌忠诚度以及购买率等的影响因素。经过与委托企业多次沟通后,确定对国内16个城市进行问卷和商场调查(见表2)。
(2)样本量的确定现实的市场调查往往有多个目标,对于一些目标单一的调查,调查的样本量可以参照以往的案例或经验,比如50—100个调查样本。由于本次调查对象为男衬衫消费者,目标较单一,划分调查区域后,依据调研经费和时间,采用控制回收总量的方法,每个目标城市回收问卷100份,实际发放问卷1680份,总计有效问卷1600份,回收率为95.23%,调查对象多数为购买衬衫的男性消费者及少部分女性购买者。
(二)调查案例分析和改进设想
(1)置信度
本案的样本容量是考虑时间与经费后的经验型取值方法。但可通过对样本量的置信度验证确定样本量是否合理。如表3所示,抽样误差在3%时,置信度为0.98—0.99,说明调查样本对总体的代表性具有比较高的精度和信度。
(2)可靠性检验
一般调查区域越大,所需样本量可能越大。本次调查为不同城市消费者调查,且样本量平均分配。为此,使用SPSS软件进行可靠性检验,以确定被调查个体是否能对各城市有较好的代表性。解析的KMO①=0.697,属于中等水平[7],较适合作因素分析。(3)改进设想为了合理、精确地进行抽样调查,在确定不同城市样本量时可依据被调查城市人口数量的差异,采用比例配置法进行样本分配;同时,根据表4对各个城市样本数量进行修正,即在95%的置信度下,抽样误差不超过12%,可满足各个城市调查资料准确且独立的要求。这时的样本总数为1630个(见表5),和原始方案相比略微增加。由此,在不超出经费预算的情况下,可考虑使用修正方案。四、结论
一、高度重视粮食产量抽样调查工作
我县是传统的农业大县,粮食生产一直占有举足轻重的地位,县委、县政府历来高度重视。开展粮食产量抽样调查工作,真实掌握我县粮食生产的实际情况,为各级制定有利于粮食生产发展的方针政策提供翔实的依据,对促进我县粮食生产平稳健康可持续发展,增加农民收入,不断满足城乡居民对粮食产品的需求,都具有非常重要的作用。对粮食作物播种面积和产量开展抽样调查是一种科学的统计方法,是提高粮食产量统计数据质量的有效途径,是提高政府统计公信力的必然选择。各级要充分认识粮食产量抽样调查工作的重要性,高度重视和支持这项工作。
二、严格执行统一的调查方案
粮食产量抽样调查是一项技术性很强的工作,方法科学、操作规范。上级统计部门给我县抽选的调查点是以上一次农业普查资料作为抽样框,直接抽选行政村。通过对这些行政村粮食生产情况进行抽样调查,推算出全县粮食生产的总体情况。各镇人民政府(街道办事处、管委会)、各抽中村(居)要严格执行《调查方案》,不能随便调换调查村、小区或调查户。严禁弄虚作假和人为干扰调查数据的现象发生,以保证调查网点的代表性,从而真实反映我县粮食生产的实际情况。
三、全力以赴做好粮食产量抽样调查工作
近年来,贸易统计指标体系围绕上述两条主线,进行了不断充实和完善,目前基本框架已经成熟或基本成型,但仍存在一些不足,主要有:1、对当前经济和市场环境的变化反应不灵敏。例如,对政府关心的商品市场总量平衡状况、关系国计民生的重要商品(如粮食、棉花、石油、钢材等)供求信息反应得不够;同时反映流通产业现代化进程的指标和分组过于简单,尚未建立起完整的反映商业连锁经营和现代商业业态状况的统计制度。2、贸易统计指标体系不完善.目前贸易企业生产资料销售量仅占社会销售量的20%左右,不能反映生产资料市场全貌;同时价格信息是商品市场最为敏感的信息,但目前商品价格统计与流转统计为“两张皮”,按不同的统计方法从两个渠道自下而上地统计,难于科学、全面和及时的分析商品市场全貌。3、现行的贸易餐饮企业的统计限额标准缺乏科学性和实用性.目前贸易餐饮业统计限额标准过高,能够达到限额标准而进行全数调查的企业数量太少,从而形成了与其他专业统计“抓大放小”截然相反的结果,贸易统计必须“抓小放大”,因为按现行限额标准,限额以下企业和个体户的商品流转量所占比重很大,影响市场趋势。而目前受多重因素的影响,限额以下企业和个体户又难于抓住和抓好。这是目前贸易统计数据质量下降的重要因素。4、目前贸易统计非调查(或派生)指标很少,从而直接影响和制约了贸易统计资料的深度开发。加之现行统计资料自身的缺陷和不足,导致贸易统计资料的利用程度很低。针对上述问题,笔者建议:
(一)贸易统计指标的设计应以满足用户需求为目的,采取务实和相对灵活的原则。贸易统计指标体系应随着经济和市场环境的不断变化而相应调整,不应当是一成不变的。目前首要的是恢复居民购买力平衡统计和主要商品产销平衡统计核算制度。因为在目前市场经济条件下的商品流通领域,绝大部分商品处于买方市场,市场环境相对宽松,政府的注意力必然转向如何启动内需以促进经济快速发展、如何确保商品总量平衡以防止市场波动、如何保护关系国计民生的重要商品的国家安全等。在从事这方面的分析研究时,居民购买力平衡统计和主要商品产销平衡统计资料无疑具有重要的作用,同时这些信息在很大程度上对国内市场起着预警的功能。可考虑仅要求在国家和省两级统计局利用相关资料进行编算,并不增加基层负担。
(二)尽快制定科学合理和实用的贸易餐饮企业统计划型标准。贸易餐饮业企业划型尚无国家标准,但统计上有一个限额标准,目前这一标准作为贸易统计开展目录抽样的依据,即对限额以上企业实施全数调查,限额以下企业和个体户实施抽样调查。笔者认为批发零售贸易业、餐饮业企业限额标准对贸易统计工作尤为重要,它直接影响着贸易统计工作的格局和今后的发展方向。根据目前的限额标准(批发企业年销售额2000万元及以上、零售企业500万元及以上、餐饮企业200万元及以上,年末从业人员分别为20人、60人和40人),限额以上批发零售企业的销售额占全部批发零售贸易业的47%,其中零售企业仅占26%;企业单位不足3万家。建议将目前的限额标准降低,也就是要提高限额以上企业的比重,其销售额应该提高到70%以上,其中零售额比重应提高到60%以上。届时限额以上企业约达到7万家,足以反映商品市场的总规模和发展变化趋势。今后贸易统计只要紧紧抓住这7万家限额以上企业,工作就会变得较为主动,数据质量也有一定的保障。也可减轻限额以下贸易业抽样调查工作的压力。同时现行的许多贸易统计信息(如限额以上企业财务统计指标)也会“身价倍增”,变得很好用了。
(三)要在“十五”计划期内取消社会消费品零售总额指标,从而完成贸易统计核心指标的过渡,并完善贸易统计指标体系。我国即将加入WTO,贸易统计必须象其他专业统计一样,加快与国际接轨的步伐。现行的贸易统计核心指标“社会消费品零售总额”指标,由于其自身存在许多弊端和目前资料采集方面的制约,数据质量不断下降,已经难以为继;从现在开始,必须统一认识,逐步弱化这一指标,相应突出和加强批发零售贸易业、餐饮业(可能的话应含服务业)的商品零售额统计,因为它涵盖了90%以上的商品零售额,目前可考虑同时公布以上两个指标,2年以后用后者取代现行社会消费品零售总额指标。同时完整的商品市场是由生活资料和生产资料两大市场组成,生产资料流通总规模的发展变化,反映社会再生产的规模和水平。要在国家和省两级统计部门,主要依据工业统计报表和贸易统计报表有关指标,按季度测算社会中间产品销售总额(或称社会生产资料销售总额)。从宏观上反映生产资料市场的发展变化,这项工作对于贸易统计来说也是责无旁贷的。
(四)要从宏观上研究商品流转统计与商品价格统计的配套问题。这个问题目前比较复杂,因为涉及到现行统计体制问题,但现在必须认真的研究。在现行统计体制基本不变的前提下,可以设想将目前商品零售价格统计基层的采价过程与目前基层商品流转统计过程有机的结合起来,确保商品价格统计和流转统计基础资料的配套,然后按现行统计体制,在县级统计局“分家”,分别按贸易统计和价格统计的不同渠道逐级上报。这样综合资料和许多结构性资料就能配套使用了。
二、关于目前贸易统计制度的改革与完善
统计制度是政府统计部门对调查对象、调查内容、调查表式、调查方法、报送时间及方式等内容进行的专门规定,它既是对统计指标体系的具体体现,又是对具体统计调查工作的综合要求。统计制度的改革相对于指标体系改革而言,既有从属性,又有相对独立性。就目前贸易统计制度的改革来讲,笔者认为要注意做好以下几个方面工作:
(一)贸易报表制度修订要遵循“进度侧重反映趋势、年度侧重反映总量与结构”的原则。目前贸易餐饮业报表体系中,必须精简进度报表内容与工作量,以利于上下都能轻装上阵,快速反映商品市场发展变化动态。进度统计只要反映社会消费品零售总额和贸易企业商品销售总额及其主要构成情况;年度统计则必须全面反映贸易餐饮企业基本情况、流通总规模及其结构状况、企业财务状况及其经济效益等,为深入分析研究流通产业发展现状、为宏观决策以及为国民经济核算提供基础性资料。
(二)要强化商品类值统计、弱化现行行业统计。目前国民经济行业分组标志越来越难以反映贸易企业真实状况,因为按现在许多企业的实际经营范围,己经无法准确地界定和将其划归为某个行业,流通企业在一定范围内经营的情况己不复存在。年度统计中的按企业登记注册类型分组统计应加强,因为它反映企业所有制结构;而行业分组目录要大为压缩,仅区分为批发业、零售业、餐饮业即可,因为再细分既难于操作,也缺乏经济分析意义。同时要强化对贸易企业商品经营类值的统计,因为详尽的商品分类信息,对处于上游的生产环节和处于下游的消费环节均具有导向作用。建议将目前我国商品分类目录由37个增加到60个以上。
(三)要加强对商业经营方式和零售业态的统计。我国即将加入WTO,外资开始抢占我国零售市场。这样一方面加快了零售市场与国际接轨的步伐;另一方面又极大地改变了我国商业传统的经营方式和单一的百货商店零售业态,目前国内零售市场可谓“百花齐放”:连锁经营迅速发展,连锁企业达1500余家,连锁门店超过26000家,销售额突破了1500亿元,超级市场和专卖店亦应运而生。我国商业尤其是零售商业已步入重组时代。但目前尚未建立起完整的涵盖全社会的商业经营方式和零售业态的统计制度,既不能为政府提供零售市场翔实的结构资料,也不利于我国零售业的国际比较研究。因此建立完整的连锁经营和零售业态统计制度,无论是对探索其发展变化规律,还是引导和规范市场行为,都是一项重要的基础工作。
(四)要进一步完善商品交易市场定期统计制度。商品交易市场即有固定交易场所、进行经常性常年交易、并设有专门管理机构的现货交易市场。这种我国特有的商品交易形式近年发展很快,目前全国较为规范的市场近6万家,年成交额突破2万亿元,商品零售额己占全社会的20%。对繁荣经济、方便生活、安排就业均作出了贡献,这种交易形式将在今后很长时间内存在和发展。我局在1999年进行了商品交易市场基本情况快速调查基础上,于2000年起建立了重点商品交易市场成交情况的的季报制度,目前已基本走上正轨。今后主要从报表运作方式、完善统计指标上进行规范和完善。
(五)要尽快研究建立主要商品品牌统计制度。我国目前的商品市场己处于买方市场,大家关心的己经不是哪些商品好销,而是哪种品牌的商品好销,因而商品的品牌信息己经成为商品生产者、经营者和消费者共同关心的信息。统计部门必须顺应市场形势的变化,适时地研究建立主要商品品牌统计制度。可考虑将目前“限额以上批发零售贸易业商品销售、库存”年报表设计改造成“限额以上批发零售贸易业主要商品品牌统计”年报表,选择与人民生活和生产建设密切相关的30种商品进行品牌信息的年度统计。
三、关于贸易统计调查方法的改革
我国的贸易统计抽样调查工作是随着商品流通体制改革的深化和市场环境的变化而提到议事日程上的。从小型贸易企业开始,到目前己经扩大至包括个体经商户在内的全部限额以下贸易餐饮业;由于多方面因素,前期推进的速度慢一些,而近2-3年推进的速度明显加快,目前各地区普遍完成了小型贸易餐饮业和个体户的抽样调查试点工作,近10个地区经过连续抽样调查的观察和验证,己经达到国家规定的抽样调查精度,具备了用抽样调查数据替代全面统计数据的条件。这项工作的成绩应该肯定,但影响这项工作整体推进和深入开展的问题仍很多。除具有与其他专业抽样调查工作相同的问题(如受分级经济管理模式的制约而使抽样调查工作的推广困难重重、各种干扰因素影响抽样调查数据质量、受传统统计调查模式的影响和束缚而使统计系统自身缺乏调查方法改革的内在动力等)之外,目前贸易抽样调查工作还受调查方法、调查体制以及保障条件等因素制约。所以必须从整个统计设计和理顺统计体制的全局出发,统筹考虑和合理安排,才能使贸易抽样调查工作深入和扎实地开展下去,真正发挥出统计调查方法改革“突破口”的功能。
从近期工作看,各地区已普遍开展了贸易餐饮业抽样调查的试点和探索工作,只是工作的深度和广度不同而己。目前必须尽快结束全面试点,将工作重点转入抽样调查成果的应用,要有计划、有步骤地在2-3年内使各地区的贸易抽样调查工作达到具备用抽样调查数据替代全面调查数据的条件,并在经费基本到位的前提下,在尽可能多的地区实现数据替代。数据替代及其相关工作的完成,即贸易抽样调查工作基本到位。当前必须做好以下工作:
一是必须尽快对全国的贸易抽样调查方法和样本户调查指标进行规范和统一。对贸易抽样调查方法的采用,国家未作统一规定,只提供了参考方案,由各地区结合实际灵活运用。但目前这项工作进入应用阶段后,改变各地调查方法的多样性以利于调查资料的开发利用就成为一项重要的前提条件。经过多年的实践,可以按“小型企业采用分层等距抽样、个体户采用整群抽样”的思路来规范和统一全国的贸易抽样方法。各地区根据这个原则并结合本地实际制定实施方案,确定抽样总体和样本量,只要对本地区有足够的代表性即可。国家只要求达到一定的调查精度和按一定要求与格式上报抽样调查资料。同时对样本企业(户)的调查指标和相关要求(如调查频率、数据采集方式等)也应统一,以利于抽样资料地区之间的可比和全国抽样调查成果的利用。
二是积极而又稳妥地做好数据替代工作。用抽样推断数据替代全面统计数据,是贸易抽样调查的工作目标。但实现目标必须积极而又稳妥,因为一旦替代,传统的调查渠道即告中断,还须做好与历史资料的衔接,实现平滑过渡。所以实现数据替代的首要条件是调查方法趋于成熟,调查数据经过连续观察和验证基本符合实际情况;其次是数据替代的后续经费保障条件要从根本上解决,必须纳入预算科目。目前小型贸易业的数据替代技术条件基本成熟,大部分地区具备了替代条件;而个体户由于受总量与结构不清、调查方法的不完善与不统一等因素制约,目前仅有约三分之一的地区具备替代条件。而后续的调查经费保障条件机制目前也尚未形成。
中图分类号 F302.5;C811 文献标识码 A 文章编号 1007-5739(2014)17-0281-03
认识事物的途径多种多样,基本途径是通过各式统计获取资料,用科学方法进行处理和分析,并据此得出相应的结论。统计调查法在实践中逐渐从普查发展成了普查、抽样调查及其他调查等多种方法并行的状况。抽样调查法是一种科学的统计调查方法,因其灵活性、时效性、精确性等诸多优点,在国外社会、经济、科技、自然、渔获量统计等领域发挥了巨大作用。抽样调查法在中国发展缓慢,直到改革开放以后才得以较快发展,主要应用于人口、经济、科教文卫、资源等领域。
近年来,抽样调查法在渔业生产统计领域的应用日渐广泛。袁兴伟等[1]对南海区三省渔业生产统计研究表明相同条件下分层抽样的精度高于简单随机抽样;甘喜萍等[2]论述了应用于渔业生产统计的经济分层抽样原理;Bannermanl与Lamptey研究了分层抽样在小规模渔业生产数据中的应用。世界粮农组织(FAO)与中国合作在湖北梁子湖、浙江象山及山东莱州等地区对渔业生产开展抽样调查,调查结果较为客观地反映了各地捕捞生产实际情况。目前关于海洋捕捞业渔获量抽样调查中的样本代表性、样本量的确定、分配、样本轮换等关键问题的系统理论探究报导很少,本文旨在解决这一问题,以期为海洋捕捞业渔获量抽样调查方案设计及应用奠定理论基础。
1 样本代表性
1.1 样本代表性的含义与作用
捕捞产量抽样调查只需少量渔船单元作为样本,统计分析这些样本渔船单元的捕捞数据,然后推断评估总体渔船捕捞产量情况,因此要求所选样本渔船单元有较高的代表性。抽样调查中首次出现“代表性”由挪威凯尔(A.N.Kiaer)于1895年提出,其观点是认为样本是总体的缩影,选出少量正常合理的样本就能反映总体情况,对总体评估准确与否主要取决于样本的代表性[3]。后来在如获取代表性样本问题上先后出现了目的抽样和概率抽样2种观点,前者根据抽样调查的目的有意识地抽取样本单元,使所得样本与总体特性相近。
目的抽样观点认为所选样本应当在结构上与总体相似。例如,若将渔业生产调查区的渔船根据主机功率按大小分为A(20%)、B(30%)、C(50%)3层后,样本包括a(20%)、b(30%)、c(50%)才最具代表性。实际上,研究调查的主体不是渔船,而是基于渔船的捕捞活动记录数据。各层样本渔船单元数量分配应依据该层渔获量对总体渔获量的贡献而定,而不是只考虑该层渔船单元数在总体中的的比例,如果各层渔获量贡献率也符合该比例,那这样的样本组成就有很高代表性。一个与总体结构相似的样本并不一定能保证充分体现出总体信息,这也是在分层抽样样本分配中最优分配精度优于比例分配的原因。
目的抽样只涉研究员认为符合调查目的部分总体渔船单元单元,却没有依据说明余下部分不能够代表总体,至少是总体的一部分,而这些渔船单元却没有作为样本的机会。英国统计学家鲍莱(A.L.Bowley)提出中心极限定理应用于概率抽样的总体参数估计,认为应当赋予每个单元都有作为样本的机会[4]。每个渔船单元的机会是否相等与总体渔船单元间的差异程度相关。若差异程度不大,等概率比较适宜;反之,不等概率较为宜。例如,调查某海域捕捞渔获量时,按渔船主机功率(kW)将渔船分为A(1.0~44.1,30%)、B(44.1~147.0,40%)、C(147.0~441.0,30%)3层,相同条件下,功率越大,渔获量越大,故对区域总体渔获量而言,B层和C层的贡献率比A层大很多,选样时,应考虑不等概率抽样,使A层样本渔船单元数量向B层和C层倾斜。无论是等概率还是不等概率抽样,目的都是尽可能提高总体参数精度。
事实上,代表性是一个泛概念,与抽样分布有关,即所有可能样本的估计量的概率分布,单纯认为某一具体样本有多大的代表性是片面的。在众多可能样本中,一次调查抽到的样本有优劣之分,且优劣程度还与概率有关。例如,某海域所有拖网渔船的渔获量的均值是1 000 kg/(d・艘),根据2种抽样方案X、Y所得的样本均值方差V(x)=50,V(y)=100,显然,方案X属较好,能更好反映总体情况;在既定的置信水平下,X方案所得均值的置信区间比Y的窄,所得结果也更精确。样本代表性是属性概念,不能用具体数值说明它的高低。一些观点认为其高低可用(e-E)/E或(p-P)/P等相关系数来表示,只要样本均值e(或比例p)和总体均值E(或比例P)越接近,比值越小,样本代表性越高,但或忽略了总体参数E(或P)则是未知的,需要根据样本均值e(比例p)分析推断。需要说明的是,不同的抽样设计,样本代表性不具可比性,而同一抽样设计所得不同样本的代表性却有高低之分。
1.2 代表性较高的样本获取方法
只要是统计调查,就会存在误差,即使普查也依然存在。因此,为更好反映总体渔业生产情况,要选择高代表性的渔船单元样本。尽管有抽样方法、样本量、总体渔船单元差异度、辅助信息等其他诸多因素影响,很难说明抽到的样本代表性高低,但仍能采取一些措施以获取代表性较高的样本渔船单元。首先是改进抽样方法和评估方式,例如采用分层抽样,设计公式或模型计算样本量、分配量、估计量等;其次是适当增加渔船单元样本量;再次是利用渔业辅助信息,渔业辅助信息对于渔船分层标准划分、层间渔船单元分配、有效回答率等方面具有重要作用;最后还要减少其他非抽样因素引起的误差,如人员操作、问卷设计等方面。
2 样本量
2.1 样本总量确定
由于渔船主机功率变化范围大,渔获量差异程度高,捕捞记录数据就构成了一个方差很大的总体,考虑到分层抽样精度高、便于实施、获得信息多等优点,在渔获量调查中采用分层抽样法。不仅仅是渔获量调查,其他设计复杂的渔业抽样调查也一样,样本量确定也很困难,但却比相同样本量的简单随机抽样结果的精度更高。因此,本文用简单随机抽样计算所需渔船捕捞记录数,并根据除以调查次数得到样本渔船单元数。
简单随机抽样法计算所需样本渔船单元捕捞记录数时运用到一系列的公式及其相关推断公式[5]。根据置信区间公式,P{X-Δ≤X≤X+Δ}=1-α,式中,X表示均值,1-α表示概率;(X-Δ)和(X+Δ)分别为置信区间的2个极限,α是置信水平,Δ为极限误差,即设计的渔获量统计方案允许的最大误差。渔获量调查是不重复抽样,样本渔船单元捕捞记录数表达式m=,m除以相应的捕捞次数就是所需样本渔船单元数n,t表示既定自由度和置信水平下的Student t分布t的取值,可从t-test临界值表中查询;σ2表示总体方差,用样本方差S2代替,n/N为抽样比,当n/N>0.05时,也可以忽略其影响。
在FAO渔业抽样调查捕捞活动记录数确定中,最大允许误差范围一般设定在0~10%,即对应的准确度100%~90%[6]。其他渔业内容和渔获量调查也一样,除极少数要求非常精确1%外,多数采用的是5%和10%。这个n只是理论所需的全部有效样本渔船单元数,即保证这n个样本渔船单元在每调查次数内都有捕捞活动记录数据。而实际上,预算也是限制样本渔船单元数量多少的重要因素,可用线性关系式C=C0+cn1来表示预算与样本量的关系,其中,C为预算,C0表示设备、工资、宣传等与样本渔船单元无关的费用,c表示单位渔船单元调查的平均费用,可通过试点调查或从以往的渔业调查评估获取;此外,渔船(渔民)样本的有效回答率p也是一个不能忽略的因素,结合理论有效样本渔船单元数,实际所需样本渔船单元数n′=n/(1-p)。通过比较n1和n′大小以确定最终样本渔船单元数,若n1≥n′,预算能够支撑方案设计的样本量;若n1
关于确定样本渔船单元数,试点调查是一个值得研究的问题。上述公式中的总体方差σ2(样本方差S2),总体以及各子总体渔船(渔民)有效回答率p,单位渔船单元调查平均费用c都是未知的。来源主要有2种:一是从以往的渔业调查及相关资料中获取;二是通过试点调查获取。从以往资料获取信息能节省试点调查的费用,但是试点调查却能发现更多其他问题,从而反馈,有利于正式调查的顺利进行。
2.2 样本分配
甘喜萍等[2]研究表明,满足预设条件下,奈曼分配最精确,最优分配最省。虽然最优分配和尼曼分配在预算和精确度上有优势,但在满足精度下,比例分配因其简便特点应用更普遍。实际调查中往往还存在很多其他因素影响样本渔船单元的分配。渔业调查的对象和内容很多,既有单一目的也有多目的的调查,既有数量性状、质量形状也有属性形状的调查,选择分配方法时不能一概而论;若仅对某一渔区某种作业方式的单一捕捞目标种的渔船开展抽样调查,条件允许时,优选奈曼分配;如果预算不足,可退而选择最优分配或比例分配。若是一些渔业生产中的属性问题开展抽样调查,如渔民对渔业可持续发展、渔业政策等问题的看法,则可用比例分配法简化调查过程。若渔业调查对象涉及大范围内各型功率和作业方式的渔船,且调查主题还比较多,比例分配则较为方便可行。渔获量统计调查涉及到的不仅是渔获量问题,为节约成本,常与其他主题(如CPUE、渔获物初次交易价格、捕捞活动经济收支等)集合在一张问卷中同时进行,因此一般选择比例分配法。因此,选择样本分配方法时,应具体问题具体分析。
3 样本轮换
3.1 轮换原因
渔获量调查是连续性的调查,如果样本长期不更换,就会出现样本老化问题。这里的样本渔船单元老化是指广义的渔船老化,既指渔船本身老化,也包含渔船改装、渔民合作等渔船不适宜再作样本等情况。因此,需要更换不能再作样本的渔船,数量取决于预算和精度。
为解决样本渔船单元老化问题,需要重新抽取渔船单元来替换老化部分。如果全部更换,则会额外增加预算,一是用于与调查对象(渔民及其相关人员)沟通,以便得到他们的配合;二是用于培训渔民完成相关任务。一旦样本更换,又需要重新与新的渔民建立合作关系。因此,短时间内不宜频繁地更换大比例的渔船单元,除非有特殊原因,一般不进行全部样本渔船单元的更换。
渔获量调查是连续型调查,更换样本渔船单元最重要的原因在于通过后期样本渔船单元的更换来解决前期抽样调查中样本渔船单元出现的问题。例如,分层抽样调查渔获量过程中,样本渔船单元在出海捕捞作业过程中遭遇恶劣天气,船体损坏严重降低捕捞能力;部分合作渔民私自改装渔船功率或者船体,使得原本属于A层抽样层的样本变成了B层样本,而仍统计在A层。有些原因是可以量化计算改变的,但那些不能人为量化的因素则不得不替换这些样本渔船单元。例如,少数样本渔船单元的渔民在合作后期基于个人私利而增加或者减少捕捞活动,甚至故意编造渔获量数据;一些样本渔船单元随着时间的推移,性能退化,不再满足最初设计条件,则需要用其他更合适的渔船单元予以更换,以保证这一层次的样本仍具有较高代表性。
3.2 轮换原则
渔获量抽样调查工作具有长期性和周期性等特点。为解决样本渔船单元老化问题,需要适时予以轮换,但轮换过程中应遵循下列原则。
(1)代表性。样本代表性降低是样本轮换最主要的原因。正是因为在连续性渔获量调查中,渔船性能和渔民合作行为等方面的变化,使得先前的样本渔船单元不再满足该层次的要求,或者是样本数据不真实,从而导致不宜继续作为该层次的样本。如果没有这些方面的变化,该层次先前的样本渔船单元仍具代表性,可不用更换这些样本渔船单元。
(2)连续性或者衔接性。渔获量调查如同其他国民经济调查一样,并非一次性调查,需要建立相应的渔获量数据库,根据样本渔船单元数据的时空序列特征反映渔获量状况。即使换了渔船单元,也要保证前后样本渔船单元数据时空序列上的衔接性。换言之,用于更换的渔船单元也必须通过最初设计的抽样方案选取。
(3)条件性。频繁更换全部样本渔船单元并不科学,一般是在一段时间内更换一定比例的样本。实践证明样本单元更换的速度以及比例与样本的变化并不同步[7]。从渔业其他内容的抽样调查来看,考虑到渔船老化的速度以及1年内合法作业时间段,样本渔船单元轮换的周期为1~2年、比例以25%~50%为宜,这样可有效避免样本频繁更换导致的数据不连续问题的出现。
3.3 样本轮换流程与技术
样本轮换的基本流程是更新总体渔船单元目录框,检查原样本,抽取新渔船替换。在周期内,从渔业管理部门获得最新渔船信息,剔除无效渔船单元,补入新增渔船单元。在更换程序中最复杂的是检查原样本,和总体渔船单元一样,把原样本中老化的剔除,包括不能继续捕捞作业、渔民转行、渔船大幅改装等情况。抽取新样本渔船单元相对容易,根据最初设计的渔获量统计抽样方案,在更新的总体渔船单元中选取即可。目前主要有2种流行的方法:一是在更新的目录框中随机抽取满足要求的新渔船单元替换;二是在分层抽样的最终抽样层中,把满足条件的所有渔船单元分成几个组,然后周期性进入调查期轮换[8]。
4 结语
综上所述,抽样分布是从总体中以一定的样本容量进行随机抽样,样本的统计数所对应的估计量与其概率的分布。渔船代表性对抽样分布有意义,但不能理解为某一具体样本代表性很好,不同的抽样设计或分布之间代表性不具可比性,而相同抽样分布中的不同样本却可比,同样的抽样设计中,可以适当采取措施来获取高代表性的样本,以提高抽样精度。公式得来的作为样本的渔船单元数只是有效样本数,实践表明,渔业生产调查中的无效样本率不能忽略,其比例因渔业抽样内容而异,应将其应用于最终实施所需渔船单元数的确定和分配。渔获量调查属于连续性调查,随着时间的推移,样本渔船本身及其合作关系的变化会导致代表性降低,因此需要进行轮换以减小影响。轮换过程中应当注意代表性、连续性等原则以及与之相关的轮换方法。
5 参考文献
[1] 袁兴伟,刘勇,程家骅.分层抽样误差分析及其在渔业统计中的应用[J].海洋渔业,2011,33(1):116-120.
[2] 甘喜萍,卢伙胜,冯波,等.分层抽样法应用于渔业生产统计的研究[J],安徽农业科学,2008,36(20):8401-8402.
[3] 冯士雍.抽样调查理论与方法[M].2版.北京:中国统计出版社,2012:15-22.
[4] 李金昌.正确理解样本代表性[J].中国统计,2010(8):40-41.
[5] 李金昌.应用抽样技术[M].2版.北京:科学出版社,2013:56-62.