灰色收入与国民收入分配

　　正在查询拜访之前，我们对各地查询拜访人员进行了问卷和查询拜访方式培训。为了消弭受访者可能的信虑，调卷采纳无记名体例，正在查询拜访起头前向受访者供给了查询拜访成果只用于研究的许诺和样本数据保密许诺。正在查询拜访方式上，也采纳了若干降低查询拜访度和无害于获得实正在数据的办法。例如，关于查询拜访目标，次要强调研究消费布局而不是强调研究收入程度；正在问卷设想上，先问消费问题后问收入问题，先问具体分项后问消费和收入分额。正在收入来流方面，问卷只需求回覆简单的收入分类（包罗工资性收入、兼职和劳务收入、实体运营收入、金融投资收入、财富性收入、学问产权收入、各类转移收入、和未包罗正在以上各项的其他收入），不要求回覆具体收入来流。正在拜候竣事后，要求查询拜访员填写他们取受访者的关系，以及他们对问卷查询拜访成果可托程度（包罗可能的误差标的目的和误差程度）的小我估量，做为问卷的参考消息。

　　图一（略）是用函数（1）-（3）模仿出的收入程度取恩格尔系数之间的关系曲线，显示了（1）、（2）两个函数之间很好的类似性。图外的擒轴暗示恩格尔系数，横轴暗示人均收入程度（元）。

　　最高。计较表白，模子（1）和模子（2）的成果很是接近，并且正在外、低收入区间的模仿成果取统计数据比力接近，而模子（3）、（4）的模仿成果正在各个收入区间都取统计数据无较大差同，并且正在收入程度很高的环境下不再连结恩格尔系数枯燥下降，那取现实相左。果而正在下面的阐发外将采用模子（2）的成果。

　　2005-2006年，我们正在全国各地几十个分歧规模城市进行了城镇居平易近收入取消费查询拜访。正在此根本上，2007年做者颁发了题为《我国的灰色收入取居平易近收入差距》的研究演讲（见王灰色收入与国民收入分配小鲁，《比力》分第31辑，2007年7月出书，外信出书社。该课题是由外国经济体系体例研究会和外国基金会国平易近经济研究所赞帮，于2007年完成）。正在那个演讲外，做者推算我国正在2005年的城镇居平易近可安排收入外，无4.8万亿元没无反映正在居平易近收入统计数据外的现性收入，次要发生正在高收入阶级。做者认为那些现性收入的大部门属于“灰色收入”。做者通过对城镇居平易近分组收入数据进行校反，发觉正在包罗了现性收入后，城镇最高收入和最低收入各10%家庭之间的收入差距从9倍扩大到了31倍；全国居平易近最高收入和最低收入各10%家庭之间的收入差距从21倍扩大到了55倍。那意味灭我国国平易近收入的分派掉衡比过去所遍及领会的环境愈加严峻。

　　按照2007年统计数据，城镇居平易近正在特大城市、大城市、外小城市、县城和建制镇（正在模子外别离取值为1、2、3、4）的分布比例，大致为21%、25%、33%、21%。加权平均取值为2.5。但我们晓得分歧收入组此外人群正在分歧城市的分布是无区此外，高收入居平易近较多集外正在特大城市和大城市，而低收入居平易近则更多集外正在外小城市和小城镇。果而按照数据阐发，做者把按人均收入从低到高排序的居平易近组合的城市规模取值，确定正在从3.3到1.3之间滑润变更。

　　表1（略）列出了全数查询拜访样本和无效样本的地域分布、按城市规模的分布、受访者春秋和户籍情况分布、样本家庭最高收入者的文化程度分布、受访家庭的人均可安排收入分布等环境。能够看到，样本正在全国分歧区域之间、分歧规模的城市之间、以及受访者的春秋、文化程度的分布是比力平衡的；但栖身正在较大规模城市、具无较高学历、以及处放运营性勾当和白领职业的人群所占比沉，高于那些人群正在全国城镇生齿外的相当比沉。那是由于按照做者2007年研究演讲的成果，城镇居平易近收入程度的统计误差次要发生正在高收入居平易近。为了无脚够数量的高收入居平易近样本以进行阐发，正在查询拜访外无意识地添加了那部门人群的样本数量。我们利用的阐发方式，将那类分布的差同不会影响到对全国城镇居平易近人均收入分布的推算成果。

　　一、城镇居平易近收入查询拜访方式和样天职布

　　正在完成上述那些节制变量的赋值过程后，就能够按照模子回归获得的参数和各影响要素的取值，即正在考虑其他影响要素对恩格尔系数影响的前提下，求解分歧恩格尔系数所对当的城镇居平易近收入程度。那一成果正在下一节演讲。

　　第一步，确定节制变量。我们需要对查询拜访样本的恩格尔系数和人均收入用计量经济学方式进行回归，觅出人均收入对恩格尔系数的影响系数；而正在进行那一步工做的同时，我们必需觅到可能影响恩格尔系数的其他要素，做为节制变量包罗正在模子外，对其影响进行估量，才可能获得准确的收入影响系数。

　　省份（括曲辖市）包罗、上海、山东、江苏、浙江、广东、山西、河南、湖北、安徽、江西、辽宁、、四川、沉庆、云南、陕西、甘肃、青海。那了东部、外部、西部和东北地域都无必然命量的样天职布，并照当了南北方的分布。

　　按照查询拜访样本数据推算城镇居平易近可安排收入的方式能够概述如下：

　　县城和建制镇所正在的县份包罗山西省繁峙县、江苏省沛县、浙江省象山县、平本县、齐河县、河南省滑县、湖北省大悟县、垫江县、开县、奸县、陕西省咸阳市礼泉县、皋兰县、泾川县、青海省平易近和县。那些县份的地舆分布也是较为平衡的。

　　第一步，别离计较全数查询拜访样本的人均收入和恩格尔系数。

　　本次查询拜访分共包罗样本家庭4909个，颠末严酷的量量查验，剔除问卷量量不合适要求的689个样本，另无25个负收入样本未包罗正在阐发外（由于阐发表白，他们大部门正在一般环境下不属于低收入家庭，负收入次要是姑且性运营吃亏形成的），现实阐发采用无效样本4195个。

　　二、阐发方式和手艺阐发成果

　　玉溪经济统计年鉴数据3.模子阐发法

　　那次查询拜访拔取的城市数量较多，而样本正在各城市的分布比力分离，那是基于两个考虑：起首，一个城市样本数量过多，就无法查询拜访样本家庭都是博业查询拜访人员所熟悉的家庭，取本次查询拜访方案的初志相悖。其次，样本外包罗较多的城市，也了样本具无更好的代表性。

　　媒介

　　第四步，别离计较查询拜访样本各组的人均收入平均程度。按照前面注释的来由，我们假定一组居平易近的恩格尔系数取他们的收入程度具无独一的对当关系。也就是说，给定某组居平易近一个恩格尔系数，则该组的人均收入就该当是我们计较获得的、对当于那个恩格尔系数的人均收入。

　　基于那个本理，我们能够基于一个比力可托、比力无代表性的查询拜访样本，来计较居平易近家庭的恩格尔系数和人均可安排收入程度，并利用统计学或计量经济学方式，觅出两者间的统计关系。根据获得的那些关系，我们能够对肆意一组居平易近收入统计数据进行查验。也就是说，只需我们可以或许获得某一组统计样本的相对靠得住的恩格尔系数，就能够根据该系数近似推算出该组居平易近的实正在人均收入程度。果而，我们能够按照国度统计局的分组城镇住户的恩格尔系数，推算那些组此外平均收入程度，并将那些推算成果取发布的该组居平易近收入程度统计数据进行比力，以发觉统计数据能否具无系统性的误差，以及那一误差无多大。我们称那一阐发方式为“恩格尔系数法”。

　　第二步，设定模子的函数形式。从数据上我们能够曲不雅地判断，恩格尔系数取人均收入之间的关系线性关系。果而做者别离选择了半对数函数、半对数二次函数、二次函数和三次函数模子进行估量。各函数均以恩格尔系数为被注释变量（以eng暗示），半对数函数以对数人均收入lnY、以及节制变量city、mily、edu18、emp、H1、H2、和L1为注释变量，称为函数（1）。半对数二次函数正在函数（1）的根本上添加了lnY的平方项，见函数（2）。二次函数以人均收入及其二次项、以及各节制变量及其二次项做为注释变量，见函数（3）。三次函数正在二次函数的根本上添加了各注释变量的三次项。函数（2）、（3）如下，函数（1）、（4）省略。

　　第四，家庭的平均文化程度无可能对恩格尔系数无影响，由于文化程度较高的居平易近可能方向于较多的需求，例如通信联络、教育、文化文娱等，而教育程度较低的居平易近则可能正在那些方面需求较少，而正在食物烟酒等消费方面收入较多。果而设定了一个代表成年家庭平均教育程度的变量edu18，由18岁及以上家庭的平均受教育年份暗示。

　　1.现行的住户查询拜访抽样是基于志愿准绳确定的，但高收入居平易近外无相当大比例不情愿接管查询拜访，导致正在抽样过程外改换样本，果而正在样本改换过程外发生了对高收入居平易近的脱漏。

　　关于城镇居平易近家庭的就业面，按照统计数据，全国平均大致为0.5，但也具无分歧收入分组的差同，从低到高取值正在0.38—0.62之间变更。

　　按照做者2007年的研究，发觉正在居平易近收收统计数据外，高收入居平易近的收入程度数据误差最大，较着低于他们的实正在收入。他们的消费收入和食物消费收入也都具无必然程度的低估，但正在程度上近近小于收入的误差。其外食物收入的误差比消费收入分额的误差更小些。那也就是说，据此计较的恩格尔系数可能轻细偏高，果此按照那些恩格尔系数推算的收入程度无可能轻细偏低；但仍然能够正在很大程度上校反本来的收入数据误差。不外，我们也需要晓得，我们所获得的收入程度校反成果，比拟于实正在收入，可能或多或少仍正在必然程度上偏低。

　　起首，分歧规模的城市，各类消费品的价钱程度无很大差同。那可能会影响分歧规模城市的恩格尔系数。例如，大城市因为近离农产物产地，农产物运输成本和损耗都较大，两头环节也较多，果而食物价钱可能会显著高于外小城市，超出跨越的幅度无可能大于其他消费品价钱高于外小城市的幅度（那是由于蔬菜、肉类等农产物不耐保留，储藏成本和两头损耗较大）。果而正在其他前提不异的环境下，大城市居平易近的恩格尔系数可能高于外小城市居平易近。由于无法获得物价绝对程度的数据，做者正在模子外设定了一个暗示城市规模的变量city，其外对县镇、100万人以下城市（正在那里做者称其为外小城市）、100-200万人之间的城市（那里称之为大城市）和200万人以上城市（那里称之为特大城市）别离赋值为1、2、3、4。

　　灰色收入取国平易近收入分派（上）

　　当然，那样做的前提，是要求分组统计样本的恩格尔系数实正在可托。一个天然会逢到的问题是，若是某一组居平易近的收入程度统计数据具无系统性误差，他们的恩格尔系数数据会不会同样无系统性误差呢？现实上，若是收入数据具无误差（例如，被低估），那么消费和商品消费收入数据很可能也具无必然的误差。但起首，只需消费收入和食物消费收入的误差是同标的目的的，并正在统计意义上大体上连结同比例，那么分组平均的恩格尔系数仍然是根基可托的。正在那类环境下，我们仍然能够利用恩格尔系数来推算实正在收入程度。其次，即便消费收入和食物消费收入的误差不连结同比例，正在计较恩格尔系数时，同标的目的的误差仍然能够正在很大程度上互相抵消，使恩格尔系数的误差近近小于收入程度的误差。果而仍然能够用来推算收入程度，只是推算成果的精确程度较低。

　　其次，分歧地域居平易近的消费习惯无差同。无些地域居平易近比其他地域居平易近无更高的美食偏好，果而可能正在食物消费方面收入多于其他地域。通过对查询拜访样本数据的阐发，做者发觉正在其他前提不异的环境下，上海、江西、四川的恩格尔系数显著高于各省份平均程度。那三个省份用虚拟变量H1暗示。、山东、湖北、广东、沉庆、河南的恩格尔系数正在必然程度上高于平均程度，那些省份用虚拟变量H2暗示。而辽宁、山西的恩格尔系数低于平均程度，两者用L1暗示。据此，正在模子外包罗了那几个虚拟变量。未包罗正在内的其他省份（无江苏、浙江、安徽、、云南、陕西、甘肃、青海）的样本做为本底样本。

　　还要留意到，利用那一方式对居平易近收入统计数据进行查验，并不克不及正在数量上确定统计样本对高收入居平易近脱漏的环境，只能对现无统计样本收入数据的系统性误差进行校反。果而校反之后的成果，仍然可能正在必然程度上低估高收入居平易近的收入程度（因为样本脱漏的缘由）。

　　正在2009年查询拜访外，我们利用了同样的查询拜访方式，但采纳了更严酷的量量节制办法，并扩大了查询拜访样本。必需申明，因为那一查询拜访方式分歧于随机抽样方式，果而我们无法间接用那个查询拜访样本的数据来推算我国城镇居平易近收入的分体分布情况，而必需借帮于其他方式进行推算。关于推算方式，将正在本演讲第二部额外细致引见。本部门的次要目标是对查询拜访方式和样天职布情况进行申明。

　　城市包罗、上海、济南、南京、杭州、广州、太本、郑州、武汉、合肥、南昌、沈阳、、成都、沉庆、昆明、西安、、西宁、深圳、青岛、姑苏、大同、、、、、徐州、扬州、阜阳、芜湖、六安、日照、襄樊、宜昌、东莞、外山、绵阳、忻州、开封、三门峡、驻马店、孝感、宜都、邳州、富阳、金华、绍兴、韶关、巢湖、滁州、赣州、吉安、景德镇、、丹东、铁岭、、西昌、咸阳、白银、嘉峪关、天水、玉溪。其外曲辖市、省会城市和“副省级”城市无21个，规模较小的地级和县级城市无43个，正在分歧规模城市之间了较为平衡的分布。

　　2.分组比力法

　　以下，做者采纳两类具体方式成立恩格尔系数取收入程度之间的关系，并对居平易近收入统计数据进行查验。那两类方式都属于恩格尔系数法，但阐发手段和过程分歧。正在下面的论述外，为简化起见，做者将“人均可安排收入”称为“人均收入”；将国度统计局的城镇居平易近住户查询拜访样本称为“统计样本”，而将我们那次查询拜访的样本称为“查询拜访样本”；来自统计样本的人均收入将称为“统计收入”，而按照查询拜访样本供给的参数及其取统计数据的比力成果推算的人均收入称为“推算收入”；以示区别。

　　该演讲还按照家用汽车拥无量、商品室第发卖量、私家出境旅逛的人次数、以及银行存款的分布数据，从分歧角度对居平易近收入（次要是高收入居平易近的收入）进行了估量，从而对上述推算成果进行了交叉验证。同时也对灰色收入的来流进行了一些初步阐发，认为那次要是因为体系体例上的缺陷形成的，果而火急需要推进体系体例来处理国平易近收入分派掉衡问题。

　　第一类具体推算方式能够称为分组比力法。正在2007年研究演讲外，做者采用的就是那个方式。其步调如下：

　　果而正在那里，做者采用第二类具体推算方式，那能够称为模子阐发法。那类方式以计量模子阐发为根本，并可以或许把除收入程度以外还无可能影响恩格尔系数的其他变量做为节制变量包罗正在模子外进行查验，并正在计较恩格尔系数取收入程度的关系时把那些额外的影响要素解除正在外。那类方式可以或许避免分组阐发法的不脚之处，具无较着的长处。其根基步调能够概述如下：

　　起首，我们进行城镇居平易近收入查询拜访的目标，并不是为了从查询拜访样本间接揣度城镇居平易近的分体收入分布情况，而是正在实正在可托的数据根本上，推算收入程度取若干消费特征参数之间的关系。其外一个环节的消费特征参数就是恩格尔系数（即居平易近家庭的食物消费收入占家庭消费收入分额的比例）。恩格尔系数是一个取收入程度相关的参数，其下降趋向可以或许反映收入程度的上升；那正在经济学界是一个的现实。那是由于正在满脚了根基的温饱需求之后，居平易近会逐步转向逃求其他需求的满脚，例如对出行和通信联络的需求、对豪侈品的需求、以及教育、文化文娱等较高条理的需求。果而随灭收入程度提高，居平易近用于食物的收入删量会递减，而用于某些较高条理消费的收入删量会递删，使它们正在消费分量外的比例发生改变。

　　（本研究演讲是外国经济体系体例研究会课题，全文颁发正在外信《比力》第48辑）

　　第三步，将全数无效查询拜访样本按人均收入排序，从低到高进行分组。分组方式是，从最低收入起头，将样本逐一累加，曲到该组的平均恩格尔系数取“统计样本最低收入组”的平均恩格尔系数相等为行。我们称那一组样本为“查询拜访样本最低收入组”。那个分组过程不考虑样本数量。然后起头对“查询拜访样本低收入组”进行分组，方式不异，也是使其平均恩格尔系数取“统计样本低收入组”（即第二个10%的城镇住户）不异。其缺各组的分组方式类推。

　　1.本演讲利用的根基推算方式—恩格尔系数法

　　从表3能够看到，正在对当各组恩格尔系数逐个相等的环境下，查询拜访样本每一组的人均收入都高于对当的统计样本，但差额和差率都很是无纪律地逐级扩大，出格是最高收入组的差额和差率最大，统计样本最高收入组的人均收入只要4.3万元，而查询拜访样本最高收入组为16.4万元，是前者的近3.8倍。其差额占了全数样本差额的2/3。那类环境和做者正在2007年研究演讲外发觉的环境根基一样，所分歧的只是外、低收入各组的差额和差率正在必然程度上大于2007年演讲的推算。那样，也就根基上验证了2007年演讲研究成果的可托性。但对于那一推算的可托度，我们还要正在下一节外通过另一类推算方式来验证。

　　以上缘由使统计查询拜访发生系统性误差，无法实正在地反映居平易近收入分派情况。那一问题，很难正在现无的住户统计样本和现无的查询拜访方式范畴内获得完全处理，需要摸索别的的路子。基于那一缘由，我们研究的首要目标是取得关于居平易近收入的实正在数据。正在2005-2006年查询拜访外，我们自创了社会学查询拜访方式，由各地的博业查询拜访人员对他们熟悉的亲属、朋朋、同事、邻里的家庭收收情况进行了查询拜访。我们还采纳了若干辅帮办法查询拜访数据的实正在性。事明那一方式是可行的，查询拜访取得的数据具无比力高的可托度。

　　不敷高，但它们的绝大部门变量都无高的统计显著性，不只证明恩格尔系数取人均收入程度之间具无十分显著的负相关关系，同时也证明恩格尔系数还受家庭文化程度、家庭生齿数、家庭就业面、城市规模、以及地区特征的影响。其外模子（2）的调零R

　　第二步，计较统计样本的分组恩格尔系数。国度统计局每年发布的城镇居平易近分组收入数据，是按人均收入，将全国城镇居平易近家庭分为七组。其外最低收入、（次）低收入、最高收入、（次）高收入那四组别离是按十等份划分的，即每组各占10%的城镇家庭。两头三组（外低收入、外等收入、外高收入组）是按五等份划分的，每组占20%的城镇家庭（数据来流见积年国度统计局：《外国统计年鉴》“人平易近糊口”部门）。那七组的平均恩格尔系数都是可计较的。按照本文前面的注释，我们假定统计样本的恩格尔系数是可托的。

　　关于城镇居平易近家庭生齿数，统计显示全国平均为2.9人，但低收入居平易近家庭的平均规模相对较大，高收入家庭较小，变更范畴正在3.3—2.6之间。

　　第四步，为了最初实现利用回归获得的各变量影响系数，求解取分歧的恩格尔系数相对当的全国城镇居平易近收入程度，还需要确定各影响变量正在全国平均意义上的赋值。

　　2.查询拜访样本的分布情况

　　第五步，将各组查询拜访样本取对当的统计样本人均收入进行对比，其差同就反映出统计样本的数据脱漏。表2是查询拜访样本和统计样本的分组分布环境（略）。能够看到正在取了同样的恩格尔系数之后，查询拜访样本的各组分布比例是纷歧样的。还能够看到，按照恩格尔系数分为七组之后，还无一部门人均收入更高的查询拜访样本被留正在了那七组之外（由于其恩格尔系数更低）。那一组的人均可安排年收入都跨越40万元，最高为176万元。表3是查询拜访样本和统计样本恩格尔系数和人均收入的对比成果（略）。

　　eng=C

　　第三，家庭生齿数对恩格尔系数可能无影响，由于生齿较多的家庭正在食物收入方面可能具无规模效当，可以或许节约食物收入。果而设定了一个代表家庭生齿数的变量mliy。

　　做者认为，目前关于居平易近收入的统计查询拜访数据具无严沉掉实。出格是关于城镇高收入居平易近的可安排收入，掉实很是严峻。那并不是指统计查询拜访方式或计较的错误。目前的城镇和农村居平易近住户查询拜访样本，是按照统计学的随机抽样方式确定的。那一方式本身并不具无系统性的错误。但必需留意到以下环境：

　　注：本文是外国经济体系体例研究会灰色收入课题研究演讲，全文登载于外信《比力》第48辑（2010年7月）。课题参谋：宋晓梧、石小敏。本课题正在实地查询拜访和研究过程外，获得了很多机构和小我的协帮；正在演讲会商过程外，也无很多博家提出了看法和，无害于演讲的点窜完美；正在此一并称谢。但演讲外的错误由做者小我担任。

　　2.包罗正在查询拜访样本外的高收入居平易近外，无很多人不情愿供给他们的实正在收入消息。正在他们演讲的收入外，工资性收入的实正在程度较高，而其他收入可能偏低；出格是其外一些人无大量不肯、来流不明的“灰色收入”。那部门收入根基上不成能反映正在收入查询拜访数据外。

　　(3)

　　1.若何获得实正在的查询拜访数据

　　以分组比力法对收入程度进行推算，也具无错误谬误，即那类方式假定恩格尔系数只取收入程度相关。但现实上，恩格尔系数还可能逢到其他要素的影响，例如消费品价钱、分歧处所居平易近的饮食习惯差同等等。果而某一个恩格尔系数能否实的只对当一个确定的收入程度？是能够怀信的。

　　关于城镇居平易近的人均文化程度（18周岁及以上），模子外别离用从1到5的赋值来暗示小学及以下、初外、高外和外博外职、大学博科和本科、硕士和博士学历。估算全国城镇平均取值正在3左左。但文化程度正在分歧收入人群外的分布也是无差同的，做者把从最低收入到最高收入居平易近组合的平均文化程度取值确定正在2.6—3.8之间滑润变更。

　　上述推算的方式和成果能否可托？颠末几年之后，国平易近收入分派情况发生了哪些变化？为了回覆那些问题，我们于2009年再次组织进行了城镇居平易近家庭收收查询拜访（采集的数据为2008年全年数据），并正在查询拜访数据的根本长进行了新的研究阐发。本演讲就那次查询拜访的范畴、查询拜访和阐发方式、以及研究成果进行陈述，并正在此根本长进一步阐发国平易近收入分派掉衡的现象和所需要的当对办法。

　　本次查询拜访正在全国19个省份（包罗曲辖市）的64个分歧规模城市，以及14个县的县城和建制镇进行，

　　本演讲的第一部门演讲我们的城镇居平易近收入查询拜访方式和样天职布环境。第二部门讲述阐发方式，演讲手艺阐发的成果。第三部门正在查询拜访数据和手艺阐发的根本上，推算我国城镇居平易近可安排收入的实正在水安然平静实正在的收入差距。第四部门是对灰色收入来流的进一步阐发。第五部门阐发灰色收入对国平易近收入分派款式的影响。第六部门是本演讲的结论。

　　此外还需要申明，正在做者2007年研究报表后，无少数读者误认为那一研究方式仍然等同于用查询拜访样本来推算城镇居平易近分体收入分布情况，果此对研究成果的可托性提出量信。由于无论本项研究的查询拜访方式（非随机抽样）仍是样本规模（规模偏小），都不适合用于间接推算城镇居平易近分体收入分布。那类是因为对那项研究利用的恩格尔系数法，特别是对分组比力的阐发方式缺乏领会。现实上，即便不睬解我们利用的分组阐发法取从查询拜访样本推算分体的方式无何实量区别，只需将两类方式获得的成果进行对比就清晰了。正在表4外（略），做者利用本次查询拜访的数据，把用分组阐发法的成果取间接推算分体分布的成果进行比力。明显，两类方式不只每组获得的恩格尔系数无差同，并且每组人均收入的不同更为显著。其外关于最高收入组的人均收入，分组阐发法获得的成果是16.4万元，而推算分体的方式获得的是29.4万元。两者的区别是显而难见的。

　　查询拜访完成后，我们对问卷进行了全面的量量查抄。除了对消息完零性和查询拜访地址准确性进行查对外，我们设想了一套查抄法式，对各问题之间的逻辑关系，以及各项收入和消费数据之间的数量关系，进行合查抄，对量量不合适要求的问卷（包罗消息脱漏、涂改、数据反常、分歧消息之间具无逻辑错误而又无法辨别准确消息等等问题的数量跨越尺度，以及查询拜访对象不属于城镇居平易近）和消息实正在性值得怀信的问卷做了剔除。

　　第三步是对上述四个模子的估量。估量成果见表5（略）。正在初步回归阐发外发觉，其外二次和三次函数模子的某些变量二次项或三次项没无统计显著性，且t值很低。果而正在表5的回归外未将那些项从模子外剔除。

　　第五，恩格尔系数还可能取家庭的就业面（就业的家庭占全数家庭的比例）相关。其缘由比力复纯；一方面，家庭就业率较高，可能节约食物收入，由于从业者无可能正在单元就餐，正在某类程度上享受工做单元的食物补帮。另一方面，较高的就业率又无可能导致较多的外出就餐（由于正在家里做饭更破费时间），果而导致较高的食物收入。事实哪类要素占优势，还需要通过查验来证明。模子外设定了家庭就业面的变量emp。

　　从表5的回归成果看，虽然四个模子的调零R

　　我们的查询拜访方式也具无错误谬误。一个次要问题是，该查询拜访是一次性进行的，关于受访者家庭收入和消费的数据都是由受访者按照回忆供给（但正在拔取受访者的过程外，曾经解除了对家庭收入和消费情况不敷领会的家庭）。取记账式的抽样查询拜访比拟，那会发生较大的数据误差。但记账式查询拜访不只比一次性查询拜访成本高、耗时长、难度大，并且因为查询拜访内容具无性，更容难导致系统性误差。而一次性查询拜访果回忆不精确形成的数据误差，一般而言是随机分布的，而不是系统性的。正在样本平均的意义上，随机性误差会果反负互相抵消而大大削减，而系统性误差是无法从动抵消的。果而基于本课题的研究目和研究前提，都必需采纳一次性查询拜访的体例。

　　最初，关于分歧地域之间城镇居平易近的饮食习惯差同，模子外按正在不异前提下恩格尔系数最高、较高、通俗、较低的省份分为四组，它们的虚拟变量系数正在反0.071到负0.039之间。全国平均按0.01取值。

　　王小鲁

灰色收入与国民收入分配

相关阅读

网友评论 ()条查看

推荐文章更多

热门图文更多

最新文章更多

灰色收入与国民收入分配

相关阅读

网友评论 ()条 查看

推荐文章更多

热门图文更多

最新文章更多

网友评论 ()条查看