邪恶少女漫画强奸型:函数与线性回归分析
几个非线性关系的函数模型与回归分析的联系
梁山第一中学 谭倩 2010年7月21日 10:39
一、非线性函数形式的确定
在对实际的客观现象进行定量分析时,选择回归方程的具体形式应遵循以下原则:
首先,方程形式应与有关实质性科学的基本理论相一致。例如,采用幂函数的形式,能够较好地表现生产函数;采用多项式方程能够较好地反映总成本与总产量之间的关系等等。
其次,方程有较高的拟合程度。因为只有这样,才能说明回归方程可以较好地反映现实经济的运行情况。
最后,方程的数学形式要尽可能简单。如果几种形式都能基本符合上述两项要求,则应该选择其中数学形式较简单的一种。一般来说,数学形式越简单,其可操作性就越强。
为了帮助读者选择合适的函数形式,下面我们扼要介绍实际分析中较常用的几种非线性函数的特点。
(一)抛物线函数
抛物线方程的具体形式为:
Y=a+bX+cX2 (7.86)
式中a、b和c为待定参数。
判断某种现象是否适合应用抛物线,可以利用“差分法”。其步骤如下:
首先将样本观察值按X的大小顺序排列,然后按以下两式计算X和Y的一阶差分△Xt、△Yt以及Y的二阶差分△Y2t。
△Xt =Xt-Xt-1; △Yt =Yt-Yt-1 (7.87)
△Y2t =△Yt-△Yt-1 (7.88)
当△Xt接近于一常数,而△Y2t的绝对值接近于常数时,Y与X 之间的关系可以用抛物线方程近似反映。
(二)双曲线函数
假如Y随着X的增加而增加(或减少),最初增加(或减少)很快,以后逐渐放慢并趋于稳定,则可以选用双曲线来拟合。双曲线的方程式是:
Y=a+b(1/X) (7.89)
(三)幂函数
幂函数方程的一般形式是:
(7.90)
这类函数的优点在于:方程中的参数可以直接反映因变量Y 对于某一个自变量的弹性。所谓Y对于Xj的弹性,是指在其他情况不变的条件下,Xj变动1%时所引起Y变动的百分比。 弹性是一个无量纲的数值,它是定量分析中常用的一个尺度。其一般定义如下:
EY,Xj= = (7.91)
利用求偏导数的规则,容易证明:在幂函数中
EY,Xj= (7.92)
由于幂函数所具有的上述优点,它在生产函数分析和需求函数分析中,得到了广泛的应用。
(四)指数函数
指数曲线的函数为:
Y =abx (7.93)
式中有两个待定参数a和b。当a>0, b>1时,曲线随X 值的增加而弯曲上升,趋于+∞;当a>0, 0
这种曲线被广泛应用于描述客观现象的变动趋势。例如产值、产量按一定比率增长,就符合第一种形式的曲线;如成本、原材料消耗按一定比例降低,就符合第二种形式曲线。
(五)对数函数
对数函数的方程形式为:
Y =a +blnX (7.94)
式中,ln表示取自然对数。对数函数的特点是随着X的增大,X的单位变动对因变量Y的影响效果不断递减。
(六)S形曲线函数
最常用的S形曲线是逻辑曲线。逻辑曲线的方程式如下:
Y = (L,a,b>0) (7.95)
逻辑曲线具有以下性质。Y是X的非减函数,开始时随着X的增加,Y的增长速度也逐渐加快,但是Y达到一定水平之后, 其增长速度又逐渐放慢。最后无论X如何增加,Y只会趋近于L,而永远不会超过L。 由于逻辑曲线的这一特点,它常被用来表现耐用消费品普及率的变化。
(七)多项式方程
多项式方程在非线性回归分析中占有重要的地位。因为根据数学上级数展开的原理,任何曲线、曲面、超曲面的问题,在一定的范围内都能够用多项式任意逼近。所以,当因变量与自变量之间的确实关系未知时,可以用适当幂次的多项式来近似反映。
当所涉及的自变量只有一个时,所采用的多项式方程称为一元多项式,其一般形式如下:
(7.96)
前面介绍过的简单线性函数、抛物线函数和双曲线函数都是一元多项式的特例。
当所涉及的自变量在两个以上时,所采用的多项式称为多元多项式。例如,二元二次多项式的形式如下:
(7.97)
一般来说,涉及的变量越多,变量的幂次越高,计算量就越大。因此,在实际的定量分析中,一般尽量避免采用多元高次多项式。
三、非线性回归模型估计
不少具有实用价值的非线性函数,可以通过适当的变换,转化为线性函数,然后再利用线性回归分析的方法进行估计和检验。
常用的非线性函数的线性变换方法有以下几种:
(一)倒数变换
倒数变换是用新的变量来替换原模型中变量的倒数,从而使原模型变成线性模型的一种方法。例如,对于双曲线函数,令X*=1/X代入原方程式,可有:Y = a+bX *。
(二)半对数变换
这种方法主要应用于对数函数的线性变换。对于对数函数,令X*=lnX,代入原方程,同样可得:Y=a+b X*。
(三)双对数变换
这种方法通过用新变量替换原模型中变量的对数,从而使原模型变换为线性模型。例如,对幂函数的两边求对数,可得:
lnY=lna+b1lnX1+b2lnX2+…+bklnXk
令Y*=lnY;b0=lna;X =lnX1,…, X =lnXk,代入上式可得:
Y*=b0+b1X +b2X +…+bkX
(四)多项式变换
这种方法适用于多项式方程的变换。例如,对于二元二次多项式,可令X =X1,X =X2,X =X1X2,X =X ,X =X ,代入原方程,可得:
Y=b1+b2X +b3X +b4X +b5X +b6X
以上所述的线性变换的方法具有简便易行的优点。但是,在实际应用时要注意以下几个问题:
第一、对于一些比较复杂的非线性函数,常常需要综合利用上述的几种方法。例如,对于逻辑曲线函数,若假定L=100,则可以采用以下方式进行线性变换。首先,(7.95)式两边同时取倒数,可得:
=
进而又有: 100/Y - 1 = ae-bX
上式两边取对数,可得:ln(100/Y-1) = lna-bX
令Y*=ln(100/Y-1);b1=lna;b2=-b,代入上式,可得:Y*=b1+b2X
在以上变换过程中,就综合利用了倒数变换和对数变换。
第二、为了能够根据样本观测值,对通过变换得到的线性回归方程式进行估计,该方程中的所有变量都不允许包含未知的参数。例如,如果L未知,上面所述的逻辑曲线方程的线性变换就是不正确的。这是因为这种情况下Y*包含了未知的L,因而是不可观测的。
第三、在以上的讨论中,为了叙述方便,我们省略了非线性回归函数中包含的随机误差项。但事实上与线性回归分析的场合一样,非线性回归分析也要考虑随机误差项的问题。只有当变换后的新模型中包含的误差项能够满足各种标准假定时,新模型中回归系数最小二乘估计量的各种理想性质才能成立。
第四、严格地说,上述的各种线性变换方法只是适用于变量为非线性的函数。对于参数为非线性或参数与变量均为非线性的函数来说,即使有可能进行线性变换和回归估计,也无法得到原方程中非线性参数的无偏估计量。
最后,并不是所有的非线性函数都可以通过变换得到与原方程完全等价的线性方程。在遇到这种情况时,还需要利用其他一些方法如泰勒级数展开法等去进行估计。这些方法比较复杂,超出了本书的程度,这里不作进一步的介绍。
【例7-11】利用例7-10中给出的资料
(1)拟合幂函数形式的我国城镇居民鲜蛋的需求函数。
(2)利用以上建立的样本回归方程,试预测人均实际收入为2200元,肉禽蛋相对价格指数为102%时的人均鲜蛋需求量。
解:(1)幂函数形式的需求函数如下:
利用双对数变换法,同时加入随机误差项,可得以下线性回归函数:
式中,Y*=lnY;β1=lna;β2=b2;β3=b3; =lnX2; =lnX3。
利用Excel中的自然对数函数,对例7-10中给出的人均鲜蛋购买量Y、 城镇居民人均实际收入X1和肉禽蛋价格指数X2求自然对数。例如,人均鲜蛋购买量放在B列,所要求解的相应自然对数放在E列 ,则先令E2=ln(B2),然后,复制其他单元格,便可得到lnY。
然后,利用上一节中介绍的求解一般线性回归模型的方法,对变换后的模型求解,可以得到以下结果:(具体运算过程省略)
=-1.6020+0.7993 -0.3901 (7.98)
t = (-1.45) ,(10.53),(-1.55) ;
F=33.60; =0.9060
因为, = =e-1.6020=0.201493,所以与上式相对应的幂函数形式的样本回归方程为:
(7.99)
由上式可知:居民人均实际收入的需求弹性约为0.8,而相对价格的需求弹性约为-0.4。也就是说,在其他情况不变的条件下,居民人均实际收入每增加1%会使人均鲜蛋的需求增加0.8%,相对价格每提高1%会使人均鲜蛋需求减少0.4%。
(2)将以上给出的居民人均实际收入和相对价格指数代入(7.99)式,可得:
= 14.81公斤/人
四、相关指数
变量之间存在的非线性相关的强弱,难以用单相关系数去判断。在这种场合,可以利用相关指数作为判断变量之间是否显著存在某种类型的非线性相关关系的尺度。所谓相关指数,也就是对非线性回归模型进行拟合时所得到的决定系数。
【例7-12】假设变量Y与变量X的样本观测值如下:
X
0
1
2
3
4
5
6
Y
9
5
2
1
2
5
9.2
试计算Y与X的单相关系数和以Y为因变量、X为自变量的抛物线方程的相关指数,判断Y与X之间是否存在某种相关关系?
解:利用求单相关系数的公式可得:Y与X的单相关系数rxy=0.0138,可以认为两者之间线性关系很不密切。但是,拟合抛物线方程可得:
Y=15.3714-7.1214X+0.8928X2 R2=0.99702 F=669.77
因此,可以认为Y与X之间存在非常显著的抛物线形式的相关关系。