摘要:非参数方法是概率统计学的一个分支。核密度估计在估计边界区域的时候会出现边界效应。我们证明了所给出的非参数条件核密度估计h■■(m,n)的一致强相合性。
Abstract: The non-parametric methodis a branch of probability statistics. Kernel density estimation will appear the boundary effect when estimating border region. This article proved the strong consistency of the given non-parametric condition kernel density estimation h■■(m,n).
关键词:非参数估计;Copula函数密度;条件核密度估计
Key words: non-parametric estimation;Copula function density;conditions kernel density estimation
中***分类号:F830 文献标识码:A 文章编号:1006-4311(2015)25-0214-02
0 引言
本文根据核密度估计方法不利于和有关数据分布的先验知识,因此将一些数据分布不增设其他的假设,那就是一些从基本数据样本本身出面来研究数据分布估算特征的办法,经过对核密度估计变化系数进行加权处理,就应该建立不同的风险投资价值的假设模型。参数估计一般应该分成参数回归分析法和参数判别分析法。为了解释此个问题的现有的方法含有参数估计法和非参数估计法,对参数回归一系列的分析中。
1 首先来了解非参数估计
非参数方法是概率统计学的一个分支,通常在一个统计课题中,如果确定或者假定了全体分布的清晰形式,并且其中含有一系列参数,要从来自全体的样本对这些参数做出的一系列估算或进行某种形式的假定检测,这种推理的方法称为非参数方法。
连续型随机变量的概率密度函数有如下性质:如果概率密度函数h(x)在一点x上连续,那么累积分布函数可导,并且它的导数,由于随机变量x的取值,只取决于概率密度函数的积分,所以概率密度函数在个别点上的取值并不会影响随机变量的表现。更准确来说,如果一个函数和x的概率密度函数取值不同的点只有有限个、可数无限个或者相对于整个实数轴来说测度为0,那么这个函数也可以是概率密度函数。函数型数据统计分析方式是近几年才开始发展起来的,它涉及到很多学科,比如分类学、医学、生物力学等,是在这些学科的基础上结合非参数统计推断理论、方法与应用研究形成的。并且因为这些学科中常常会用到大量的函数型数据,所以函数型数据统计分析方法也得到了广泛关注和应用。(应用了连续型随机变量的概率密度函数定义)
连续型的随机变量取值在任意一点的概率都是0。作为推论,连续型随机变量在区间上取值的概率与这个区间是开区间还是闭区间无关。要注意的是,概率L{x=a}=0,但{x=a}并不是不可能事件。非参数估计的目的就是在一定条件下,估计未知密度函数h(x)。对于一维实随机变量x,设它的累积分布函数是h(x)。如果存在可测函数h(x),满足:①f(x)?叟0;②■f(x)dx=1;③P(a
2 再来了解Copula密度函数
Copula函数解释的是变量空间的一般相关性问题,现实上是一种将联合分布函数与本身的各自边缘分布函数相连在一起的密度函数,所以我们还将它称为连接函数。上个世纪九十年代中后期的相关理论和解决方法已经在其他国家开始得到快速发展并且还应用到金融、医药等领域的相关分析、投资组合分析和风险投资管理等方方面面。在某些参数判别分析里面,一般需要假定认为辨别依据的、随机取样的数据样本在很多机会的类别中都配成特定的分布。实践表明,参数模型的这种基本设定和真实的物理空间模型之间存在的差别并不大,但是由此方法得到的结论却与现实相距甚远,这是因为密度估计方法不利于有关数据分布的先验知识,所以一些数据分布不增设其他的假设时,其结果很难令人满意。
通过了解知道Copula函数是两个边缘分布的连接函数,因此得出Copula函数的条件密度就是联合密度函数,在这种情况下需创新传统的估计方法,选用条件密度来估计随机变量间的相辅结构,在非参数核密度估计方法里面,条件概率密度核估计才是一整套相对比较完善的理论,因此将条件核密度估计理论在Copula函数的估计中进行应用,就可以得出在预定值超出所有知道的Copula类时刻对这种相依结构的非参数估计。
3 最后来了解条件核密度估计法
核密度估计方法在估计边界区域的时候会出现一般的边界效应。经过对核密度估计变化系数进行加权处理,就应该建立不同的风险投资价值的假设模型。参数估计一般应该分成参数回归分析法和参数判别分析法。
通过给定的集合样本点来分析随机变量的分布密度问题的函数是概率统计学的一个基础课题之一。解释此问题的现有方法包括参数估计法和非参数估计法。对参数回归一系列的分析中,通常来设定数据分布符合某些给定的特定的形态,比如可化线性分析、线性分析等,再次在目标函数中追寻一固定的解,那就是确定回归模型中的未知参数值。
假定联合随机变量(X,Y),其中(Xi,Yi),i=1,2,3…,备有一定的联合密度f(x,y)的Kp×Kq上各自单独分布的样本点,g(φ)是X的密度边缘,h(y│x)=■为给定X=x时Y的条件密度。令R1,R2分别是Kp及Kq上的核函数,{an},{bn}为可以设计的一个序列。h(y│x)的双重核估计定义为:hn(y│x)=■。
设(X,Y)的布局为δ,δ的着力点为D。X,Y的边缘分布分别为δ1,δ2,对应的着力点为D1,D2。对于任意的x=(x1,…,xp)∈Kp,y=(y1,…,yp)∈Kq,a>0,b>0,假定R1,R2,
an(x),bn(y)符合下面条件:R1,R2分别是Kp及Kq上的有边界概率密度边缘函数;R1,R2可积;Kp及Kq着力点有界;对与任何一个Kp中紧集H1和Kq中紧集H2,有■a■(x)0,a.s当n∞,■b■(y)0,a.s当n∞,对任意Kp中紧集H1和Kq中紧集H2,■a■(x)0,a.s当n∞,■b■(y)0,a.s当n∞,inf■∞,a.s当n∞,对于所有一切正整数n,x1,x2∈Kp,y1,y2∈Kq及所有的样本点(X1,Y1),…(Xn,Yn)皆成立。
从实际应用情况可以了解,按照给予的估计数量的不益的地方在于,窗宽{an},{bn}的给定应该重新再估算过。从历史上来看,这种理论已经得到了实践,且得到了广泛应用,查阅很多相关的已发表的论文或者著作,发现在大多数情况下窗宽都是常数的形式,因此在实际的应用过程中,若对窗宽进行限制,会存在很多不便的地方,那些窗宽不为常数的情况,最突出的情况就是1965年提出的“最近邻估计”,形同的估计在案例里也有很多的出现。
另知DEVROYE曾经出现过“自动选择窗宽”的核估计一般概念,那就是说窗宽基本由样本来给定,不过其研讨那窗宽与基于异议的(x,y)的位置相异,这些在实际运用上基本不能适应,按照(x,y)的地理位置不定相同,窗宽适宜区别很大。因此我在此文章中采用随机窗宽an(x)=an(x,X1,…,Xn),bn(y)=bn(y,Y1,…,Yn),把其中an,bn的区别代替以an(x),bn(y)作为h(y│x)的新估计,但是还是记为hn(y│x)。
这个时候所以就要重点看待的是,当M,N是[0,1]×[0,1]上的随机变量h■■(m,n)应该在此区域内的不定积分不一定等于1,为什么这样说,这是因为在选取不同的核函数是有一定的关系,所以这样了就与分布函数的概念自相产生了矛盾,因此为了解决这个疑问,所以就这个估算值必须重新来个标准,所以就标为h■■(m,n),假定
h■■(m,n)= 0,m?埸[0,1],n?埸[0,1]■,m∈[0,1],n∈[0,1]
所以h■■(m,n)为[0,1]×[0,1]上的密度函数,通过以下来假定一下h■■(m,n)与h■■(m,n)以及h(m,n)三者之间的函数关系。令m,n为[0,1]上的随机变量,其条件分布函数记为h(m│n),其联合密度为f(m,n),边缘密度为g(m),其中f(m,n),g(m)一致连续,inf g(m)>0,h■■(m,n)为h(n│m)的近邻估计,h■■(m,n),那么当n∞时,
■h■■(m,n)-h■■(m,n)0,a.s。因为联合密度函Copula函数等于其条件密度函数,因此就有■h■■(m│n)-h■■(m│n)0,a.s。
通过已知条件可以知道f(m,n)是一致连续,故f(m,n)有界,即?埚U′>0使得f(m,n)0,g(m)是一致的连续性,故?埚U>0,可以让■0,使得h(m│n)
?埚N1,当n>N1时有以下式子成立:f■■(v│u)N2时可以有如下不等式成立:
H(1,1)-?谆-F(0,0)-?谆
所以当n∞时,就有Hn(1,1)-Hn(0,0)1,a.s。因此suph■■(n│m)-h■■(n│m)=■■-h■■(n│m)=■(■-1)h■■(n│m)?燮(■-1)(U-?谆),a.s。
通过上式可以知道,当n∞时,即■h■■(n│m)-h■■(n│m)0,a.s。
所以■h■■(m,n)-h■■(m,n)0,a.s。
从上面可以看出来,已经证明了一切的非参数条件核密度估计h■■(m,n)的一致强相合性与关联。
4 结论
对参数回归一系列的分析中,一般先来设定数据分布符合某些给定的特定的性态,再次在目标函数中追寻一固定的解,那就是确定回归模型中的未知参数值。在选取不同的核函数是有一定的关系,所以这样了就与分布函数的概念自相产生了矛盾,因此为了解决这个疑问,所以就这个估算值必须重新来个标准,证明了一切的非参数条件核密度估计h■■(m,n)的一致强相合性与关联。
参考文献:
[1]赵凯鸽,袁永生,吴清娇.基于Copula理论和非参数极值估计在上下游水位的相关性分析应用[J].江南大学学报(自然科学版),2015-04-28.
[2]孔繁利.金融市场风险的度量――基于极值理论和Copula的应用研究[D].吉林大学博士论文,2006-04-01.
[3]陈江平,黄炳坚.数据空间自相关性对关联规则的挖掘与实验分析[J].地球信息科学学报,2011(1).
[4]胡铮洋.证券市场风险度量―时变Copula和极值Copula的应用研究[D].吉林大学博士论文,2009-04-01.
[5]苏静.基于Copula模型的商业银行组合信用风险度量研究[D].天津科技大学硕士论文,2008-03-01.
转载请注明出处学文网 » Copula函数的非参数估计方法