广义变系数模型的B样条估计R软件实现

点赞:4677 浏览:12800 近期更新时间:2024-03-18 作者:网友分享原创网站原创

摘 要:结合基函数逼近技术以及拟似然方法,对广义变系数模型,提出了一个B样条估计方法,并结合R统计软件,对所提出的估计方法给出了一个基于R软件的实现过程.数据模拟表明所提出的B样条估计方法以及R软件的实现过程均是可行的.

关 键 词:广义变系数模型;B样条;R软件

中图分类号:F22文献标志码:A文章编号:1673-291X(2013)01-0231-03

引言

基于广义线性模型的统计分析常常被用于生物、医学、金融工程等各个领域.该模型有两个基本的检测定:一是在给定协变量X的条件下,响应变量Y的条件分布属于某一指数分布族;二是通过某一变换,该模型可以转化为线性回归模型.但是,在实际问题分析中,检测定协变量X与响应变量Y满足某一线性结构的参数模型往往是不成立的.如下的广义变系数模型是经典广义线性模型的一个简单而有意义的推广.

广义变系数模型的B样条估计R软件实现参考属性评定
有关论文范文主题研究: 关于统计分析的论文范文素材 大学生适用: 学院论文、高校毕业论文
相关参考文献下载数量: 69 写作解决问题: 怎么撰写
毕业论文开题报告: 论文模板、论文设计 职称论文适用: 论文发表、职称评副高
所属大学生专业类别: 怎么撰写 论文题目推荐度: 最新题目

注意到在模型(1)中,回归系数可以随着协变量U的变化而变化,因此该模型在表达协变量与响应变量的关系上,具有更强的适应性和解释能力.另外,显然当为某一未知参数向量时,模型(1)就转化为经典的广义线性模型.因此,模型(1)可以看成经典广义线性模型的一个推广形式.

目前,模型在统计领域中的应用越来越受到人们的关注,并且关于模型(1)的研究也已有大量的文献.比如Cai等研究了模型(1)的有效估计以及拟合优度检验问题.Lian在高维数据下,考虑了模型(1)的变量选择问题.Kuruwita等则在联系函数未知的情况下,来研究模型(1)的估计问题.在本文中,我们主要考虑模型的B样条估计问题.结合基函数逼近技术以及拟似然方法,对模型(1)提出了一个B样条估计方法.并结合R统计软件,对所提出的估计方法给出了一个基于R软件的实现过程,数据模拟表明所提出的B样条估计方法以及R软件的实现过程均是可行的.

与核估计以及局部多项式估计等局部非参数估计方法相比,B样条估计有其独特的优势.比如,B样条估计属于整体非参数估计方法,在估计过程中可以充分利用样本的信息,因而具有相对较高的估计精度.关于B样条估计的更多性质,参见文献[6].

一、方法论和主要结果

(一)B样条估计过程

那么关于γ的拟似然函数可以定义为:

(二)R软件的实现过程

在统计分析领域,常用的统计软件有SAS、SPSS、S-Plus以及R等.其中R软件是一套完整的数据处理、计算和制图软件系统.其功能包括:数据存储和处理系统、数组运算工具、完整连贯的统计分析工具、优秀的统计制图功能、简单而强大的编程语言等功能.在Tiobe公布的2011年11月编程语言排行榜上,R语言位列第二十七位,市场占有率是0.5%,SAS是0.386%,排在第三十五位.可见R软件是目前用户增长最快,且已成为了统计学家和数据分析师所钟爱的统计软件之一.接下来,我们利用R软件,对上节所提出的估计方法给出一个具体的实现过程.

首先我们以3次B样条为例,给出B样条基函数的程序代码,其他阶数的B样条基函数程序可以类似地给出.程序中u为样条函数的自变量,m为样条函数的阶数,kk为内部节点个数,ul为自变量u的取值下限,uu为自变量u的取值上限.

接下来,我们给出函数系数β(u)估计的程序代码,其中x和u为协变量,y为响应变量,m为B样条的阶数,kk为内部节点个数.在该程序中,我们采用的是等间距节点.

二、模拟研究

接下来我们通过数字模拟实验来说明本文提出的估计方法以及算法的可行性.为实施模拟,我们检测定数据满足的广义变系数模型为变系数泊松回模型,即响应变量Y服从泊松分布,并且检测定其条件均值具有如下结构:

运行上述程序代码,则得出下页图1的模拟结果,其中实线代表真实的函数曲线,点虚线代表利用本文的方法给出的估计曲线.从图1可以看出,估计曲线可以很好地拟合真实曲线.这也表明本文提出的估计方法以及给出的R程序代码是行之有效的.