序曲
虞美人·赋虞美人草
【宋】辛弃疾
当年得意如芳草。日日春风好。拔山力尽忽悲歌。饮罢虞兮从此、奈君何。
人间不识精诚苦。贪看青青舞。蓦然敛袂却亭亭。怕是曲中犹带、楚歌声。
【译文】
当年春风得意,好像芳草天天得到春风吹拂。由胜转衰,四面楚歌,只得高声哀唱,和虞美人诀别。帐饮之后,彼此分离,而虞姬从此要何以对待项羽呢?
众人只知欣赏美妙舞姿,不解其内心悲楚。虞美人草静止不动就像那整整衣袖、亭亭玉立的美人,停止歌舞,怕是曲中犹带楚歌声引起了虞姬的怀旧情绪而不忍卒舞。
【赏析】
总观全词,作者对虞美人草的遭遇是惋惜的,对虞美人草的品格是赞赏的。联系作者身世和南宋情况来看,作者是想借此词来讽刺和规劝南宋君臣不要沉溺于歌舞生活,招致亡国杀身之祸,而应发奋图强,收复失地,重振国威。同时,作者也是借此词来抒发自己怀才不遇、壮志难酬的悲愤。因此,这首词写得既豪放又婉约,是咏物词中的妙品。
此词于庆元元年(1195)或二年辛弃疾被弹劾去职、闲居带湖时闲居带湖时所作。辛弃疾在带湖居住期间,常到博山游览,博山风景优美,他却无心赏玩。眼看国事日非,自己无能为力,一腔愁绪无法排遣,遂创作了此词。
注:以上诗词选自 古诗文网
无序多分类逻辑回归分析
在实际生活中,有时会遇到因变量是多变量(多元)变量的情况,多元变量又可分两种情况:
无序多元变量:如胃病可分为胃炎、不典型增生和胃癌;心理疾病(精神分裂症、抑郁症、神经官能症)等。这些多项无序分类变量统计上称为名义变量。有序多元变量:如疾病的治疗效果可能是治愈、好转、无效等。对于类似这种分类资料,不能直接使用二元逻辑回归分析来处理,则要使用多元逻辑回归分析。
多元逻辑回归分析实际上就是用多个二元逻辑回归分析模型来描述各个类别与参考类别相比价时的作用大小。如:对于一个三分类的因变量(治愈、好转、无效),可建立两个二元逻辑回归分析模型,分布描述好转与治愈相比时,无效与治愈相比时各种疗法的作用。但是在估计这些模型的参数时,所有对象都是一起估计的,一些参数的意义,模型的筛选过程等都和二元逻辑会分析相似。
假设因变量有n类,则除一个对照水平外,以每一分类与对照水平做比较,拟合n-1个广义Logit模型。若某个因变量有a、b、c三个水平,以c为参照水平,可以得到两个Logit函数,即一个是a与c相比,另一个为b与c相比。
从上述公式可看出,Y=c成为a和b的共同参照组,若要比较a与b,直接将LogitPa和LogitPb相减可得到相应的函数。
那相应的回归参数的意义是什么呢?
在无序多元逻辑回归模型中,参数bi的意义在于表示在其他自变量固定不变的情况下,某一自变量Xk的改变一个单位,因变量某一类别相对于参照类别的对数优势平均该变量。在实际工作中,可采用优势比(OR)进行解释,即Xk每增加一个单位,因变量某一类别(相对于参照类别)优势将改变exp(bi)。
模型检验:
1.拟合检验:SPPS采用
(1)Pearson卡方进行模型检验,检验观察频数A与 期望频数T间的差异程度。若卡方值越大,P值越小,说明模型对数据拟合越不好,反之,P值越大,说明模型对数据拟合越好。
(2)离差统计量表示,公式为D=2(lnL‘-lnL),式中L’为饱和模型(模型与实际观察数据完全吻合)的似然值,L是待检验模型的最大似然值。
2. 伪R2统计量:在线性回归模型中R2表示可由自变量解释的因变量的变异比例。在SPSS中逻辑回归模型使用Cox and Snell、Nagelkerke、McFadden R2统计量,结果解释与线性回归模型中R2类似,R2越大,模型拟合越好,但在逻辑回归中,R2意义较小,没有线性回归模型重要。
SPSS实现无序多元逻辑回归分析
示例:某医师研究不同细胞分化程度(X1)和细胞染色(X2)与巨蟹座组织类型(Y)的关系。数据如下:
1.数据描述
设置四个变量,分化程度—values:1=1级,2=2级,3=3级,数值型;细胞染色==values:1=阳性,2=阴性;频数—数值型;组织类型—values:1=鳞癌、2=腺癌、3=大细胞癌;2. 数据加权
打开 数据—个案加权,选择 频数 为权重
3. 打开 分析—回归—多元逻辑回归分析
4. 参数选择与说明
(1)主页面
因变量:选择分类变量作为因变量因子:因素,选择分类自变量作为影响因素,可选择多个协变量:自变量或协变量,需选择连续变量,1个或多个均可以
参考类别:第一个类别—第一类为参考类;最后一个类别—最后一类为参考类,系统默认;定制—自定义使用类别,需在 值 后输入它的取值;类别顺序:设置区分第一类和最后一类的顺序。升序—分类变量中取值最小的为第一类,取值最大的类为最后一类;降序则反之;
(2)模型
指定模型:指定回归模型的效应主效应:只包括协变量和因素变量的主效应,不包括交互效应全因子:表示模型中包含所有主效应以及他们之间所有可能的交互效应定制/步进:由用户自行选择使用哪些效应进行分析构建项:用来指定效应的种类主效应/交互效应/所有二/三/四/五阶交互效应强制进入项:选入此列表的效应将强制出现在模型中步进项:设置步进项列表里的变量逐步进入模型的方法向前进入法/向后消去法/向前逐步法/向后逐步法
(3)模型
a. 模型:用于选择关于统计模型的统计量
伪R2,:输出Cox&Snell R2、Nagelkerke R2和McFadden R2三个R方统计量步骤摘要:如果模型选择了逐步方法,此选项要求显示每一步的变量进入或剔除模型的效应表模型拟合信息:输出拟合模型信息以及只包含截距项的模型信息信息准则:逐步回归的判别准则单元格概率表:输出观测频数和期望频数表、协变量比率和响应分类表分类表:输出最终预测分类的统计信息报表拟合优度:输出皮尔逊卡方和似然比卡方统计量b. 参数:模型参数的输出统计量
估算值:输出模型参数的估计值,包括估计值的置信区间似然比检验:输出模型偏效应的似然比检验渐进相关性:输出参数估计值的相关系数矩阵渐进协方差:输出参数估计值的协方差矩阵c. 定义子群体
定义子群体由因子和协变量定义的协变量模型:对所有的因子变量和协变量计算单元概率,并进行拟合优度检验,默认选项由以下变量列表定义的协变量模式:指定要求输出单元概率和拟合优度检验的变量,可从类别中选择输出变量进入右侧的子群体列表框
(4)条件:指定相应的收敛标准
(5)选项:
a. 离散标度:用于校正参数协方差的估计值
标度:给出相应的尺度参数,无—不指定;用户定义;皮尔逊—皮尔逊卡方统计量;偏差—偏差函数统计量,即最大似然比卡方统计量b. 步进选项:设置逐步回归模型的有关判别准则
进入概率:指定将变量引入模型的检验统计量的概率临界值,此概率越大,越容易将变量引入模型,用于向前选择法、向前逐步法和向后逐步法进入检验:指定在逐步法中引入变量的检验方法,可选项有似然比检验和得分检验,用于向前选择法、向前逐步法和向后逐步法剔除概率:将变量从模型删除的检验统计量的概率临界值,此概率越大越容易将模型保留在模型中,用于向后消去法、向前逐步法和向后逐步法除去检验:指定在逐步法中剔除变量的检验方法,可选项有 似然比检验和Wald检验,用于向后消去法、向前逐步法和向后逐步法模型中最小分步效应:当使用向后消去法或向后逐步法时,在此指定模型所要包含的最小项目数(不包含截距)模型中最大分步效应:当使用向前选择法或向前逐步法时,在此指定模型所要包含的最小项目数(不包含截距)
(5)保存:指定相应的收敛标准
保存的变量:需要保存到数据集中的变量
估算响应概率:把观测记录按响应变量进行分类的估计概率预测类别:保存模型的预测响应分类预测类别概率:保存最大的估计响应概率实际类别概率:保存预测正确时的估计响应概率
5. 结果输出与解释
(1) 基本描述
显示 样本数、百分比、缺失样本等信息。
(2)模型拟合信息表
卡方值为25.768,其显著性p=0.000<0.05,所以模型具有统计学意义。
(3)拟合优度与伪R2
在拟合优度表中,p>=0.575,说明拟合优度较好伪R2统计量:其三个不同的R2值较小,R2<=0.075。
(4)似然比检验
从下表可看出,分化程度与细胞染色的显著性p<0.05,说明其回归系数均有统计学意义。
(5)参数估计值
从下表可得到,以大细胞癌(组织类型=3)为基准,分别用两个回归方程描述,则为
从回归方程可看出,细胞分化程度的系数均为正值,说明细胞分化程度高,鳞癌和腺癌的发生率大于大细胞癌;细胞染色为负值,说明细胞染色为阴性,鳞癌和腺癌的发生概率小于大细胞癌。
(6)分类
总的分类正确率为50.3%。
实测频率和预测频率
6.语法
******************** 加权 ******************.WEIGHT BY 频数.******************** 无序多元逻辑回归 ******************.NOMREG 组织类型 (BASE=LAST ORDER=ASCING) WITH 分化程度 细胞染色/CRITERIA CIN(95) DELTA(0) MXITER(100) MXSTEP(5) CHKSEP(20) LCONVERGE(0) PCONVERGE(0.000001)SINGULAR(0.00000001)/MODEL/STEPWISE=PIN(.05) POUT(0.1) MINEFFECT(0) RULE(SINGLE) ENTRYMETHOD(LR) REMOVALMETHOD(LR)/INTERCEPT=INCLUDE/PRINT=CELLPROB CLASSTABLE FIT PARAMETER SUMMARY LRT CPS STEP MFI IC/SAVE ESTPROB PREDCAT PCPROB ACPROB.