长安逸动起步有异响:统计学中的P值

来源:百度文库 编辑:九乡新闻网 时间:2024/04/27 19:46:38
查看文章
统计学中的P值,“差异具有显著性”和“具有显著差异”
2009年09月18日 星期五 14:39
P值是论文中最常用的一个统计学指标,可是其误用、解释错误的现象却很常见。因此,很有必要说明p值的意义、用法及常见错误。
P值指的是比较的两者的差别是由机遇所致的可能性大小。P值越小,越有理由认为对比事物间存在差异。例如,P<0.05,就是说结果显示的差别是由机遇所致的可能性不足5%,或者说,别人在同样的条件下重复同样的研究,得出相反结论的可能性不足5%。P>0.05称“不显著”;P<=0.05称“显著”,P<=0.01称“非常显著”。
由于常用“显著”来表示P值大小,所以P值最常见的误用是把统计学上的显著与临床或实际中的显著差异相混淆,即混淆“差异具有显著性”和“具有显著差异”二者的意思。其实,前者指的是p<=0.05,即说明有充分的理由认为比较的二者来自同一总体的可能性不足5%,因而认为二者确实有差异,下这个结论出错的可能性<=5%。而后者的意思是二者的差别确实很大。举例来说,4和40的差别很大,因而可以说是“有显著差异”,而4和4.2差别不大,但如果计算得到的P值<=0.05,则认为二者“差别有显著性”,但是不能说“有显著差异”。
由于“有显著差异”和“差异具有显著性”容易混淆,因而现在有些期刊提倡用“差异有统计意义”来代替“差异有显著性”,用“差异无统计意义”、“差异有高度统计意义”来代替“差异不显著”和“差异有高度显著性”。例如《中华胃肠外科学》即是如此。
如果P>5%,是否我们就可以下结论说比较的二者没有差别呢?不能。P>5%只能说明没有充分的证据说明二者确有差别,但是也不能说二者没有差别或差别很小。在这两个极端之间还有一个过渡区间,即无论下有差别还是没有差别或差别很小的证据都不足。要推断二者没有差别或差别很小,需要采用等效检验的统计推断方法。
统计缩略词的含义:
ND not determined; NS not significant
.
统计学中的P值与显著性的意义
转载自SPSS中文社区,作者:xiaowenzi2
 
统计学意义(p值)
 
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。
如何判定结果具有真实的显著性
在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生p值的结果≤0.05被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果0.05≥p>0.01被认为是具有统计学意义,而0.01≥p≥0.001被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。
 
所有的检验统计都是正态分布的吗
并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。
========================显著性差异              维基百科,自由的百科全书============
显著性差异(significance level),是一个统计学名词。它是统计学(Statistics)上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的,如比-西一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异,这一差异很可能来自于学××记忆法对被试记忆能力的改变。
显著性差异是一种有量度的或然性评价。比如,我们说A、B两数据在.05水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为95%。两个数据所代表的样本还有5%的可能性是没有差异的。这5%的差异是由于随机误差造成的。
通常情况下,实验结果达到.05水平或.01水平,才可以说数据之间具备了显著性差异。在作结论时,应确实描述方向性(例如显著大于或显著小于)。
如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设(Alternative Hypothesis)得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。
假设检定