在统计学中,P值是非常重要的存在,对P值概念以及其背后所反映的统计学底层逻辑的理解对学习统计学至关重要。p值作为假设检验的核心工具,它经常决定着一个数据结果的价值。
在统计学教材中,大多数的p值的定义是这样的:p值是在假定原假设为真时,得到与样本相同或者更极端的结果的概率。该如何理解这个定义呢?
我们首先从逻辑学上的归谬法说起。归谬法和反证法的思路是一致的,只是反证法着眼于证实,而归谬法则立足于反驳。运用归谬法的目的是想要反驳原命题,如果直接论证原命题为假的难度较大,我们就可以使用归谬法,先假设原命题A为真,原命题A为真时可以天然地得出B也为真,最后通过否定B进而否定A。举例,A命题:有一个很大的总体均值为100,标准差为10。B命题:从该总体中抽出的样本的均值不太可能为90(统计学上发生概率小于5%或小于1%就可以认为是不太可能发生的小概率事件,很明显,从一个均值为100的总体中抽出一个均值为90的样本,概率显然会小于1%),即A⇒B。然而此时发现样本的均值确实为90,这对于从一个总体均值为100的总体中几乎不可能抽到,那么逆否可得,¬B⇒¬A,即A命题其实是假的。
在上述案列中,假如我们已知总体的均值是100,标准差为10。首先我们可以假设这个命题是真的,那么此时从这个总体中抽出一个样本容量为25的样本,该样本的均值为90的概率大家认为有多大?一定是很小的嘛,可以说几乎是不可能发生的。现在,有一个总体,我们对它的均值是否为100不敢确定,所以我们从该总体中抽出了一个样本进行假设检验,我们先假设该总体的均值就是100,即H0:μ=100,那么备择假设就是H1:μ≠100。这里要提醒的是,零假设和备择假设互为矛盾关系,只要我们否定了其中一个命题就可以推断另一个命题为真。此时我们从该总体中抽出一个样本,结果计算得出该样本的均值为90,那么,我们就有足够的信心认为,这个样本不可能是从均值为100的总体中抽出的,即我们拒绝了零假设,所以备择假设就是真的。
那么P值是干嘛用的?在上述案列中,到底从一个均值为100,标准差为10总体中抽出一个样本容量为25,均值为90的样本的可能性有多大?我们不能从主观上来判断可能性多大或者多小从而来验证零假设是否为真,应该给出一个清晰的数学范围来量化决策过程。P值的大小就是告诉我们假定总体均值真的是100的时候,抽出的样本的均值为90或者比90更极端的概率是多少。计算出的概率为0.000032。这么小的概率的事件发生了,我们不得不认定,我们假设零假设为真的前提是错误的。所以当我们得到这个样本结果时,我们就可以笃定得说:应该拒绝零假设,故备择假设:μ≠100成立。
假如我们又从该总体中抽取了一个样本,样本容量为25,样本均值为98,这个可能性相对就大很多了吧。计算出的概率为0.157。也就是说,假设总体均值就是100,标准差是10,那么从该总体中抽出均值为98的样本的概率是15.7%。这样我们就没有充足的理由拒绝零假设了,因为这不是一个小概率事件。
正确理解P值在统计学中统计推断的基本思维方法,这种思维方法几乎被运用在所有主流的统计学分析之中。对它的准确理解,不仅是通向掌握各种具体的统计学方法的大门,更影响着我们对统计分析结果的解读。
特别声明:文章来源用户上传并发布,本站只提供信息存储服务,不拥有所有权,内容仅供参考。