公卫人

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1165|回复: 2
打印 上一主题 下一主题

[经验] 丁小丁SPSS系列专讲19:t检验

[复制链接]
跳转到指定楼层
1#
小食指1991 发表于 2017-9-6 13:11:38 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

注册后推荐绑定QQ,之后方才可以使用下方的“用QQ帐号登录”。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
从这一讲开始,我们要进入统计推断的学习,最简单是莫过于t检验,但同时它也是后续诸多统计方法的基础,大家一定不要掉以轻心。t检验是英国统计学家William Sealy Gosset在健力士酿酒厂工作时,为了测定酿酒质量而提出的,由于酒厂老板说这是商业机密,不能随意泄露,因此Gosset就给自己换了个马甲,套话讲就是笔名,叫student,并于1908年在Biometrika上公布t检验,故而t 检验也叫Student's t test。有时候我们在中文文献里面也会看到这种写法,搞得很多人一阵蒙圈,还以为是啥高深的统计方法,何必呢,又不是写英文文章,踏踏实实写汉字就行了。我们的t检验包括三个大的方面:①单样本t检验;②两独立样本t检验;③配对t检验。这些方法的应用,各有前提条件,当不满足这些条件时,是不能随便强行使用的,下面,我们一个个详细讲述。" h3 c2 X" f5 ~) N0 a* [8 z
一、单样本t检验( B( F& P$ q  C( W! @
单样本,顾名思义,即只有一个样本。用这个样本去干啥呢?答曰:干统计推断,用样本和已知总体去比较,看此样本所反映的信息是否与总体有差异。t检验是一种参数检验,继续顾名思义,所谓参数检验,检验的自然就是参数,那什么又是参数呢?参数就是反映总体信息的指标,一般而言,当某个总体确定以后,它的参数是一个固定的常数(关于这一点,目前学术界尚有争论,我们暂且求同存异),但是由于总体往往是无限的,所以要得到它的参数,真是难于上青天。于是乎,我们就抽取了一些能够代表总体特征的样本去估计总体的概况,即用描述样本信息的统计量去代替描述总体信息的参数,比如,我们常用样本均值x代替总体均值,术语叫点估计法。" X$ H* U! ?8 q; G
接下来,我们说说单样本t检验的应用条件:样本必须来自于正态分布的总体,只有服从正态分布或近似正态分布的数据才能进行参数检验,否则需要将原始数据转换成近似正态分布,或者换用非参数方法处理。
4 Y" G, F" t/ I4 o7 G; @* f讲到这里,你就会明白,我前面为何要那么细致地讲解正态性检验,一切的准备都是为了迎接这一刻的到来。此处请大家注意,我们本质上所关心的是待检样本是否来自正态分布的总体,而不是简单地检测样本数据是否服从正态分布,这一点就需要比较扎实的专业知识,你得清楚,自己所研究的变量是怎样一种分布状态,只有在我们专业能力欠佳,不能断定样本所对应的总体是何分布时,才会借助软件,对样本数据进行正态性检验,看其是否服从,若服从,则利用样本分布去估计总体分布,我们不难发现,只要是估计,那肯定会有估计错误的可能。比如说,某个指标,比如说病程,它是一个偏态分布资料,但当我们用样本数据去做正态性检验时,也能得出服从正态分布的结果,因此,专业能力很重要。; g& V7 U  s9 F3 W
其次,在做单样本t检验时,我们得通过一些方法获得总体参数,用样本统计量和总体参数去比较,看两者是否有差别。前面说了,参数检验是检验参数的,而t检验所检验的具体参数就是均值。( Y" G! M3 ]3 a
下面让我们结合一个案列来详细讲解。比如我在咱们学校2015级研究生中抽取10具有代表性的同学,测量他们的身高,我的研究目的是想知道这10位同学的身高和整个2015级同学(有限总体)相比是否有所差别。  y6 X* g: h6 ?8 s6 m3 m" e

0 [6 j, V8 \+ N此时,有了这个研究目的以及知道身高是个计量资料之后,我们应该做得是单样本检验,至于到底是用参数检验里的单样本t检验,还是非参数秩和检验,我们事先得考察变量是否来自正态分布,如果服从,则用t检验,否则用非参数检验。由于我们知道,身高的分布是处于正常身高的人是最多的,而处于过低或过高的人只占少数,所以身高是一个呈现正态分布的资料,故而,在这里我其实可以不对样本做正态性检验,但为了让大家再复习一下正态性检验,我还是做了。
9 w0 R3 m) R+ }7 M4 B& V+ O# } + i9 Q) i% U" T1 x; S; g
由于样本量只有10,所以看S-W结果,很明显它是服从正态分布的。但我想说的是,假如由于数据原因,此处检测出来样本不服从正态分布,我依然可以做参数t检验,因为它的总体是正态分布。
2 e0 l, N% _2 u' L) o1 v3 O接下来进入数据处理部分,正如我前面所说,t检验最终比较的是均值,所以我在分析菜单之下找比较均值就会发现里面有所有的t检验类型,以及单因素方差分析,这是一个很好的信号,它从侧面告诉你,单因素方差分析也是一种参数检验,而且它检验的参数也是均值。  x$ L8 l$ q  ?& |) a
6 `* X% S7 }$ y3 t- u& L0 W
且看单样本t检验的界面,检验变量自必不说,将身高选入即可,但极其重要的是在检验值处一定要填入你所对比的总体均值,在此处,我们的总体是251名2015级研究生的身高,由于它是个有限总体,它的总体均值我们是可以得到的,比如170,此时,我就将170填入检验值即可。另外,在选项里,一个是可信区间,默认是95%,之前也讲过,还有缺失值的处理,默认即可。
) z8 i2 j8 q' I" X# o 7 i$ U/ T* X0 B% {" u
确定以后输出表单里有两张表,请看。第一张表很简单,我们学了统计描述,现在看这张表非常清楚,无非是均值,标准差之类,这些指标就是文章里经常看到的东西。
& v1 Q# {6 D% Z  \7 X
# O# p; B. Z  a# V重点在第二张表,主要看统计量和P值,我们再将统计推断的三步走复习一遍,逐条来说:一、建立检验假设,确定检验水准;二、计算统计量;三、确定P值,作出统计推断。9 b7 w4 l# x# }7 x3 |* L( v) R
一、建立检验假设,确定检验水准:凡有P值出现的地方,其背后必然隐藏着两个假设,零假设是无差别假设,所以在此处即为:样本均值与总体均值无差别;备择假设为有差别假设,即为样本均值与总体均值有差别。然后,我们习惯性地把小概率事件的发生概率5%(0.05)作为检验水准。8 t* c) k5 _' Q3 F& i
二、计算统计量:每一种统计方法之下都能计算出相应的统计量,比如t检验得出的统计量就是t值,方差分析得出的统计量是F,卡方检验得出的是2,我们在写论文时,切记把相应统计量表示出来,这样审稿的人一眼就能看出你用的是什么统计方法,而不是像现在绝大多数文章那样,仅仅标注个小于0.05或0.01,那是不对的。此处统计量t=2.324。
3 F" c9 y8 Q5 F5 v) R三、确定P值,作出统计推断。当统计量算出来以后,P值也就出来了,即sig,此处P=0.044,前面我们也讲过了,P值表示零假设成立的可能性大小,此处我们发现,零假设成立的概率只有4.4%,是个小概率事件。什么是小概率事件呢,就是说,在一次试验中基本不可能发生的事情,既然这样,我们的零假设就很难成立了,因此,我们转而接受备择假设,即样本均值与总体均值的差异是有统计学意义的。结束了吗?根本没有,这里只是告诉你有无统计学意义,如果有统计学意义,我们还得考察它具体有什么专业意义,乃至现实意义,怎么去考察呢,就是去比较均值,我们在第一张表里可以看到样本均值为176.90,而总体均值为170,这时我就可以说样本均值和总体均值差异很显著,而且样本均值高于总体均值。特别注意,我们在看文献时,经常会看到某个P值极小,就说是差异极其显著,其实P的大小和差异显著不显著没有半毛钱关系,只不过P值越小,我们越有理由拒绝零假设,接受备择假设,犯Ⅰ型错误越小,仅此而已。
  o% m( n& ~4 L) [1 l! l( K

评分

参与人数 1钢镚 +100 收起 理由
epiman + 100 积极发布原创帖子内容,再接再厉!

查看全部评分

本帖被以下淘专辑推荐:

2#
15637265282 发表于 2017-10-13 18:18:14 | 只看该作者
讲的很好了。
3#
yanche 发表于 2019-8-6 02:39:25 | 只看该作者
讲得真的好清楚
2 z8 D4 n* o; j2 G& z
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

充值|至尊会员||公卫人 ( )

GMT+8, 2020-1-20 13:55 , Processed in 1.130138 second(s), 35 queries , Gzip On.

Powered by X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表
澳博彩票计划群 彩票高賠率好平台 宏发彩票计划群 湖南快乐十分走势 v8彩票计划群 吉林快3 长江彩票计划群 众赢彩票计划群 k8彩票计划群 极速赛车怎么买比较稳