("拟合优度检验主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。当解释变量为多元时,要使用调整的拟合优度,以解决变量元素增加对拟合优度的影响。拟合优度检验是检验来自总体中的一类数据其分布是否与某种理论分布相一致的统计方法。eg.一个总体可分为r类,现从该总体获得了一批分类数据,现在需要我们从这些分类数据中出发,去判断总体各类出现的概率是否与已知的概率相符。譬如要检验一颗骰子是否是均匀的,那么可以将该骰子抛掷若干次,记录每一面出现的次数,从这些数据出发去检验各面出现的概率是否都是1/6.t检验科技名词定义中文名称:t检验英文名称:t-test定义:两总体方差未知但相同,用以两平均数之间差异显著性的检验。应用学科:生态学(一级学科);数学生态学(二级学科)以上内容由全国科学技术名词审定委员会审定公布求助编辑百科名片T检验,亦称studentt检验(Student'sttest),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。目录简介t检验的分类及原理1.t检验2.t检验的适用条件3.t检验步骤t检验注意事项t检验的实际应用展开简介t检验的分类及原理1.t检验2.t检验的适用条件3.t检验步骤t检验注意事项t检验的实际应用展开编辑本段简介t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与Z检验、卡方检验并列。t检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于ClaudeGuinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于1908年在Biometrika上公布t检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。实际上,戈斯特的真实身份不只是其它统计学家不知道,连其老板也不知道。编辑本段t检验的分类及原理t检验t检验分为单总体检验和双总体检验。单总体t检验时检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。单总体t检验统计量为:双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况,一是独立样本t检验,一是配对样本t检验。独立样本t检验统计量为:S1和S2为两样本方差;n1和n2为两样本容量。(上面的公式是1/n1+1/n2不是减!)配对样本t检验统计量为:t检验的适用条件(1)已知一个总体均数;(2)可得到一个样本均数及该样本标准差;(3)样本来自正态或近似正态总体。t检验步骤以单总体t检验为例说明:问题:难产儿出生体重n=35,u0=3.42,S=0.40,一般婴儿出生体重μ0=3.30(大规模调查获得),问相同否?解:1.建立假设、确定检验水准αH0:μ=μ0(无效假设,nullhypothesis)H1:(备择假设,alternativehypothesis,)双侧检验,检验水准:α=0.052.计算检验统计量,v=n-1=35-1=343.查相应界值表,确定P值,下结论查附表1,t0.05/2.34=2.032,t0.05,按α=0.05水准,不拒绝H0,两者的差别无统计学意义t检验的来历当总体呈正态分布,如果总体标准差未知,而且样本容量<30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈分布。检验是用分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。检验分为单总体检验和双总体检验。1.单总体检验单总体检验是检验一个样本平均数与一已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量<30,那么样本平均数与总体平均数的离差统计量呈分布。检验统计量为:。如果样本是属于大样本(>30)也可写成:。在这里,为样本平均数与总体平均数的离差统计量;为样本平均数;为总体平均数;为样本标准差;为样本容量。例:某校二年级学生期中英语考试成绩,其平均分数为73分,标准差为17分,期末考试后,随机抽取20人的英语成绩,其平均分数为79.2分。问二年级学生的英语成绩是否有显著性进步?检验步骤如下:第一步建立原假设=73第二步计算值第三步判断因为,以0.05为显著性水平,,查值表,临界值,而样本离差的1.63小与临界值2.093。所以,接受原假设,即进步不显著。2.双总体检验双总体检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体检验又分为两种情况,一是相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。二是独立样本平均数的显著性检验。各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差异性。现以相关检验为例,说明检验方法。因为独立样本平均数差异的显著性检验完全类似,只不过。相关样本的检验公式为:。在这里,,分别为两样本平均数;,分别为两样本方差;为相关样本的相关系数。例:在小学三年级学生中随机抽取10名学生,在学期初和学期末分别进行了两次推理能力测验,成绩分别为79.5和72分,标准差分别为9.124,9.940。问两次测验成绩是否有显著地差异?检验步骤为:第一步建立原假设=第二步计算值==3.459。第三步判断根据自由度,查值表,。由于实际计算出来的=3.495>3.250=,则,故拒绝原假设。结论为:两次测验成绩有及其显著地差异。由以上可以看出,对平均数差异显著性检验比较复杂,究竟使用检验还是使用检验必须根据具体情况而定,为了便于掌握各种情况下的检验或检验,我们用以下一览表图示加以说明。已知时,用单总体未知时,用在这里,表示总体标准差的估计量,它与样本标准差的关系是:,已知且是独立样本时,用是独立大样本时,用双总体,未知是独立小样本时,用是相关样本时,用以上对平均数差异的显著性检验的理论前提是假设两个总体的方差是相同的,至少没有显著性差异。对两个总体的方差是否有显著性差异所进行的检验称为方差齐性检验,即必须进行检验。编辑本段t检验注意事项1、选用的检验方法必须符合其适用条件(注意:t检验的前提是资料服从正态分布)。理论上,即使样本量很小时,也可以进行t检验。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验,或进行更有效的Levene's检验。如果不满足这些条件,只好使用非参数检验代替t检验进行两组间均值的比较。2、区分单侧检验和双侧检验。单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。t检验中的p值是接受两均值存在差异这个假设可能犯错的概率。在统计学上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性,我们只要考虑单侧概率分布,将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧t检验概率。3、假设检验的结论不能绝对化。当一个统计量的值落在临界域内,这个统计量是统计上显著的,这时拒绝虚拟假设。当一个统计量的值落在接受域中,这个检验是统计上不显著的,这是不拒绝虚拟假设H0。因为,其不显著结果的原因有可能是样本数量不够拒绝H0,有可能犯第Ⅰ类错误。4、正确理解P值与差别有无统计学意义。P越小,不是说明实际差别越大,而是说越有理由拒绝H0,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同。5、假设检验和可信区间的关系结论具有一致性差异:提供的信息不同区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率。6、涉及多组间比较时,慎用t检验。科研实践中,经常需要进行两组以上比较,或含有多个自变量并控制各个自变量单独效应后的各组间的比较,(如性别、药物类型与剂量),此时,需要用方差分析进行数据分析,方差分析被认为是T检验的推广。在较为复杂的设计时,方差分析具有许多t-检验所不具备的优点。(进行多次的T检验进行比较设计中不同格子均值时)。编辑本段t检验的实际应用例如,t检验可用于比较男女身高是否存在差别。为了进行独立样本t检验,需要一个自(分组)变量(如性别:男女)与一个因变量(如测量值)。根据自变量的特定值,比较各组中因变量的均值。用t检验比较下列男、女儿童身高的均值。1、假设H0:男平均身高=女平均身高H1:男身高不等于女平均身高选用双侧检验选用alpha=0.05的统计显著水平。2、SPSS中的数据的排列被试性别身高对象1对象2对象3对象4对象5男性男性男性女性女性111110109102104男性身高均数=110女性身高均数=1033、选择SPSS中comparemeans菜单,独立样本,t-test。选择双侧检验,以及统计显著性水平alpha0.05。运行。4、从输出结果查看t检验的p值,是否达到显著水平。是,接受H1。男平均身高与女平均身高不同。否,接受H0,尚无证据支持男女身高差异。异常值目录定义准确性判断处理编辑本段定义异常值outlier:一组测定值中与平均值的偏差超过两倍标准差的测定值。与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。在处理数据时,应剔除高度异常的异常值。异常值是否剔除,视具体情况而定。在统计检验时,指定为检出异常值的显著性水平α=0.05,称为检出水平;指定为检出高度异常的异常值的显著性水平α=0.01,称为舍弃水平,又称剔除水平(rejectlevel)。编辑本段准确性在回弹法检测砼强度中,按批抽样检测的测区数量往往很多,这就不可避免出现较多的检测异常值,怎样判断和处理这些异常值,对于提高检测结果的准确性意义重大。格拉布斯检验法是土木工程中常用的一种检验异常值的方法,其应用于回弹法检测砼强度,能有效提高按批抽样检测结果的准确性。编辑本段判断处理检验批中异常数据的判断处理1、依据标准《计数抽样检验程序》(GB2828)、《正态样本异常值的判断和处理》(GB4883)。2、异常值定义异常值是指样本中的个别值,其数值明显偏离它(或他们)所属样本的其余观测值。3、异常值的种类(1)可能是总体固有的随机变异性的极端现,属同一总体;(2)可能是试验条件和方法的偶然偏离,不属同一总体。4、判断异常值的统计学原则(1)上侧情形:异常值为高端值;(2)下侧情形:异常值为低端值;(3)双侧情形:异常值在两端可能出现极端值。5、判断异常值的规则:(1)标准差已知——奈尔(Nair)检验法;(2)标准差未知——格拉布斯(Grubbs)检验法和狄克逊(Dixon)检验法。6、格拉布斯(Grubbs)检验法(1)计算统计量μ=(X1+X2+…+Xn)/ns=(∑(Xi-μ)/(n-1))½(i=1,2…n)Gn=(X(n)-μ)/s式中μ——样本平均值;s——样本标准差;Gn——格拉布斯检验统计量。(2)确定检出水平α,查表(见GB4883)得出对应n,α的格拉布斯检验临界值G1-α(n)。(3)当Gn>G1-α(n),则判断Xn为异常值,否则无异常值。(4)给出剔除水平α’的G1-α’(n),当当Gn>G1-α’(n)时,Xn为高度异常值,应剔除。三、格拉布斯检验法在回弹法检测砼强度中的应用将测区混凝土强度换算值按从小到大的顺序排列f1、f2、…fn,计算格拉布斯检验统计量:Gn=(fn-m)/sGn’=(m-f1)/s式中m——测区混凝土强度换算值的平均值;s——测区混凝土强度标准差。取检出水平α为5%,剔除水平α’为1%,按双侧情形检验,从附表中查得检出水平α对应格拉布斯检验临界值G0.975,剔除水平α’对应格拉布斯检验临界值G0.995。若Gn>Gn’,且Gn>G0.975,则判断fn为异常值,否则,判断无异常值;若Gn>Gn’,且Gn>G0.995,则判断fn为高度异常值,可考虑剔除;若Gn’>Gn,且Gn’>G0.975,则判断f1为异常值,否则,判断无异常值;若Gn’>Gn,且Gn’>G0.995,则判断f1为高度异常值,可考虑剔除;分析异常值出现原因,判断异常值是否舍弃。不得随意舍去异常值,应检查异常值出现是否系材料或施工质量变化等原因所致。若检出了一个异常值,对除去已检出异常值后余下得数值继续用格拉布斯检验法检验,直到不能检出异常值为止。",)