在实验室工作中,经常遇到比对试验,即按照预先规定的条件,由两个或多个实验室或实验室内部对相同或类似的被测物品进行检测的组织、实施和评价。实验室间的比对试验是确定实验室的检测能力,保证实验室数据准确,检测结果持续可靠而进行的一项重要的试验活动。
结合实验室A和B两个实验室进行的比对试验中的拉力试验数据范例,介绍比对试验数据处理的3种最基本的方法,即格鲁布斯(Grubbs)检验、F检验、t检验。
1 数据来源情况
1.1 试样
在实验室的半成品仓库采取正交方法取样,样品为01. 15 mm制绳用钢丝。在同一盘上截取20段长度为lm试样,按顺序编号,单号在实验室A测试,双号在实验室B测试。
1.2 试验方法及设备
试验方法见 GB/T 228-1987,实验室A : LJ-500(编号450);实验B: LJ-1 000(编号2)。
1.3 测试条件
两实验室选择有经验的试验员,严格按照标准方法进行测试,技术人员现场监督复核,确认无误后记录。对断钳口的试样进行重试。试验时两实验室环境温度、拉伸速度、钳口距离相同。
1.4 试验数据:测试得出的两组原始试验数据见表to
表1 实验室A,B试验数据
2 数据处理的方法步骤
2.1 基本统计处理
对两组原始试验数据进行基本的统计计算,求出最大值、最小值、平均值、极差、标准偏差等,结果
见表2。
表2 基本统计结果
2.2 格鲁布斯(Grubbs)检验
格鲁布斯检验是离散值检验的一种,主要目的是剔除异常数据,这种异常数据不是系统误差,也不是随机误差,而是由过失误差引起的,这种数据应一律舍去。对任何一组数据进行处理,首先要检验其是否存在有过失误差带来的异常数据,即进行离散值检验。格鲁布斯检验是离散值检验中最好的方法,其具体步骤是:将一组数据从小到大按顺序排列:x1、x2、x3、……xn,其中x1可能为离散值,先求出这组数据的平均值x及标准偏差S,然后求统计量T,若x1,为离散值,由T= (x-x1)/s;若xn为离散值,则T= (xn-x)/s;所得结果T与格鲁布斯检验值表所得临界值Ta, n值比较(注:a为显著性水平,即把正常值判为异常值之类错误的概率,n为样本量)。如果T≥Ta, n,说明是离散值,必须舍去;反之,予以保留。
结合A,B实验室数据,我们分别求出各自最大、最小值的 T值(共4个),TAmin=(2 227. 8-2195) /10.971=2.99;TAmax=(2 255一2 227. 8)/10.971=2.48;TBmin=(2220.85一2 190)/10.942=2. 82; TBmin=(2240一2 220. 85)/10. 942=1.75;查表(取σ= 0. 05 ) I T0. 05 ,100= 3. 21,比较可知,TAminITAmaxx TBmin x TBmax:均小于To. 05,100,不属于离散值,应予保留、
如果通过格鲁布斯检验出离散值,应剔除,然后重新进行统计算,以更进行下一步的统计分析。
2. 3 F检验
一组数据的标准偏差可以反映出该组数据的精密度,精密度决定于随机误差,不同组数据,有不同的精密度,两组数据的精密度之间有无显著性差异即两组数据的随机误差是否一致,这就需要进行F检验,F检验的目的在于比较两个样本的精密度有无显著性差异。F=S12 /S22(假设S12≥S22〕义),查F分布表Fα/2(n1-1,n2-I),若F≤ Fα/2(n1-1,n2-I),则说明二者的精密度之间不存在显著性差异,反之,则存在显著性差异。
结合本例,SA=10. 971,SB = 10. 942;F=SA2/SB2=1.01。仍然取α=0.05,则Fo.o5/2 (99.99)=1.76,F<F o.o5/2 (99.99),因此二者不存在显著性差异。
A实验室的标准偏差略大于B实验室的标准偏差,说明A实验室的测量精密度略低于B实验室。但经F检验,二者测量精密度无显著性差异,可以认为A,B两实验室拉力试验中随机误差相当。
2.4 t检验(平均值检验)
通过F检验,可以判定两组数据随机误差即精密度有无显著性差异,但两组数据的平均值之间是否存在显著性差异即是否有系统误差,这就必须进行平均值检验即t检验。t检验的目的就是比较两组数据的平均值之间是否存在显著性差异。
结合本例子,进行检验,经计算,t = 4. 49,仍然取a = 0. 05,查‘t值分布表,T0. 05,198 -' 1. 98 , t>To. 05.198,因此二者平均值之间存在显著性差异,双方测试系统之间存在系统误差。
本次比对试验,F检验已证明两组数据的精密度无显著性差异。虽然A,B实验室各自测量数据通过了F检验,说明两实验室测量数据的精密度无显著差异,随机误差相当,但A,B实验室测量数据的平均值没有通过t检验,说明两实验室测试数据的平均值存在显著性差异,二者之间存在系统误差。A实验室拉力数据平均值高于B实验室6. 95 N,应该从系统误差中分析原因,如:拉力机型号、检定误差、环境温度等,比较双方的试验条件发现,B实验室试验机检定误差略高于A实验室试验机。B实验室试验机型号为Ii一1000,A实验室试验机型号为LT一500,这可能是导致双方测试数据存在差异的原因。
3 三种方法的关系
格鲁布斯检验、F检验,t检验三者是比对试验数据处理中最基本的方法,三者缺一不可,顺序不能颠倒。格鲁布斯检验剔除离散值,保证了数据统计结果的有效、准确,是F检验、t检验的基础;;F检验的目的在于比较两组数据精密度也即随机误差是否存在显著性差异;t检验的目的在于说明两组数据平均值的准确度,是一切试验根本目的所在。而准确度取决于精密度和系统误差,只有在精密度一致的前提下,才能检验是否存在系统误差,因此,F检验是进行t检验必要条件,在t检验之前必须进行检验。