IVD性能评估的统计学基础-ppt课件.pptx

上传人(卖家):三亚风情 文档编号:2731926 上传时间:2022-05-22 格式:PPTX 页数:219 大小:4.64MB
下载 相关 举报
IVD性能评估的统计学基础-ppt课件.pptx_第1页
第1页 / 共219页
IVD性能评估的统计学基础-ppt课件.pptx_第2页
第2页 / 共219页
IVD性能评估的统计学基础-ppt课件.pptx_第3页
第3页 / 共219页
IVD性能评估的统计学基础-ppt课件.pptx_第4页
第4页 / 共219页
IVD性能评估的统计学基础-ppt课件.pptx_第5页
第5页 / 共219页
点击查看更多>>
资源描述

1、性能指标的建立性能指标的确认、验证、评价涉及不同机构统计学基础知识在IVD性能评估中的应用(前提是测量的随机误差小,可靠性高,系统概念要加强),如均匀性、稳定性、比对、互换性、线性等收集、处理、分析、解释数据并从数据中得出结论的科学收集数据:取得数据处理数据:图表展示分析数据:利用统计方法分析数据数据解释:结果的说明得到结论:从数据分析中得出客观结论统计学是一门科学统计方法是通用的数据分析方法。这些方法不是为某个特定的问题领域而构造的统计学是一门艺术不同的人对同一组数据的分析可能得到不同的结论。使用数字讲故事取决于统计学家的技巧和他们的经验统计学是一门技术统计方法是为保证产品达到所希望的质量和

2、保持其稳定性的管理系统中建立起来的 统计思维总有一天会像读与写一样成为一个有效率公民的必备能力 Herbert George Wells 谈到统计大家都认为统计是一种抽象、复杂、逻辑性强的概念 其实,我们大家每天都在用统计 统计基础知识大家都学过,现在我们再次温习一遍,加深印象 现在学统计不要有太多的为什么,而是“能不能用”,对结果的解释程度能到多少,是否合理?假设? 统计分析统计分析描述统计描述统计推断统计推断统计参数参数估计估计假设假设检验检验研究数据收集、整理和描述的统计学方法 02040608010012012345目的u描述数据特征u找出数据的基本规律内容u搜集数据u整理数据u展示数

3、据u描述性分析 研究如何利用样本数据来推断总体特征的统计学方法内容u参数估计u假设检验 目的u对总体特征做出判断定量变量定量变量(quantitative variable) 或或数值变量数值变量(metric variable)可以用阿拉伯数据来记录其观察结果如“葡萄糖浓度”、“酶的催化活性”、“血细胞的个数”、“核酸扩增的CT值?”定量变量的观察结果称为定量数据或数值型数据(metric data)分类变量分类变量(categorical variable)表现为不同的类别如“药敏实验结果”、“干化学尿液分析结果” 等分类变量的观察结果就是分类数据(categorical data)顺序变

4、量顺序变量(rank variable)或有序分类变量或有序分类变量具有一定顺序的类别变量如氨基酸序列(测序)顺序变量的观察结果就是顺序数据或有序分类数据(rank data) 抽取样本总体:包含所研究的全部个体(数据)的集合样本:从总体中抽取的一部分元素的集合样本量:构成样本的元素的数目概率抽样方法概率抽样根据一个已知的概率来抽取样本单位,也称随机抽样特点l按一定的概率以随机原则抽取样本l抽取样本时使每个单位都有一定的机会被抽中l每个单位被抽中的概率是已知的,或是可以计算出来的 l当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样从总体N个单位(元素)中随机地抽取n

5、个单位作为样本,使得总体中每一个元素总体中每一个元素都有相同的机会(概率)被抽中(抽签法、随机数表法抽签法、随机数表法) 抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率简单随机样本由简单随机抽样形成的样本从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为每一个容量为n样本样本都有相同的机会(概率)被抽中 参数估计和假设检验所依据的主要是简单随机样本分层抽样(分类抽样)将总体单位按某种特征或某种规则划分

6、为不同的层,然后从不同的层中独立、随机地抽取样本优点l保证样本的结构与总体的结构比较相近,从而提高估计的精度l组织实施调查方便l既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(等距抽样)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位l先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,有时可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点l抽样时只需群的

7、抽样框,可简化工作量l调查的地点相对集中,节省调查费用,方便调查的实施l缺点是估计的精度通常较差类别类别特点特点相互联系相互联系适用范围适用范围共同点共同点简单随机简单随机抽样抽样逐一抽取逐一抽取 小样本小样本等概率等概率系统抽样系统抽样 总体分成几部分总体分成几部分每部分简单随每部分简单随机抽样机抽样大样本大样本分布均匀分布均匀分层抽样分层抽样总体总体分成几分成几层(差层(差异异大大、小小)每每层用层用简单随简单随机抽样或系统机抽样或系统抽样抽样总体由差异总体由差异明显的几部明显的几部分组成分组成总体分布总体分布正态分布正态分布非正态分布非正态分布样本均值样本均值正态分布正态分布样本均值样本

8、均值正态分布正态分布样本均值样本均值非正态分布非正态分布大样本大样本小样本小样本大样本大样本小样本小样本数据类别数据类别定性数据定性数据定量数据定量数据图表类别图表类别频数分布频数分布频数分布频数分布条形图条形图直方图直方图饼形图饼形图茎叶、箱线茎叶、箱线垂线、误差垂线、误差环形图环形图散点图散点图雷达图雷达图轮廓图轮廓图某地区不同年龄段男女血清ALT活性测量(95%)2029303940495059男 Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 1 . 2 2.00 2 . 59 .00 3 . 1.00 4 . 5 Stem width: 1

9、00 Each leaf: 1 case(s)数据类型与显示数据类型与显示数值型数据数值型数据分类分类数据数据分组数据分组数据总计表总计表茎茎叶叶图图条条形形图图圆圆形形图图环环形形图图直直方方图图箱箱线线图图折折线线图图原始数据原始数据时序数据时序数据线线图图雷雷达达图图多元数据多元数据数据特性数据特性水平水平差异差异分布分布统计量统计量平均数平均数方差方差偏态偏态众数众数极差极差四分位差四分位差峰态峰态中位数中位数Zi标准分数标准分数分位数分位数离散系数离散系数集中趋势的描述之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于分类数据,也可用于定序数据和数值型数据中位数

10、和分位数集中趋势的描述之一排序后处于中间位置上的值不受极端值的影响主要用于定序数据,也可用数值型数据,但不能用于定类数据各变量值与中位数的离差绝对值之和最小中位数和分位数计算公式:中位数和分位数集中趋势的描述之一排序后处于25%和75%位置上的值不受极端值的影响主要用于定序数据,也可用于数值型数据,但不能用于定类数据均值集中趋势的描述之一最常用的统计量一组数据的均衡点所在易受极端值的影响用于数值型数据,不能用于定类数据和定序数据均值简单均值加权均值几何平均值(平均发展速度)对称分布左偏分布中位数右偏分布众众 数数 不受极端值影响不受极端值影响 具有不惟一性具有不惟一性 数据较多时有意义,且有数

11、据较多时有意义,且有明显峰值时应用明显峰值时应用 中位数中位数 不受极端值影响不受极端值影响 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 平均数平均数 易受极端值影响易受极端值影响 利用了全部数据信息,数学性质优良利用了全部数据信息,数学性质优良 数据数据对称分布或接近对称分布时应用较好对称分布或接近对称分布时应用较好 当要用样本信息对总体进行当要用样本信息对总体进行推断时,平均数就更显示出它的各种推断时,平均数就更显示出它的各种 优良特性优良特性 SPSS定义定义EXCEL1 11.251.251 11.751.752 23 33.753.753 33.253.254 4四分位差四

12、分位差2.52.52 21.51.5四分位差离散程度的描述之一也称为内距或四分间距上四分位数与下四分位数之差 QD = QU QL反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性一组数据的最大值与最小值之差离散程度的最简单描述易受极端值影响未考虑数据的分布离散程度的描述之一最常用的描述值反映了数据的分布反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差计算公式也称标准分数给出某一个值在一组数据中的相对位置可用于判断一组数据是否有离群点用于对变量的标准化处理计算公式为我们叫变异系数标准差与其相应的均值之比消除了数据

13、水平高低和计量单位的影响描述了数据的相对离散程度用于对不同组别数据离散程度的比较偏态峰度数据分布偏斜程度的描述偏态系数=0为对称分布偏态系数 0为右偏分布偏态系数 0为左偏分布计算公式为数据分布扁平程度的测度峰度系数=3=3扁平程度适中偏态系数333为尖峰分布计算公式为 数学定律不能百分之百确切的用在现实生活里; 能百分之百确切的用数学定律描述的就不是现实生活 Albert Einstein举例,不同的应用2n2%事件的概率事件A的概率是对事件A在试验中出现的可能性大小的一种度量表示事件A出现可能性大小的数值事件A的概率表示为P(A)概率的定义有:古典定义、统计定义和主观概率定义事件的概率古典

14、定义事件的概率统计的定义 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,取向于稳定,这个频率的稳定值即为事件A的概率,记为期望值:描述随机变量集中程度的统计量离散型概率分布: Binomdist、Poisson、Hypergeometric 连续型概率分布 均匀、正态、指数、其他分布离散型概率分布二项分布与贝努里试验有关贝努里试验具有如下属性l试验包含了n 个相同的试验l每次试验只有两个可能的结果,即“成功”和“失败”l出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q

15、也相同,且 p + q = 1l试验是相互独立的l试验“成功”或“失败”可以计数离散型概率分布进行 n 次重复试验,出现“成功”的次数的概率分布称为二项分布设X为 n 次重复试验中事件A出现的次数,X 取 x 的概率为离散型概率分布泊松分布泊松分布用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布泊松分布的例子1mL溶液中粒子计数离散型概率分布 给定的时间间隔、长度、面积、体积内“成功”的平均数e = 2.71828 x 给定的时间间隔、长度、面积、体积内“成功”的次数连续型概率分布密度函数曲线下的面积等于1分布函数是曲线下小于 x0 的面积连续型概率分布 若随机变

16、量X的概率密度函数为 称X在区间a ,b上均匀分布 数学期望和方差分别为xf(x)ba连续型概率分布 描述连续型随机变量的最重要的分布 可用于近似离散型随机变量的分布例如: 二项分布 经典统计推断的基础连续型概率分布xCAB连续型概率分布任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布连续型概率分布数据正态性评估数据正态性评估直方图、茎叶图、直方图、茎叶图、P-P、Q-Q样本均值样本均值标准化标准化(两个样本两个样本)样本方差除以样本方差除以总体方差(分类变量)总体方差(分类变量)两个样本方差两个样本方差相比(多个样本)相比(多个样本)ExcelTDIST(2,10,22,10,

17、2)=0.073=0.073TINV(0.073,100.073,10)=2=2自由度趋于无限大时,接近标准的自由度趋于无限大时,接近标准的Z Z分布分布用途:均值差异用途:均值差异ExcelCHIDIST(8,108,10)=0.073=0.073CHIINV(0.073,80.073,8)=1.20=1.20(右尾概率)(右尾概率)独立正态变量的平方和,自由度无限大时接近对称分布独立正态变量的平方和,自由度无限大时接近对称分布用途:总体方差估计、非参数检验(单样本、双样本)用途:总体方差估计、非参数检验(单样本、双样本)统计量(统计量(H0:独立):独立)列联表的独立性检验列联表的独立性检

18、验 【例】如表所如表所示示频数分布,频数分布,以以95%95%显著水平显著水平,检验,检验ALTALT异异常与肝炎是否常与肝炎是否有关有关患者ALTALT指标指标肝炎正常合计ALT异常ALT正常620345354246974591合计9656001565对表对表1 1所示频数分布表,以所示频数分布表,以95%95%显著水平,检验色觉与性别是否有关。显著水平,检验色觉与性别是否有关。表表 1色觉与性别联合分布频数色觉与性别联合分布频数(fij)对表对表1 1所示频数分布表,以所示频数分布表,以95%95%显著水平,检验色觉与性别是否有关。显著水平,检验色觉与性别是否有关。表表 1色觉与性别联合分

19、布频数色觉与性别联合分布频数(fij)P0.040.04拒绝原假设,即拒绝原假设,即ALTALT异常和肝炎相互不独立异常和肝炎相互不独立患者ALTALT指标指标肝炎正常合计ALT异常ALT正常601364373227974591合计9656001565ExcelFDIST(3 3,1010 , 8 8)=0.066=0.066FINV(0.050.05,1010,8 8)=3.35=3.35CHICHI分布的比分布的比用途:方差差异用途:方差差异待估参数待估参数均值均值大样本大样本Z分布分布小样本小样本Z分布分布T分布分布比例比例大样本大样本Z分布分布方差方差大、小样本大、小样本待估参数待估参

20、数均值差均值差Z分布分布配对样本配对样本t分布分布t分布分布比例差比例差独立大样本独立大样本Z分布分布方差比方差比独立大样本独立大样本独立小样本独立小样本正态总体正态总体t分布分布Z分布分布Z分布分布Muriel BristolFisher提出提出原假设和备择假设原假设和备择假设 什么是原假设?什么是原假设?(Null Hypothesis)待检验的假设,又称待检验的假设,又称“0假设假设”,表示为表示为 H0 什么是备择假设?什么是备择假设?(Alternative Hypothesis)与原假设对立的假设与原假设对立的假设,表示为表示为 H1 确定统计量确定统计量,基本形式为基本形式为:什

21、么显著性水平?什么显著性水平?是一个概率值原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域表示为 (alpha)常用的 值有0.01, 0.05, 0.10由研究者事先确定假设检验假设检验中的小概率中的小概率原理原理什么小概率?什么小概率?在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设小概率由研究者事先确定假设检验中的两类假设检验中的两类错误错误(提供推翻原假设的证据,不提供推翻原假设的证据,不提供原假设正确与否的提供原假设正确与否的证据证据)第一类错误(弃真错误)第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误

22、的概率为被称为显著性水平第二类错误(取伪错误)第二类错误(取伪错误)原假设为假时不拒绝原假设第二类错误的概率为(Beta)你不能同时减你不能同时减少两类错误少两类错误!两个总体均值之差的 t 检验 (12、22未知)检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但相等12=22(?)检验统计量其中两个总体均值之差的 t 检验 (配对样本的 t 检验)检验两个相关总体的均值配对或匹配重复测量 (前/后)利用相关样本可消除项目间的方差假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 )配对样本的

23、t 检验独立性独立性- -配对性配对性是否考虑方差齐性是否考虑方差齐性独立样本计算合并方差独立样本计算合并方差- -配对样本计算标准差配对样本计算标准差单单样本与配对样本样本与配对样本独立样本t检验 配对样本t检验 【例】 A、B两个厂家的ALT试剂盒分别测量10份血清样本,结果如下: 请问取显著性水平=0.05时,A、B两个厂家的测量结果是否存在显著差异 厂家厂家1 12 23 34 45 56 67 78 89 91010A2245385218964369600870106B2550405518067360590860110解:解:结果为一组样本的不同试剂测量结果,配对关系明确结果为一组样

24、本的不同试剂测量结果,配对关系明确设原假设设原假设H H0 0:两种试剂测量结果之间无差异:两种试剂测量结果之间无差异备择假设备择假设H H1 1:两种试剂测量结果:两种试剂测量结果之间有差异之间有差异检验多个总体均值是否检验多个总体均值是否相等相等(样本是否来自同一总体样本是否来自同一总体)通过对各观察数据误差来源的分析来判断多个总体均值是否相等通过对各观察数据误差来源的分析来判断多个总体均值是否相等变量变量(分类变量与数值变量的分类变量与数值变量的关系关系)一个分类变量一个分类变量2 2个个或多个或多个 (k 个个) 处理水平或分类处理水平或分类一个因变量一个因变量用于分析完全随机化试验设

25、计用于分析完全随机化试验设计假设:正、齐、假设:正、齐、立立每个总体都应服从正态分布每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本单随机样本各个总体的方差必须相同各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的对于各组观察数据,是从具有相同方差的总体中抽取的观察值是独立的观察值是独立的之间不相关之间不相关 公式公式 正态性:正态性:P-P、Q-Q 方差齐性:方差齐性:单因素方差分析单因素方差分析2.t检验适用于两个变量均数间的差异检验,多于两个检验适用于两个变量均数间的差异

26、检验,多于两个变量间的均数比较要用方差分析变量间的均数比较要用方差分析1.方差分析与成组设计方差分析与成组设计t检验的前提条件是相同的,即检验的前提条件是相同的,即正态性和方差齐性正态性和方差齐性3.分析分析因素间的因素间的交互作用、方差齐性检验交互作用、方差齐性检验相关关系相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相关完全相关不相关不相关样本相关系数的计算公式 r 的取值范围是 -1,1|r|=1,为完全相关r =1,为完全正相关r =-1,为完全负正相关 r = 0,不存在线性相关关系相关-1r0,为负相关0r1,为正相关|r|越趋于1

27、表示关系越密切;|r|越趋于0表示关系越不密切计算检验的统计量检验两个变量之间是否存在线性相关关系等价于对回归系数 1的检验采用 t 检验检验的步骤为提出假设:H0: = ;H1: 0平方(差)平方(差)绝对(差)绝对(差)差差回回归归方方法法普通普通回归回归-Y存在存在随机误差随机误差LSD(普通)(普通)LSD(加权)(加权)回归回归-X、Y存在存在随机误差随机误差Deming线性回归的假设条件:立、正、齐线性回归的假设条件:立、正、齐(方程式的随机误差)(方程式的随机误差)对于只涉及一个自变量的简单线性回归模型可表示为 y = +1x +en模型中,y 是 x 的线性函数(部分)加上误差

28、项n线性部分反映了由于 x 的变化而引起的 y 的变化n误差项 e 是随机变量l反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响l是不能由 x 和 y 之间的线性关系所解释的变异性n0 和 1 称为模型的参数提出假设 H0:线性关系不显著计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 作出决策:若FF ,拒绝H0;若Ft2,拒绝H0; tt2,接受估计标准误差 Sy=+=niiyxxxnSS122)()(10=niiyxxSS12)(1斜率、截距 预测预测区间(个别值)与置信区间(平均值)区间(个别值)与置信区间(平均值)包括平均值和个别值包括

29、平均值和个别值 一一元回归:线性关系检验和回归系数检验的关系元回归:线性关系检验和回归系数检验的关系2. 根据最小二乘法的要求,可得求解各回归参数 的标准方程如下1. 使因变量的观察值与估计值之间的离差平方和达到最小来求得 即显著性检验显著性检验显著性检验显著性检验 回归系数(线性关系)回归系数(线性关系)t检验,斜率检验,斜率95%置信区间置信区间为(为(35),含义),含义呈呈G G分布分布不呈不呈G G分布分布显著性水平显著性水平=5%=5%LoB=+1.645LoB=+1.645(单尾)(单尾)Nb(95/100 ) +0.5Nb(95/100 ) +0.5考虑基质效应考虑基质效应60

30、60个数据(个数据(4 46 6)呈呈G G分布分布不呈不呈G G分布分布2020个数据个数据LOB信号值0 M2SD多多个样本:目的是不同基质个样本:目的是不同基质可能会产生信号的干扰可能会产生信号的干扰LoBLoB4 4* *LoD LoD 4 46 6 (6060个数据个数据)确定过程)确定过程2020个数据(个数据(可能时这些测量包括来自样本和不同时间段可能时这些测量包括来自样本和不同时间段的变异的变异)LoDLoD的计算,不应按照信号进行处理(代入公式)的计算,不应按照信号进行处理(代入公式)统计的判定同统计的判定同LoBLoBLoD样本0LoB样本LoDLoDLoDLoD多多个不同

31、浓度样本:目的是评估真实的个不同浓度样本:目的是评估真实的LoDLoDLoB1.645SD=LoD-1.645SDLoB1.645SDLoD-1.645SD4040个数据(个数据(5 5次试验)次试验)(3 35 5)LoQLoQ是建立在特定的性能要求之下的,如偏移和不精密度是建立在特定的性能要求之下的,如偏移和不精密度或不确定度等。或不确定度等。如果不符合该水平目标值,那么必须进行略高水平的测试。如果不符合该水平目标值,那么必须进行略高水平的测试。应使用参考物质或类似的物质。应使用参考物质或类似的物质。2525个数据(无明确个数据(无明确样本数量)样本数量)统计的判定同统计的判定同LoBLo

32、B使用最少使用最少2525次重复是可接受的。每一样本重复值与该样次重复是可接受的。每一样本重复值与该样本参考值差值和误差目标值比较。超出误差目标结果的本参考值差值和误差目标值比较。超出误差目标结果的数量是该水平方法适合的一个测量。数量是该水平方法适合的一个测量。结果结果LoB LoB 报告报告“未检测到,浓度未检测到,浓度LoDLoD”LoBLoB结果结果LoD LoD 报告报告“分析物已检测到,浓度分析物已检测到,浓度LoQLoQ”LoDLoD结果结果LoQ LoQ 报告报告“分析物已检测到,浓度分析物已检测到,浓度LoQLoQ” ” 效能函数效能函数EnEn表达(表达(13528:2005

33、13528:2005)不准确度不准确度表达(现在以偏差形式体现,包含在表达(现在以偏差形式体现,包含在EnEn中)中) 试验方法:试验方法:100100(4040)个样本,测量)个样本,测量2 2次(降低随机误差),回归分析次(降低随机误差),回归分析2.2.绘制散点图绘制散点图结果散点图结果散点图浓度与偏差散点图浓度与偏差散点图1.1.离群值的检查(相对离群值的检查(相对& &绝对):绝对):方法内:极差进行评价(方法内:极差进行评价(x x、y y),以),以4 4倍均值作为可接受限倍均值作为可接受限评价方法评价方法- -对照方法:逐一进行比较,判定标准同上对照方法:逐一进行比较,判定标准

34、同上思考?思考? 合理建立指标合理建立指标基础:离群值检查基础:离群值检查确定系数确定系数95%95%置信区间置信区间在此基础上还应结合技术因素进行判定,在做判断时,技术因素在此基础上还应结合技术因素进行判定,在做判断时,技术因素要放在第一位,不要单凭统计做判定。因此,比对试验时回归系要放在第一位,不要单凭统计做判定。因此,比对试验时回归系数的要求非常重要。数的要求非常重要。离群值检验离群值检验 一元回归分析一元回归分析 EP9-A3EP9-A3中关于一元直线回归的方法介绍中关于一元直线回归的方法介绍LSDLSDWLSWLSDeimngDeimng回收试验的理解:回收试验的理解:1.1.不完全

35、是真实反应准确度的指标,但他是建立方法学的基础不完全是真实反应准确度的指标,但他是建立方法学的基础2.2.回收:指的是对已知量值的分析物添加到基质样本中后,测得回收:指的是对已知量值的分析物添加到基质样本中后,测得所添加分析物的量与添加量的比值所添加分析物的量与添加量的比值误用:误用:1.1.标准溶液的误解(校准物)标准溶液的误解(校准物)2.2.统计方面的考虑统计方面的考虑浓度浓度吸光度吸光度零点零点0 00.10.1高值高值1001000.50.5曲线曲线Y=0.004X+0.1样本样本0.20.225251:11:1添加添加0.350.3562.562.5回收率回收率100%100%高值

36、高值10001000曲线曲线Y=0.0004X+0.1样本样本0.20.22502501:11:1添加添加0.350.35625625回收率回收率100%100%结论:结论:用校准物质做回收试验用校准物质做回收试验的标准溶液,理论上是的标准溶液,理论上是一个恒等式(不用做试一个恒等式(不用做试验就能证明)验就能证明)主要是用于评价测量结果之间的一致性程度的指标,通常用表达主要是用于评价测量结果之间的一致性程度的指标,通常用表达数据离散程度的标准偏差来表示,当测量结果的离散性和量值具数据离散程度的标准偏差来表示,当测量结果的离散性和量值具有相关性时,用表示数据离散程度和集中程度统计量的比值表示有

37、相关性时,用表示数据离散程度和集中程度统计量的比值表示注意:重复性(离散系数)需同某一浓度或浓度范围共同使用时注意:重复性(离散系数)需同某一浓度或浓度范围共同使用时才具有合理性才具有合理性例如,例如,ALTALT试剂的试剂的CV5%,CV5%,如果不注明性能评估时的浓度或其范围值,如果不注明性能评估时的浓度或其范围值,就不能真实的反应试剂性能特征就不能真实的反应试剂性能特征统计量离散系数表示差异时,应明确其量值水平统计量离散系数表示差异时,应明确其量值水平 单因素方差分析进行回归(线性)显著性检验单因素方差分析进行回归(线性)显著性检验 t t检验进行回归系数(斜率)显著性检验检验进行回归系

38、数(斜率)显著性检验 F F值进行均匀性检验值进行均匀性检验: :分析内精密度足以检出组间差异分析内精密度足以检出组间差异假设:假设:S S1 1没有随机因素、没有随机因素、S S2 2为随机因素为随机因素项目次数123174.074.374.6273.974.174.6373.774.574.0473.574.174.2573.673.974.7673.873.974.4773.874.374.5874.074.374.4973.573.974.21073.774.174.41173.574.174.51273.473.674.31373.473.874.71474.074.274.1157

39、3.474.174.01673.873.974.21774.274.274.51874.074.174.61973.973.774.72073.774.274.2对对2020瓶瓶ALTALT校准物进行均匀性检验,每瓶测量校准物进行均匀性检验,每瓶测量3 3次,测量结果如下:次,测量结果如下: 单因素方差分析进行回归(线性)显著性检验单因素方差分析进行回归(线性)显著性检验 t t检验进行回归系数(斜率)显著性检验检验进行回归系数(斜率)显著性检验 瓶间均匀性瓶间均匀性检验检验线性回归相关术语线性回归相关术语相关系数相关系数回归系数回归系数确定系数确定系数残差(线性偏差)残差(线性偏差)回归标准

40、误回归标准误线性?线性?评价指标?评价指标?系数和非线性的系数和非线性的误差目标误差目标曲线回归谈线性:曲线回归谈线性:存在两个系数存在两个系数误差:误差:线性和回归线性和回归样本:样本:等距原则等距原则22)()()(yyxxyyxxiiii相关系数只是表示变量之间变化趋势的指标,其代表的是观测值,相关系数只是表示变量之间变化趋势的指标,其代表的是观测值,不代表可靠程度,如下图不代表可靠程度,如下图因此,确定系数越接近因此,确定系数越接近1 1(没有其他指标)时,不能声称线性良好(没有其他指标)时,不能声称线性良好A A、B B两个制造商的两个制造商的ALPALP试剂,测量已知比例样本的结果

41、试剂,测量已知比例样本的结果制造商制造商AB1 1252510102 2494919193 3747430304 4999939395 51241245050A A、B B两个制造商的两个制造商的ALPALP试剂,测量已知比例样本的结果试剂,测量已知比例样本的结果几点思考几点思考1 1. .在在(0 010001000)范围内,线性偏差在)范围内,线性偏差在10%10%范围内?范围内?/ /浓度点浓度点2.2.多多点定标方:使用定标液进行相关系数的测量,在统计上不代表点定标方:使用定标液进行相关系数的测量,在统计上不代表任何意义(亦为恒等式)任何意义(亦为恒等式)3.3.选择曲线拟合是因为量值

42、与信号值不是直接呈线性,目的也是使选择曲线拟合是因为量值与信号值不是直接呈线性,目的也是使得测量值无限接近真实得测量值无限接近真实值值( (相关系数非线性相关系数相关系数非线性相关系数) )4.4.只规定相关系数的线性要求不具有实际只规定相关系数的线性要求不具有实际意义(拟合优度)意义(拟合优度)5.5.不同拟合会产生截然不同的结果,主要考虑侧重于哪方面考虑不同拟合会产生截然不同的结果,主要考虑侧重于哪方面考虑线性回归(线性回归(SLOPESLOPE、INTERCEPTINTERCEPT、CORRELCORREL):):1.1.绝对偏差最小(绝对偏差最小(LSDLSD)- -简单的线性拟合简单

43、的线性拟合缺点,容易受最大值的影响。如线性范围较宽时,高值的贡献占比缺点,容易受最大值的影响。如线性范围较宽时,高值的贡献占比重较大,在高端相对偏差小、绝对偏差大,在低端相对偏差大重较大,在高端相对偏差小、绝对偏差大,在低端相对偏差大原因:离均差平方和原理原因:离均差平方和原理2.2.相对偏差较小相对偏差较小(WLSWLS)- -加权线性回归加权线性回归公式如下:公式如下:线性回归xiyi普通回归-最小二乘法权重回归-最小二乘法浓度响应值预期值相对偏差预期值相对偏差10.219574110.14110.0%2032.89 3.9%20.550816651.4430.9%4752.54 -6.5

44、%31.0962810886.9413.1%9285.29 -3.6%42.02000519357.94-3.2%18350.79 -8.3%55.04458144770.930.4%45547.29 2.2%610.09345287125.91-6.8%90874.79 -2.8%720.0171291171835.880.3%181529.78 6.0%840.0340000341255.820.4%362839.77 6.7%截距2415.942截距 219.791斜率8470.997斜率 9065.499r1.000r0.998测量范围下限(测量范围下限(LMRLMR)指在规定条件下的

45、最低水平,)指在规定条件下的最低水平,该特定条件包括方法声称的所有特征,包括偏倚和该特定条件包括方法声称的所有特征,包括偏倚和不精密度,不确定度,以及其他特征。不精密度,不确定度,以及其他特征。线性范围下限(线性范围下限(LLRLLR)指方法的响应值与真实浓度)指方法的响应值与真实浓度有线性关系的最低浓度有线性关系的最低浓度。也要求附有一个关于线性也要求附有一个关于线性任何声明的非线性误差目标。任何声明的非线性误差目标。测量范围下限(测量范围下限(LMRLMR)从其定义看,类似于定量限(对从其定义看,类似于定量限(对应关系明确)应关系明确)线性范围下限(线性范围下限(LLRLLR)除了规定明确

46、的线性要求外,还除了规定明确的线性要求外,还要求有一个要求有一个非线性误差目标非线性误差目标:真实浓度真实浓度 LoD LoD 时报告时报告LoQLoQ,只有,只有 LoQ LoQ时,时,才报告测量结果,因此可以得到才报告测量结果,因此可以得到LLRLLR LoQ LoQ直线平行的检验直线平行的检验1.1.计算每条线的回归标准误计算每条线的回归标准误2 2. .计算斜率差值的标准误计算斜率差值的标准误3.3.计算斜率差值与标准误的比计算斜率差值与标准误的比4.4.查查t t(0.050.05,n1-2+n2-2n1-2+n2-2) 统计处理统计处理趋势分析:对分类变量和数值变量进行趋势分析趋势

47、分析:对分类变量和数值变量进行趋势分析 P P0.050.05时,认为趋势不显著时,认为趋势不显著 P P0.050.05时,一元回归确定时,一元回归确定95%95%的预测区间,结合区间判定的预测区间,结合区间判定 单因素方差分析进行回归(线性)显著性检验单因素方差分析进行回归(线性)显著性检验 t t检验进行回归系数(斜率)显著性检验检验进行回归系数(斜率)显著性检验 ALP12ALP12个月稳定性试验结果如下:个月稳定性试验结果如下:月月第第1 1次次第第2 2次次第第3 3次次第第4 4次次第第5 5次次第第6 6次次0 0175.5175.5176.2176.2175.7175.717

48、5.5175.5175.5175.5173.1173.13 3176.7176.7175.8175.8174.8174.8174.5174.5175.2175.2176.0176.06 6175.1175.1175.9175.9175.2175.2176.5176.5176.3176.3175.4175.49 9175.0175.0176.5176.5176.8176.8176.1176.1176.6176.6176.9176.91212175.0175.0174.7174.7175.9175.9176.4176.4176.5176.5175.2175.2 (单因素方差分(单因素方差分析)回归

49、(线性)析)回归(线性)显著性检验显著性检验 (t t检验)回归系检验)回归系数(斜率)显著数(斜率)显著性检验性检验 关于稳定性的思考关于稳定性的思考1.1.稳定不稳定应建立在趋势分析的基础上;稳定不稳定应建立在趋势分析的基础上;从统计考虑,允许从统计考虑,允许10%10%的量值变化,这种方式是不稳定的的量值变化,这种方式是不稳定的表现表现2.2.加速稳定性可以被接受作为确立产品说明的最初失效期的基础,加速稳定性可以被接受作为确立产品说明的最初失效期的基础,对于有些试剂,可能对于有些试剂,可能不适宜不适宜(组分复杂)(组分复杂)3.3.加速稳定性不宜用于推断效期稳定性加速稳定性不宜用于推断效

50、期稳定性4.4.稳定性和准确度是两种特性,不要用准确度指标评价稳定性稳定性和准确度是两种特性,不要用准确度指标评价稳定性 不考虑权重的不考虑权重的LSD-TPLSD-TP互换性试验结果如下:互换性试验结果如下:测量结果(单位:g/L)测量方法对照方法(参考方法)评估方法(常规方法)临床样本1 2 3 平均值1 2 3 平均值#159.5 59.5 58.6 59.2 60.3 59.9 60.4 60.2 #250.9 50.8 50.3 50.7 49.0 48.8 48.8 48.9 #371.4 71.9 71.2 71.5 67.7 67.1 67.8 67.5 #465.4 66.1

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(IVD性能评估的统计学基础-ppt课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|