临床研究的缺失数据处理 解释NEJM顶级论文的统计方法

小夏 教育 更新 2024-03-07

更多信息请点击右侧:2024年“真实世界临床研究”培训班,发送全套倾向评分方法**。

今天的第一篇文章:

NEJM**缺失数据处理临床试验的解释。

缺乏数据是困扰临床研究的一个主要问题,研究人员非常焦虑,以至于他们抓挠耳朵和脸颊。 缺少的数据太多了,这让无数的计算机科学家、数学家和医学家都弯腰驼背。 今天我们来看看发表在顶级期刊NEJM上的一篇结尾多插值文章。

2023 年 12 月 28 日,一篇题为:"restrictive or liberal transfusion strategy in myocardial infarction and anemia"的临床随机对照试验**发表在:《the new england journal of medicine》(顶部,IF=158。5)作者来自罗格斯大学的Jeffrey L Carson团队。 该研究纳入了3504例心肌梗死和贫血患者,分为限制性输血策略和开放性输血策略,采用二项式回归模型和多重插补,以确定不同输血策略与心肌梗死或死亡之间的关系。 结果显示,在心肌梗死和贫血患者中,自由输血策略并未显着降低30天内发生心肌梗死或死亡的风险。 然而,不能排除限制性输血策略的潜在危害。

摘要和主要结果

1. 研究摘要

目标:在心肌梗死和贫血患者中,自由输血策略不会显著降低 30 天内心肌梗死或死亡的风险。 然而,不能排除限制性输血策略的潜在危害。

方法:在这项 3 期干预试验中,研究人员将心肌梗死和血红蛋白水平低于 10 g dl 的患者随机分配到限制性输血策略(输血血红蛋白截止,7 或 8 g dl)或自由输血策略(血红蛋白截止,< 10 g dl)。 主要结局是心肌梗死或30天时死亡。 水果:共有 3504 名患者被纳入主要分析。 限制策略组输注红细胞单位(SD)的平均数为07 ± 1.6. 2. 在免费政策组中5 ± 2.3。在随机分组后第1至3天,限制策略组的平均血红蛋白水平比自由策略组低1%3 比 16 g/dl。限制性策略组 1749 例患者中有 295 例 (16.)9%),自由策略组 1755 名患者中有 255 名 (14.)5%)发生主要终点事件(不完全随访的多重归因风险比为115;95% 置信区间 [CI] 099比134; p = 0.07)。9.9% 的患者采用限制性策略和 83%的自由策略患者发生死亡(风险比1)。19.95% ci,0.96-1.47) ,8.5% 和 7心肌梗死发生率为 2%(风险比 1.)。19.95% ci,0.94-1.49)。

结论:在心肌梗死和贫血患者中,自由输血策略不会显著降低 30 天内心肌梗死或死亡的风险。 然而,不能排除限制性输血策略的潜在危害。 2. 调查结果

1.基线特征

从 2017 年 4 月到 2023 年 4 月,共入组 3506 名患者,其中 3504 名患者在 2 名患者不同意使用其数据后被纳入分析。 患者的平均年龄为72岁1岁,其中45岁5%是女性。 这些患者通常有合并症,约三分之一有心肌梗死、冠状动脉重建或心力衰竭病史,近一半有肾功能衰竭。 多血管疾病和左心室收缩功能下降在随机分组前接受冠状动脉造影和左心室功能评估的患者中很常见。 大多数 (55.)8% 的患者患有 2 型心肌梗死,其次是 1 型心肌梗死 (41)。7%)。随机分组前的平均血红蛋白水平为 86 g dL,中位肌酐为 14 mg/dl (124μmol/l)。至3447例(98例)。3%)接受随机分组的患者随访30天。

2.干预措施的实施限制性策略组的平均血红蛋白水平为1.,低于第1天的自由策略组3 g DL(95% 置信区间 [CI] 1.)2 比 14) 第 3 天下 16 g/dl (95% ci,1.5 比 17)。游离策略组输注的红细胞总数为3个5 倍(4,325 辆对 1,237 辆)。 游离策略组平均输注的红细胞单位 (SD) 数为 25 ± 2.3,而限制策略组为 07 ± 1.6。随机分组与出院、停药或死亡之间的中位住院时间为 5 天(间隔 2-10 天)。

限制性策略组、46 名患者(26%),其中24例是由于临床原因,包括手术和出血。

自由派政策小组241 名患者 (13) 终止了该方案。7%)其中,89例患者提供了临床原因,包括不良反应、液体超负荷、透析和输血反应。

停药的其他原因包括患者偏好 (68)、提供者偏好 (53) 和其他原因 (31),包括血液**短缺和人员配备问题。

3.我们研究了主要和次要结局限制性策略组 1749 例患者中有 295 例 (16.)9%),心肌梗塞或30天内因任何原因死亡(主要结果),游离策略组1755名患者中有255名(14。5%)死亡。粗 rr(限制性和自由)为 116(95% ci,1.00-1.35)。根据57例患者(限制性策略20例,自由策略37例)的部位调整和不完全随访。对数二项式模型,主要结局的估计 RR 为 115(95% ci,0.99-1.34; p = 0.07)。调整基线预后因素后(RR = 116; 95% ci 1.00-1.36),模型对主要结果的估计与前两个计算结果一致。

4.主要结局(心肌梗死或死亡)的 K-M 曲线。

5.亚组分析与自由输血策略相比,限制性输血对主要结局的影响在所有预先指定的亚组中是一致的。 在 1 型心肌梗死患者中,限制性策略比自由策略导致更多的主要结局事件(风险比 132; 95% ci,1.04-1.67),对2型心肌梗死患者无显著影响(风险比1.05; 95% ci,0.85-1.29)。

设计与统计方法

1. 研究设计p:来自美国 144 个试验地点的成人(18 岁)ST 段抬高或非 ST 段抬高型心肌梗死伴贫血(随机分组前 24 小时内血红蛋白水平< 10 g DL),共 3506 名患者。

e/c:自由输血策略(血红蛋白临界值,< 10 g dl) 限制性输血策略(输血血红蛋白临界值,7 或 8 g dl)。

o:心肌梗死或死亡发生在 30 天。

s:开放标签随机对照试验。 2. 统计方法

1.采用itt为了进行分析,使用双侧检验,=005、试验功效为80%,假设心肌梗死或死亡的总发生率为164%。

2.用对数二项式回归分析主要结局,确定输血策略的固定效应,随机效应为不同的临床试验地点。

3.用链式方程的多重插值 (MICE)对 30 天前退出或失访且没有主要结局事件的冒名顶替患者进行了多重插补结局数据缺失

4.对于所有试验结局,我们分析了粗略的30天风险,没有进行多次插补,并计算RR 和 95% CI。

5.对主要结局进行了二次分析,我们使用了:Kaplan Meier 方法在停药时和 30 天时评估和使用主要结局事件的累积风险log-rank 统计信息比较两条累积风险曲线。

插补与多重插补

1. 数据插补的基本知识

对于缺失值,我们有三种常见的处理方法:不处理(算法适应或转换为新分类); 删除; 归 责。 但每一条临床数据都是我们经常希望最大限度地利用的宝贵资源,因此合理的归因是一种理想的方法。 常见的归因可分为以下几种:1均值、中位数、众数和众数插补。

对于连续定量数据,可以插补均值或中位数。 这是一种经常使用的简单可行的方法。

对于离散定量数据,可以使用模式插补。 众数是指频率最高的数据组的中值。 2.固定值填充。

替换为统一参考值、标准值和特殊值。

3.邻近插补。

当 k 个样本的属性值与缺失样本最接近(最相似)时,加权平均值将进行后插补。 当k=1时,最接近的插补方法也称为热卡填充法。 4.回归插补。

构建回归模型以拟合缺失值。

5.函数插值。

对于一维数据,可以使用两个采样点进行线性插值。 也可以使用多个附近的采样点进行拉格朗日插值和牛顿插值。 函数插值和回归插值的区别在于,函数插值是完全拟合的,而回归插值是拟合以实现最小方差的。

6 多重插补 (MI)。

多重插补是使用模型估计和重复模拟来生成一组完整的数据集。 其基本原理是模拟生成缺失数据的随机分布,然后从中随机选择数据来填充缺失值。

例如,对于缺失值 n,如果我们用 y=ax+b 进行插补,则不考虑抽样的偏差。 但是在增加残差 e 后,用 y=ax+b+e 进行插补,仍然假设 a,b 是真值,但 a,b 只是我们的估计值。 因此,我们从贝叶斯后验分布中随机选择 a,b。 使用马尔可夫链蒙特卡洛 (MCMC) 方法,我们可以通过生成稳态分布链和模拟抽样来实现这种多重插补。 2. 本文的多重插补

1.多重插补方法在附录和协议中有详细描述。 主要应用其原理是马尔可夫链蒙特卡洛(MCMC)多重插补方法。 它用于在归因随访期间退出或缺席的患者主要结局数据,即漏诊死亡和心肌梗死的 30 天结果值(是否)。 使用的软件是SAS 94 proc mi 和 proc mianalyze。

2.这样做的方法是应用已经完成的数据,创建一个对数二项式模型估算结果和关键变量关系。 该模型将用于缺失 30 天结果的参与者的结果概率。 根据这些概率,它将被创建10 个插补数据集将为每个插补数据集估计具有站点随机效应的对数二项式模型,并使用稳健的方法呈现结果收敛为了获得**效果,适当调整标准误差单一估计。 然后进行了一些敏感性分析,结果与各种方法的结果相似。

3.多个插补模型中包含的变量:

附言:

只要你做过临床研究、数据收集、统计分析,你几乎肯定会遇到数据缺失的问题,这就像是现实世界中人类研究的印记。 如果我的数据丢失了,我该怎么办? 你只是删除它吗? 您不妨尝试多次插值以挽救紧急情况。 多重插补(multiple imemnumeration,MI)是一种用于填充复杂数据缺失值的方法,近年来已出现在许多高质量的SCI临床研究中。

本文通过多次插补,对缺失的数据进行补足,得到更符合实际情况的数据,得出更现实的结论。 这也为读者在遇到类似情况时提供了一种思考方式。 更详细的方法需要你阅读其他文献,毕竟学习是无止境的,总有新的东西。

详情请点击右边:医疗统计服务:专题、**毕业数据分析等。

相似文章

    2024年数据处理与通信技术与信号处理国际学术会议(ICDPCTSP 2024)

    年数据处理 通信技术和信号处理国际会议 ICDPCTSP 会议地址成都 首次提交,首次审核,首次提交出版检索 年数据处理 通信技术与信号处理国际学术会议 ICDPCTSP 将于年在成都召开。会议主要集中在数据处理 通信技术和信号处理等研究领域。大会诚邀国内外高校 科研机构专家学者 企业界人士等相关人...

    数据处理方法的总结与分析

    在数字时代,数据处理已成为各行各业不可或缺的核心技能。数据处理不仅仅是简单的数据输入和输出,还涉及一组复杂的方法和步骤,旨在从原始数据中提取有价值的信息以支持决策。下面对数据处理方法进行深入总结和分析。.数据处理的基本步骤 数据采集这是数据处理的起点,它涉及从各种 如数据库 传感器 日志文件等 获取...

    云计算中的数据处理 从海量数据中提取价值

    随着数字时代的到来,数据已成为企业竞争的关键要素。云计算技术的普及使数据处理更加高效和灵活。在本文中,我们将深入探讨云计算中的数据处理技术,以及如何使用它们从海量数据中提取价值。.云计算和数据处理。云计算是一种基于互联网的计算形式,它将数据和应用程序存储在云中并通过网络访问它们。这种计算方法使数据处...

    Excel数据处理技巧:将一堆数据分离在一起!

    不知道小伙伴们在使用Excel的时候有没有遇到过这样的情况,很多数据都连接在一个单元格里,我们该怎么分开呢?我们一起来看看,案例很简单,方法还是值得学习的。将文本或数据从文档复制到 Excel 时,会在单个单元格中挤压一长串数据。我们将把数据分成具有不同标题的列。首先,选择所有数据源,然后在 数据 ...

    工业级固态硬盘超越传统,为数据处理效率和能效树立新标杆

    随着技术的不断进步,工业固态硬盘 SSD 已逐渐取代传统的机械硬盘,成为现代工业领域的首选存储解决方案。与传统 HDD 相比,工业级 SSD 具有许多优势,为数据处理效率和能效树立了新的标杆。首先,工业级SSD的开机速度和数据传输速率远远超过传统HDD。这是由于采用了先进的闪存技术,大大提高了数据读...