随机对照试验(RCT) - 队列研究 + 连续变量的样本含量估计
作者/风仕
上期已经讲完随机对照试验(RCT)-对列研究+分类变量的样本含量估计,这期开始讲随机对照试验(RCT)-队列研究+连续变量的样本含量估计,主要从基础知识、问题与数据、对问题分析及PASS软件操作进行讲解。
基础知识
1.基本原理
对于连续变量,样本量估算的原理是基于能够准确估计组间差异或效应大小,并在给定的统计把握度下检测到这种差异。通过估计总体参数的变异性、设定检验水准以及预期的组间差异,来确定所需的样本量,以保证研究结果具有可靠性和有效性。
2.设计特点
同样是 RCT 与队列研究的结合,不过观察的指标是连续变量,如血压值、血糖值、生存质量评分等,用于比较不同干预组在一段时间内连续变量的变化情况。
3.影响样本量的因素
(1)检验水准(α):与分类变量情况类似,通常取 0.05 或 0.01,α 越小,为达到相同检验效能所需的样本量越大。
(2)检验效能(1 - β):一般要求检验效能不低于 0.8。检验效能越高,需要的样本量越多,以确保能够准确地检测出真实存在的组间差异。
(3)预期组间差异(δ):即研究者期望在两组(如干预组和对照组)之间观察到的连续变量的平均差异。差异越大,越容易检测到,所需样本量越小。
(4)总体标准差(σ):反映了连续变量在总体中的变异程度。标准差越大,说明数据的离散程度越大,需要更大的样本量来准确估计组间差异。
(5)单侧检验或双侧检验:双侧检验考虑差异的两个方向,而单侧检验只关注一个方向,双侧检验所需样本量通常大于单侧检验。
4.估算公式
以两组均数比较为例,若两组方差相等,样本量计算公式为
,其中μ1和μ2是两组的预期均数,σ2是总体方差的估计值,可通过预试验或文献查阅获得。
5.注意事项
(1)参数估计:准确估计总体标准差和预期组间差异是关键。这些参数的估计值可能来自以往研究、预试验或相关文献,但要注意其适用性和准确性。如果估计不准确,可能导致样本量计算偏差,影响研究结果的可靠性。
(2)数据分布:公式通常基于数据服从正态分布的假设。如果连续变量的分布明显偏离正态,可能需要进行数据转换或采用非参数方法,此时样本量估算方法可能会有所不同。
(3)个体差异和测量误差:个体之间的生物学差异以及测量过程中的误差都会影响总体标准差的估计。在研究设计中,应尽量控制测量误差,提高数据质量,以获得更准确的样本量估计。
(4)随访时间和失访率:队列研究通常需要较长时间的随访,期间可能存在患者失访。在估算样本量时,应根据研究的具体情况,合理估计失访率,并适当增加样本量以弥补可能的失访造成的影响。
问题与数据
某研究者拟开展一项平行设计的随机对照试验,探讨 A 药是否能降低血清胆固醇。估计安慰剂对照组血清总胆固醇的平均值为(215± 30)mg/dl ,干预组使用 A 药后可以降低 15mg/dl。设α =0.05(双侧), β =0.10 ,请计算干预组和对照组所需样本量。
对问题分析
对于结局指标是连续变量,平行设计的随机对照试验,计算样本量时需要知道 :
1.研究设计类型;
2.结局指标类型;
3.结局指标的估计平均值;
4.结局指标的离散程度;
5.检验水准α;
6.把握度 1-β 结 局指标的估计平均值和离散程度主要是依靠查阅文献、预试验、专家经验来定的,给一个大致的范围即可。
例子里面的 6 个参数分别为:
1、研究设计类型(随机对照试验) ;
2、结局指标类型(连续变量 ——血清总胆固醇) ;
3、结局指标的估计平均值(对照组 215mg/dl、干预组 200mg/dl);
4、结局指标的离散程度(标准差 30mg/dl);
5、检验水准α =0.05;
6、把握度 1-β =0.9。
PASS软件操作
1、选择 Means→Two Independent Means→Test (Inequality)→Test for Two Means(Two-Sample T-Test)[Differences]
2、Find (Solve for)中选择 N1,Power (1-Beta)中选择 0.9,Alpha (Significance Level)中选择 0.05;
N2 (Sample Size Group 2)中选择 Use R, R (Sample Allocation Ratio)中选择 1.0 [R 为 N2 组与 N1组的样本量之比。如果预设两组样本量相等,则选择 1.0;如果预设两组样本量之比为 1:2,则选择 2.0;依次类推];
Mean1 (Mean of Group 1)中填入 215, Mean2 (Mean of Group 2)中填入 200;
S1(Standard Deviation Group 1)中填入 30 ,S2 (Standard Deviation Group 2)中选择 S1;
点击 Know Standard Deviations。
其它选择为默认选项后 ,点击 RUN。
3.结果解释
PASS 软件给出了样本量计算的结果、参考文献、报告中的名词定义和总结性描述。在样本量计算结果 中我们需要关注以下 2 列:
(1)N1:干预组样本量。本研究的干预组需要 85 例研究对象。
(2)N1:对照组样本量。本研究的对照组需要 85 例研究对象。
4.撰写结论
本研究为平行随机对照研究。干预组为使用 A 药组,对照组为安慰剂对照组,血清总胆固醇为主要观察 的结局指标。根据既往文献报道,估计对照组血清总胆固醇的平均值为 215mg/dl,干预组使用 A 药后可以降低15mg/dl,血清总胆固醇的标准差约为 30mg/dl。设α =0.05(双侧) ,β =0.10。利用 PASS 11 软件计算得到干预组和对照组的样本量 N1 =N2 =85 例。假定研究对象的失访率为 10% ,则需样本量N1 =N2 =85÷0.9 =94 例。实际研究中,两组各纳入 100 例。
欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购:
1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。
2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。
3.购买视频课程赠送课程相关主题内容1对1答疑1年。