Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
超越简单指标:为什么你的A/B测试需要的不仅仅是T检验结果
在进行A/B测试时,大多数团队只停留在表面问题:“指标有变化吗?”但如果我们告诉你,有一种更聪明的方法可以从实验数据中挖掘更深层次的洞察呢?让我们探讨为什么线性回归值得在你的分析工具箱中占有一席之地,即使T检验似乎已经足够。
经典方法:对会话数据进行T检验
想象一个电商平台推出了重新设计的横幅,并希望衡量其对用户会话时长的影响。最直接的做法?使用T检验。
计算结果显示,处理效果为0.56分钟——意味着用户会话时间大约多了33秒。这一提升是通过控制组和实验组平均值的简单差异计算得出的。干净、易于解释、任务完成,对吧?
其实并非如此。
线性回归的替代方案:相同答案,不同深度
现在让我们用线性回归框架来描述完全相同的实验。我们将处理状态(横幅显示:是/否)作为自变量,会话时长作为因变量。
这里变得有趣:处理的回归系数为0.56——与T检验的结果完全一致。
这并非巧合。两种方法都在检验相同的原假设。当你运行T检验时,你在问:“平均值是否存在显著差异?”线性回归则在问:“处理变量是否能解释会话时长的方差?”对于单一的二元处理变量,这两个问题在数学上实际上是等价的。
但请看R平方值:仅为0.008。模型几乎无法解释会话时长变化的原因。这一限制暗示了我们分析中的一个关键缺陷。
隐藏的问题:实验中的选择偏差
这里有个令人不舒服的事实:随机分配在A/B测试中并不能消除选择偏差——它只会减少偏差。
选择偏差发生在你的控制组和处理组之间存在系统性差异,超出了处理本身。例如:
在这种情况下,你的0.56分钟的提升可能被这些混杂因素夸大或缩小。你实际上测量的是一个“混合效果”:真正的处理影响加上选择偏差。
解决方案:加入背景变量(协变量)
这正是线性回归的优势所在。通过引入混杂变量(协变量),你可以将真实的处理效果与背景噪声区分开。
比如加入实验前的会话时长作为协变量——本质上是在问:“考虑到用户的基础会话模式,横幅真正改变了他们的行为多少?”
结果会发生巨大变化。R平方跃升至0.86,意味着86%的方差现在被模型解释。而处理的系数则降至0.47。
哪个数字更准确——0.56还是0.47?当我们用已知的0.5分钟提升模拟真实情况时,0.47明显更接近真实值。调整协变量后模型更优。
为什么这对你的决策至关重要
超越T检验和线性回归
这个原则还可以扩展。你的统计工具箱中还包括其他检验——比如R中的卡方检验、Welch’s t检验,以及更专业的方法。每一种都可以通过合适的模型调整,用回归框架重新诠释。
核心观点:下次当你倾向于相信单一的统计检验时,问问自己是否有潜在变量在扭曲你的结果。用经过深思熟虑的协变量进行线性回归,可以将A/B测试从简单的通过/不通过检查,转变为细致的因果关系调查。
你的指标会感谢你的。