别再只会用t检验了！用Python的statsmodels库做单因素方差分析，5分钟搞定A/B测试结果解读

张

张建站

2026/5/11 12:32:32

10分钟阅读

别再只会用t检验了！用Python的statsmodels库做单因素方差分析，5分钟搞定A/B测试结果解读

用Python实现单因素方差分析A/B测试中的多组比较实战指南当产品经理同时测试三种新按钮颜色对转化率的影响时连续做了三次t检验对比各组差异——这个在互联网公司会议室里反复上演的场景实际上犯了一个统计学上的典型错误。就像用三把尺子测量同一张桌子的长度会得到三个不同结果一样多重t检验会导致误差累积让结论变得不可靠。而单因素方差分析ANOVA这把多功能量角器能一次性解决多组比较问题。1. 为什么A/B测试需要方差分析而非t检验假设某电商App同时测试首页三种商品布局瀑布流、网格、列表的点击率很多团队会本能地选择两两比较# 错误示范多重t检验 from scipy.stats import ttest_ind t1, p1 ttest_ind(waterfall_ctr, grid_ctr) # 瀑布流vs网格 t2, p2 ttest_ind(waterfall_ctr, list_ctr) # 瀑布流vs列表 t3, p3 ttest_ind(grid_ctr, list_ctr) # 网格vs列表这种做法的核心问题在于α错误膨胀Type I Error Inflation。当进行k次检验时总体错误概率变为P(至少一个错误) 1 - (1 - α)^k对于α0.05和k3的情况实际错误率高达14.3%。方差分析通过以下方式解决这个问题方法比较次数总体α风险适用场景独立t检验k(k-1)/2快速膨胀仅两组比较单因素ANOVA1次保持α水平三组及以上比较提示当ANOVA发现显著差异后还需要Tukey HSD等事后检验确定具体差异组别2. 数据准备与假设检验使用Python进行方差分析前需要确保数据满足三个基本假设正态性各组数据近似服从正态分布可用Shapiro-Wilk检验方差齐性组间方差无显著差异可用Levene检验独立性观测值相互独立通过实验设计保证以某在线教育平台测试三种学习路径A/B/C的完课率为例import pandas as pd from scipy import stats # 模拟数据集 data pd.DataFrame({ group: [A]*30 [B]*30 [C]*30, completion: list(np.random.normal(0.65, 0.1, 30)) # 组A list(np.random.normal(0.72, 0.1, 30)) # 组B list(np.random.normal(0.68, 0.1, 30)) # 组C }) # 正态性检验 for group in [A, B, C]: _, p stats.shapiro(data[data[group]group][completion]) print(f组{group}正态性p值: {p:.4f}) # 方差齐性检验 stat, p stats.levene( data[data[group]A][completion], data[data[group]B][completion], data[data[group]C][completion] ) print(f\nLevene检验p值: {p:.4f})当假设不满足时可考虑非参数替代方法如Kruskal-Wallis检验数据转换如对数变换增加样本量3. 使用statsmodels执行方差分析statsmodels提供了两种常用的ANOVA接口适用于不同数据格式方法一公式API推荐import statsmodels.api as sm from statsmodels.formula.api import ols model ols(completion ~ C(group), datadata).fit() anova_table sm.stats.anova_lm(model, typ2) print(anova_table)输出示例sum_sq df F PR(F) C(group) 0.078643 2.0 4.102908 0.019024 Residual 0.835800 87.0 NaN NaN关键指标解读F值组间变异与组内变异的比值越大越显著P值若小于显著性水平通常0.05拒绝原假设自由度组间(df1k-1)、组内(df2N-k)方法二数组接口from statsmodels.stats.anova import AnovaRM # 适用于重复测量设计 anova_rm AnovaRM(data, completion, user_id, within[group]) res anova_rm.fit() print(res.summary())4. 事后检验与业务解读当ANOVA结果显著时如P0.019需要进一步分析哪些组别存在差异。常用方法包括Tukey HSD控制整体错误率适合所有两两比较Bonferroni保守调整适合少量比较Dunnett专门用于与对照组的比较以Tukey HSD为例from statsmodels.stats.multicomp import pairwise_tukeyhsd tukey pairwise_tukeyhsd( endogdata[completion], groupsdata[group], alpha0.05 ) print(tukey.summary())输出示例Multiple Comparison of Means - Tukey HSD, FWER0.05 group1 group2 meandiff p-adj lower upper reject ------------------------------------------------- A B 0.0702 0.0176 0.008 0.1324 True A C 0.0298 0.3274 -0.032 0.0916 False B C -0.0404 0.1886 -0.102 0.0212 False -------------------------------------------------业务决策建议显著差异组B组完课率显著高于A组p0.018边缘显著组B与C差异接近显著p0.189建议扩大样本再测方案选择若追求完课率优先选择B方案若考虑成本可综合评估5. 完整案例广告素材效果测试某市场团队测试五种广告素材的点击率CTR数据格式如下material, ctr A, 0.042 A, 0.039 ... E, 0.057分析流程# 读取数据 ads pd.read_csv(ad_test.csv) # 可视化组间差异 import seaborn as sns sns.boxplot(xmaterial, yctr, dataads) plt.title(各广告素材CTR分布) # 方差分析 model ols(ctr ~ C(material), dataads).fit() anova_results sm.stats.anova_lm(model) print(anova_results) # 事后检验 tukey pairwise_tukeyhsd(ads[ctr], ads[material]) print(tukey.summary()) # 效应量计算 ss_between anova_results[sum_sq][0] ss_total ss_between anova_results[sum_sq][1] eta_squared ss_between / ss_total print(f\n效应量η²: {eta_squared:.3f})关键产出物应包括可视化图表各组均值与离散程度ANOVA表F值与P值结论多重比较结果具体差异组别效应量指标η²或ω²值业务建议最优方案及实施考虑在最近一次客户项目中我们发现虽然D素材CTR最高但与E素材无显著差异p0.062而E素材的制作成本低40%。最终推荐采用E方案每月节省创意成本约15万元。

LumenPnP真空系统架构：双喷嘴拾放技术深度解析

LumenPnP真空系统架构：双喷嘴拾放技术深度解析【免费下载链接】lumenpnp The LumenPnP is an open source pick and place machine. 项目地址: https://gitcode.com/gh_mirrors/lu/lumenpnp LumenPnP作为一款开源桌面贴片机，其真空系统是实现精准…...

2026/5/11 12:30:59 阅读更多 →

Keil命令行编译避坑指南：从.bat脚本到稳定构建的5个关键步骤

Keil命令行编译避坑指南：从.bat脚本到稳定构建的5个关键步骤当你在深夜赶项目进度，满心欢喜地双击那个精心编写的.bat脚本，却只看到命令行窗口一闪而过，或者更糟——弹出一堆你看不懂的错误信息。这不是个例，而是许多…...

2026/5/11 12:30:58 阅读更多 →

告别DTS？全志A40平台Fex配置实战：以TP触摸屏驱动为例

告别DTS？全志A40平台Fex配置实战：以TP触摸屏驱动为例在嵌入式开发领域，设备树（DTS）已成为主流SoC平台硬件描述的标准方案。然而当工程师初次接触全志A40这类平台时，往往会惊讶地发现：传统的.d…...

2026/5/11 12:30:25 阅读更多 →

CANN/ops-transformer FlashAttention V2

aclnnFlashAttentionScoreV2 【免费下载链接】ops-transformer 本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer 产品支持情况产品是否支持Ascend 950PR/Ascend 950DTAtlas A…...

2026/5/11 3:28:28 阅读更多 →