数据分析小白必看：从Excel到Python的3个实战案例（附数据集）

张

张建站

2026/4/16 20:14:16

10分钟阅读

数据分析小白必看从Excel到Python的3个实战案例附数据集数据分析正逐渐成为职场人士的必备技能。无论是市场调研、销售预测还是用户行为分析数据驱动的决策方式正在重塑各行各业的工作模式。但对于初学者来说最大的困扰往往是学了很多理论知识却不知道如何在实际工作中应用。本文将带你通过三个由浅入深的实战案例从Excel基础操作到Python简单分析逐步掌握数据分析的核心思维。1. 案例一Excel销售数据分析 - 从基础操作到数据透视1.1 数据准备与基础清洗我们以一个电商平台的季度销售数据为例数据集包含订单ID、日期、产品类别、销售额、利润等字段。首先需要掌握几个关键操作数据导入从CSV文件导入Excel注意选择正确的分隔符和编码格式数据清洗处理缺失值使用筛选功能找出空白单元格去除重复项数据→删除重复项格式统一确保日期列格式一致文本列无多余空格TRIM(A2) // 去除文本前后空格 IF(ISBLANK(B2),未知,B2) // 处理空值1.2 基础分析方法实战掌握几个常用函数组合能大幅提升分析效率分析目标公式示例说明季度总销售额SUM(D2:D1000)计算D列销售额总和最畅销产品INDEX(B2:B1000,MATCH(MAX(E2:E1000),E2:E1000,0))找出利润最高的产品月增长率(本月销售额-上月销售额)/上月销售额计算环比增长率提示使用条件格式可以快速识别异常值和高低点比如将高于平均值的销售额标记为绿色。1.3 数据透视表进阶技巧数据透视表是Excel最强大的分析工具之一。创建一个分析各产品类别季度表现的数据透视表插入→数据透视表将产品类别拖到行区域将销售额和利润拖到值区域将日期拖到列区域并分组为季度通过添加计算字段可以进一步分析利润率利润 / 销售额2. 案例二Excel到Python的过渡 - 客户分群分析2.1 为什么需要升级到Python当数据量超过10万行或者需要更复杂的分析时Excel会显得力不从心。Python提供了更强大的处理能力处理百万级数据不再卡顿自动化重复性分析流程实现更复杂的统计分析和机器学习模型2.2 环境准备与数据导入首先安装必要的Python库pip install pandas numpy matplotlib然后导入数据import pandas as pd df pd.read_csv(customer_data.csv) print(df.head()) # 查看前5行数据2.3 RFM客户分群实战RFM模型是经典的客户价值分析方法Recency最近购买时间计算客户最近一次购买距今天数Frequency购买频率统计客户历史订单数Monetary消费金额汇总客户总消费额# 计算RFM指标 now pd.to_datetime(2023-06-01) rfm df.groupby(customer_id).agg({ order_date: lambda x: (now - x.max()).days, order_id: count, amount: sum }) rfm.columns [recency, frequency, monetary]2.4 可视化分析结果使用matplotlib绘制散点矩阵图直观展示客户分布import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D fig plt.figure(figsize(10,8)) ax fig.add_subplot(111, projection3d) ax.scatter(rfm[recency], rfm[frequency], rfm[monetary]) ax.set_xlabel(Recency) ax.set_ylabel(Frequency) ax.set_zlabel(Monetary) plt.show()3. 案例三Python电商用户行为分析3.1 用户行为序列分析电商平台通常记录用户的点击、加购、下单等行为。我们可以分析用户的典型行为路径# 统计各行为类型占比 behavior_counts df[event_type].value_counts(normalizeTrue) # 绘制饼图 plt.pie(behavior_counts, labelsbehavior_counts.index, autopct%1.1f%%) plt.title(User Behavior Distribution) plt.show()3.2 转化漏斗分析构建从浏览→加购→下单的转化漏斗funnel_steps [view, add_to_cart, purchase] funnel_counts [] for step in funnel_steps: funnel_counts.append(df[df[event_type]step][user_id].nunique()) # 计算转化率 conversion_rates [funnel_counts[i1]/funnel_counts[i] for i in range(len(funnel_counts)-1)]3.3 用户留存分析7日留存是衡量产品粘性的重要指标# 计算首次活跃日期 first_active df.groupby(user_id)[date].min().reset_index() first_active.columns [user_id, first_active_date] # 标记7日内回访用户 df pd.merge(df, first_active, onuser_id) df[date] pd.to_datetime(df[date]) df[first_active_date] pd.to_datetime(df[first_active_date]) df[days_since_first] (df[date] - df[first_active_date]).dt.days retention df[(df[days_since_first] 7)].groupby(user_id)[days_since_first].nunique().reset_index() retention[retained] retention[days_since_first] 1 retention_rate retention[retained].mean()4. 从工具使用到分析思维的跨越4.1 数据分析的通用流程无论使用Excel还是Python优秀的数据分析都应遵循以下步骤明确问题清晰定义要解决的业务问题数据收集获取相关数据了解数据局限性数据清洗处理缺失值、异常值和格式问题探索分析通过统计和可视化发现模式建模分析应用适当的统计或机器学习方法结果解释将技术结果转化为业务语言建议行动基于分析提出可执行的建议4.2 避免常见分析误区相关不等于因果冰淇淋销量与溺水事件同时增加不代表有直接关系忽略数据偏差只分析活跃用户会忽略沉默用户的需求过度依赖工具工具只是手段业务理解才是核心追求复杂模型有时简单的平均值比复杂的神经网络更实用4.3 持续提升的建议定期分析真实业务数据哪怕只是个人消费记录参与Kaggle等数据分析竞赛建立自己的代码片段库和分析模板多与业务人员交流理解数据背后的故事注意所有案例数据集和完整代码已打包可在文末链接下载。建议先按照步骤重现分析再尝试应用到自己的业务场景中。

SAP MASS批量修改库存仓位实战：Excel导入避坑指南（附模板）

SAP MASS批量修改库存仓位实战：Excel导入避坑指南（附模板） 对于每天需要处理大量库存数据的企业来说，单个修改物料仓位就像用勺子舀干游泳池的水——效率低下且令人崩溃。这正是SAP MASS工具大显身手的时候。本文将带您深入掌握这…...

2026/4/16 20:09:28 阅读更多 →

Go：深入理解 go mod vendor 的离线编译实践

1. 为什么需要离线编译？ 在Go项目开发中，依赖管理一直是个绕不开的话题。记得我刚接触Go时，最头疼的就是项目编译时突然报错，提示某个依赖包下载失败。特别是在一些特殊环境下——比如公司内网的CI/CD服务器、客户现场的无网络环境…...

2026/4/16 20:08:01 阅读更多 →

RT-Thread BSP制作避坑指南：从Kconfig配置到SCons脚本的完整实战（STM32平台）

RT-Thread BSP制作深度实战：从Kconfig到SCons的STM32避坑手册在嵌入式开发领域，RT-Thread以其模块化设计和丰富的中间件支持赢得了众多开发者的青睐。但当我们真正开始为特定硬件定制BSP时，往往会遇到各种"暗坑"——从Kconfig配置…...

2026/4/16 19:59:13 阅读更多 →

HagiCode Desktop 混合分发架构解析：如何用 PP 加速大文件下载籽

一、Actor 模型：不是并发技巧，而是领域单元 Actor 模型的本质是： Actor 是独立运行的实体 Actor 之间只通过消息交互 Actor 内部状态不可被外部直接访问 Actor 自行决定如何处理收到的消息 Actor 模型真正解决的是： 如何在不共享状…...

2026/4/16 0:30:59 阅读更多 →

从数据采集到回放验证：ADTF 适配 ROS 的 ADAS 测试实践饺

一、简化查询 1. 先看一下查询的例子 /// /// 账户获取服务 /// /// /// public class AccountGetService(AccountTable table, IShadowBuilder builder) {private readonly SqlSource _source new(builder.DataSource);private readonly IParamQuery _accountQuery build…...

2026/4/15 6:20:42 阅读更多 →