惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

博客园 - 司徒正美
大猫的无限游戏
大猫的无限游戏
Scott Helme
Scott Helme
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
S
Secure Thoughts
Google DeepMind News
Google DeepMind News
博客园_首页
Hacker News: Ask HN
Hacker News: Ask HN
量子位
Jina AI
Jina AI
I
InfoQ
V
V2EX
Martin Fowler
Martin Fowler
Y
Y Combinator Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
人人都是产品经理
人人都是产品经理
B
Blog
IT之家
IT之家
云风的 BLOG
云风的 BLOG
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
博客园 - Franky
博客园 - 【当耐特】
N
Netflix TechBlog - Medium
Cloudbric
Cloudbric
H
Heimdal Security Blog
TaoSecurity Blog
TaoSecurity Blog
S
Security @ Cisco Blogs
U
Unit 42
Project Zero
Project Zero
Webroot Blog
Webroot Blog
The Register - Security
The Register - Security
N
News | PayPal Newsroom
Microsoft Security Blog
Microsoft Security Blog
H
Help Net Security
Forbes - Security
Forbes - Security
宝玉的分享
宝玉的分享
Last Week in AI
Last Week in AI
C
Check Point Blog
博客园 - 聂微东
M
MIT News - Artificial intelligence
有赞技术团队
有赞技术团队
D
DataBreaches.Net
Cyberwarzone
Cyberwarzone
N
News and Events Feed by Topic
N
News and Events Feed by Topic
Simon Willison's Weblog
Simon Willison's Weblog
J
Java Code Geeks
G
Google Developers Blog
GbyAI
GbyAI
T
Threatpost

少数派

派早报:Google 发布 Fitbit Air 等 - 少数派 「新人报到」確認需求,再開始 - 少数派 从 SOLO 独立开发者社区,我看到了越来越多开发者开始做自己的产品 - 少数派 我怎么管理那些"不常做,但总会忘"的生活事项 - 少数派 人形机器人量产元年,数据才是具身智能的“生死线” - 少数派 BuhoLaunchpad 高度还原 Mac 启动台:开发历程与思考 - 少数派 五年陪伴依然不舍,DIY 换壳后让罗技 MX Master 3 继续服役 - 少数派 新玩意 240|少数派的编辑们最近买了啥? - 少数派 一日一技|为什么你应该关闭 iOS 的键盘声音 - 少数派 我做了个插件和 Skills,一键提取任何网站的设计规范 Design.md - 少数派 住在三四线城市的你,该开始录播客了 - 少数派 甘南秘境,大白高国 - 少数派 AI的审美:谁让把我变成川内倫子 - 少数派 返工怎能不烦恼,打工人片单总有一部是你的「嘴替」 - 少数派 为了让「上厕所」更健康,我做了一个小工具 - 少数派 AI + Skill,能够让生成的文章去除 AI 味吗? - 少数派 新玩意|韶音OpenDots ONE 耳夹式耳机 - 少数派 《美满》| 在每一个春天的晚上相爱(362) - 少数派 新玩意|优篮子 PS01 MagSnap 磁吸支架 - 少数派 自我整合手记 | 我开始早睡了:用稳定规则,为自由托底 - 少数派 用龙虾(OpenClaw)两个多月,我最深的12个体会 - 少数派 听歌时间到,12 张你可能错过的 2025 华语乐坛好专辑 - 少数派 承诺能追吗 - 少数派 macOS 26启动台没了? 我做了个不一样的App启动器 - Keboard - 少数派 《四海为家的人》| INTJ对话INTJ(361) - 少数派 你发过的那些黑历史,是时候一次清干净了 - 少数派 新玩意:安安静静玩,越玩越专注:计客密码机 - 少数派 iPad 用户首次体验 Android 平板:vivo Pad6 Pro - 少数派 数据逻辑强 - 少数派 极北行+ | 一路向北,探访日本至北之地 | 001 - 少数派 万字剖析:千问App深度体验报告(2026) - 少数派 在2026年,如何真正防止别人抄袭你的作品 - 少数派 怎么用 50 块搭个 AI 语音助手?我踩了 3 天坑 - 少数派 YeeroAI:让 AI 对话真正成为知识管理的一部分 - 少数派 爬泰山 - 少数派 「旅图显影」 App 更新:这次,我们补上了一点「手感」 - 少数派 假期出门太折磨?我的 23 条经验帮你规划惬意旅行 - 少数派 工作流会变吗 - 少数派 Claude Opus 4.6 怎么用最省钱?我测了 5 种方案 - 少数派 GPT Image 2 让图文并茂不再稀罕 - 少数派 用户侧出发——什么是AI,我要不要学习? - 少数派 找片、转存、整理、播放一条龙!让你的付费网盘值回票价 - 少数派 欢迎试用!日课一问2.0插件 - 少数派 自己做的MDeditor,原本想购买 Typora 试了两次支付不成功,干脆自己做一个 - 少数派 vibe coding了一个 3MB 的小工具,让 ~/Downloads 彻底告别混乱 - 少数派 因为受不了 Mac 的风扇策略,我做了一个风扇控制工具 - 少数派 别只怪模型 - 少数派 Warp 终端的 AI 功能怎么用?我测了一周的体验 - 少数派 AI 写代码老是出 bug?这 5 个配置我后悔没早知道 - 少数派 「新玩意」苹果出相机可能就这样:Sigma BF + 45mm F2.8 DG Contemporary - 少数派 一个面向2030年的AI操作系统是什么样子的:浅谈cola这款有灵魂的Agent - 少数派 别只看写代码 - 少数派 每天解决10个问题,还是一口气攻坚解决400个? - 少数派 AI 交易机器人怎么搭?我用 Claude 跑了一周实盘 - 少数派 Maptoposter Online:把你爱的城市画成艺术海报 - 少数派 Function Calling 怎么用?我测了 3 个模型发现差距真大 - 少数派 Legend Talk:我做了个 AI 圆桌,让 160 位思想家围着你的问题转 - 少数派 如何找到自己的蓝方?在小县城寻找压力测试 - 少数派 语音输入与软件接口|2026年聊AI时,我们都聊些什么(上) - 少数派 混动已经卖爆,纯电又来补刀——钛7闪充版简直“不讲武德” - 少数派 本月玩什么|朋友收藏、识质存在、沙罗周期 - 少数派 为什么要每天坚持输出? - 少数派 Claude API 挂了好几个小时,你的项目有备用方案吗? - 少数派 Function Calling 没你想的复杂——我用它做了个有点用的工具 - 少数派 登录系统立即播放视频或者图片音乐的软件 - 少数派 我为什么创建 FlipHTML5 下载工具 - 少数派 残局没电?多品牌外设电量统一管理软件EasyBluetooth已支持RTSS游戏内显示以及AIDA64 - 少数派 前往通义路的路 - 少数派 太好看了,媲美Sun的个人导航页,NAS部署星云门户 - 少数派 乌黑嘴唇“一键检测”上线了 - 少数派 派早报:Claude AI 接入多个创意软件生态、FILCO 生产方接手品牌等 - 少数派 【更新】BearCLI、Claude 连接器与 MCP 服务器 - 少数派 记了上千条流水,还是看不懂财务?我做了一个让 AI 读懂账本的工作台 - 少数派 MINI R56 升级原厂 Sport 模式 - 少数派 新玩意 | 一棵柠檬树(仿真版) - 少数派 Momenta的“物理AI”野望,需迈过“含摩量”这道关 - 少数派 网页直接投屏控制手机!NAS一键部署PandaScrcpy,流畅丝滑可远程。 - 少数派 众测|邀你一同探索随身 AI 硬件入口 YoooClaw C·ONE - 少数派 2050大会:分享时间是真诚 参会记 - 少数派 iPad 赋能电影创作:国内首部宣纸手绘长片《燃比娃》的幕后故事 - 少数派 AI的审美:我用 8 个大模型给 100 张旅行照片打分 - 少数派 普通人如何破圈?去参加一个本地协会 - 少数派 把极空间的图标全换了,主题DIY全攻略打造你的专属NAS桌面 - 少数派 电子便签墙,帮你实现便签自由 - 少数派 我如何用三个 CLI 工具取代文档创建需求 - 少数派 原来真的有人可以玩一辈子 - 少数派 社区速递 139 | 派友热议三月买了啥、复古单反尼康 Df 体验 - 少数派 06 作品的赏析与评价 - 少数派 TDS REVIEW|索尼 WF-1000XM6 降噪真无线耳机体验 - 少数派 35.98万起售的第二代腾势D9,我看重的不是堆料,而是不凑合 - 少数派 鼠须管 Squirrel 皮肤配置指北 - 少数派 从watch ultra2换到redmi watch6 - 少数派 派早报:阿里巴巴发布视频生成模型 HappyHorse 1.0 等 - 少数派 别迷信1M - 少数派 家人们天塌了!网盘“大封杀”,多个渠道多条路,NAS部署PanHub - 少数派 AI与人勾心斗角!NAS一键部署AI狼人杀,假日休闲必备。 - 少数派 电商必备!Comfyui工作流批量生图插件,一次生成12张!支持Nano banana pro模型 - 少数派 Comfyui工作流配置Gpt-image-2模型教程,0.03/张 - 少数派 OpenClaw第三方APi怎么配置?可使用Gpt-image-2模型 - 少数派 会员社区话题精选 Ep. 103 - 少数派
一文讲清数据分析的核心内容与思路 - 少数派
2024-07-05 · via 少数派

本文简单梳理一下数据分析的基本内容,概括来说就是:2个目的+6个步骤+6个方法+8个思路+8个模型。

先分享一套数据可视化模板,涵盖各大核心业务和行业场景,点击即可免费下载:数据分析可视化全套模板

一、2个目的

举个例子,某电商双十一跟着淘宝做了一个大促活动,事后想了解活动的效果,于是找到了小王。 于是,小王开始收集数据、处理数据、建立模型、制作报表。最终得出结论:活动期间UV上涨了50%,订单增长了40%,销售额提高了45%云云。

这叫做据分析吗?当然不,因为小王根本没有找到数据分析的目的,只是单纯的统计数据而已。没有目的,自然也就不会有结论,而这两者是数据分析最关键的两点。

再举个例子,该商家感觉最近销售量有点低,想做个分析看看是什么原因。 于是小王结合平台的流量数据,订单数据、用户数据,采用聚类分析、主成分分析、相关行分析等分析挖掘手段。发现男性群体的销售量明显下滑,需要提高对这类人群的引流。

这叫做数据分析吗?是。那么数据分析成功了吗?并没有。

这次小王知道了问题是什么,还用了很多算法,但是没有做目的性的引导,是分析失败的主要问题。业务不了解数据,数据不了解业务,这种衔接矛盾常常存在。

总结来看,数据分析的目的是整个研究方案的起点,决定着后续研究的内容,数据的来源,使用的方法,其目的无非就是两个:

分析现状和过去——有问题了,通过数据分析寻找原因,制定决策

预测未来——有新项目、产品、方案要上线,或企业制定大决断,需要数据分析结论做辅助参考

数据分析的目的往往不是那么明确,只是有个大致的方向,这个有时候业务员和领导也没有办法。所以做数据分析时要抖点机灵。

比如让你做一个用户行为分析,出一个研究方案。你一定要知道这并不是真正的需求。你需要与领导再沟通,了解他做用户行为到底是要解决什么问题,摆脱什么困境?如果领导是因为觉得客户流失率太高,想留住客户,那分析方案就应该围绕用户满意度去展开,分析的价值在于研究找到用户不满意的点,并针对这些问题提出改进建议。

二、6个步骤

1、明确分析的目的,提出问题。只有弄清楚了分析的目的是什么,才能准确定位分析因子,提出有价值的问题,提供清晰的指引方向。

2、数据采集。收集原始数据,数据来源可能是丰富多样的,一般有数据库、互联网、市场调查等。具体办法可以通过加入“埋点”代码或者使用第三方的数据统计工具。

3、数据处理。对收集到的原始数据进行数据加工,主要包括数据清洗、数据分组、数据检索、数据抽取等处理方法。

4、数据探索。通过探索式分析检验假设值的形成方式,在数据之中发现新的特征,对整个数据集有个全面认识,以便后续选择何种分析策略。

5、分析数据。数据整理完毕,就要对数据进行综合分析和相关分析,需要对产品、业务、技术等了如指掌才行,常常用到分类、聚合等数据挖掘算法。Excel是最简单的数据分析工具,专业数据分析工具有FineBI、Python等。

FineBI下载地址:https://s.fanruan.com/8vbwj

6、得到可视化结果。借助可视化数据,能有效直观地表述想要呈现的信息、观点和建议,比如金字塔图、矩阵图、漏斗图、帕累托图等,同时也可以使用报告等形式与他人交流。

三、6个方法

1、PEST分析法

PEST,也就是政治(Politics)、经济(Economy)、社会(Society)、技术(Technology),能从各个方面把握宏观环境的现状及变化趋势,主要用户行业分析。

宏观环境又称一般环境,是指影响一切行业和企业的各种宏观力量。

对宏观环境因素作分析时,由于不同行业和企业有其自身特点和经营需要,分析的具体内容会有差异,但一般都应对政治、经济、技术、社会,这四大类影响企业的主要外部环境因素进行分析。

政治环境:政治体制、经济体制、财政政策、税收政策、产业政策、投资政策等。

社会环境:人口规模、性别比例、年龄结构、生活力式、购买习惯、城市特点等。

技术环境:折旧和报废速度、技术更新速度、技术传播速度、技术商品化速度等。

经济环境:GDP 及增长率、进出口总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可支配收入、失业率、劳动生产率等。

2、5W2H分析法

5W2H,即为什么(Why)、什么事(What)、谁(Who)、什么时候(When)、什么地方(Where)、如何做(How)、什么价格(How much),主要用于用户行为分析、业务问题专题分析、营销活动等。

该分析方法又称为七何分析法,是一个非常简单、方便又实用的工具,以用户购买行为为例:

Why:用户为什么要买?产品的吸引点在哪里?

What:产品提供的功能是什么?

Who:用户群体是什么?这个群体的特点是什么?

When:购买频次是多少?

Where:产品在哪里最受欢迎?在哪里卖出去?

How:用户怎么购买?购买方式什么?

How much:用户购买的成本是多少?时间成本是多少?

3、SWOT分析法

SWOT分析法也叫态势分析法,S (strengths)是优势、W (weaknesses)是劣势,O (opportunities)是机会、T (threats)是威胁或风险。

SWOT分析法是用来确定企业自身的内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析。

运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而将公司的战略与公司内部资源、外部环境有机地结合起来。

4、4P营销理论

4P即产品(Product)、价格(Price)、渠道(Place)、推广(Promotion),在营销领域,这种以市场为导向的营销组合理论,被企业应用最普遍。

可以说企业的一切营销动作都是在围绕着4P理论进行,也就是将:产品、价格、渠道、推广。通过将四者的结合、协调发展,从而提高企业的市场份额,达到最终获利的目的。

产品:从市场营销的角度来看,产品是指能够提供给市场,被入们使用和消费并满足人们某种需要的任何东西,包括有形产品、服务、人员、组织、观念或它们的组合。

价格:是指顾客购买产品时的价格,包括基本价格、折扣价格、支付期限等。影响定价的主要因素有三个:需求、成本与竞争。

渠道:是指产品从生产企业流转到用户手上全过程中所经历的各个环节。

促销:是指企业通过销售行为的改变来刺激用户消费,以短期的行为(比如让利、买一送一,营销现场气氛等等)促成消费的增长,吸引其他品牌的用户或导致提前消费来促进销售的增长。广告、宣传推广、人员推销、销售促进是一个机构促销组合的四大要素。

5、逻辑树法

逻辑树又称问题树、演绎树或分解树等。它是把一个已知问题当成“主干”,然后开始考虑这个问题和哪些相关问题有关,也就是“分支”。逻辑树能保证解决问题的过程的完整性,它能将工作细分为便于操作的任务,确定各部分的优先顺序,明确地把责任落实到个人。

逻辑树的使用必须遵循以下三个原则:

要素化:把相同的问题总结归纳成要素。

框架化:将各个要素组织成框架。遵守不重不漏的原则。

关联化:框架内的各要素保持必要的相互关系,简单而不独立。

6、AARRR模型

AARRR模型是所有运营人员都要了解的一个数据模型,从整个用户生命周期入手,包括获取(Acquisition)、激活(Activition)、留存(Retention)、变现(Revenue)和传播(Refer)。

每个环节分别对应生命周期的5个重要过程,即从获取用户,到提升活跃度,提升留存率,并获取收入,直至最后形成病毒式传播。

四、8个思路

1、趋势分析

最简单、最常见的数据分析方法,一般用于核心指标的长期跟踪,比如点击率、GMV、活跃用户数。可以看出数据有那些趋势上的变化,有没有周期性,有没有拐点等,继而分析原因。

2、多维分解

也就是通过不同的维度对于数据进行分解,以获取更加精细的数据洞察。举个例子,对网站维护进行数据分析,可以拆分出地区、访问来源、设备、浏览器等等维度。

3、用户分群

针对符合某种特定行为或背景信息的用户,进行特定的优化和分析,将多维度和多指标作为分群条件,有针对性地优化供应链,提升供应链稳定性。

4、漏斗分析

按照已知的转化路径,借助漏斗模型分析总体和每一步的转化情况。例如将漏斗图用于网站关键路径的转化率分析,不仅能显示用户的最终转化率,同时还可以展示每一节点的转化率。

5、留存分析

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。衡量留存的常见指标有次日留存率、7日留存率、30日留存率等。

6、A/B 测试

A/B测试是为了达到一个目标,采取了两套方案,通过实验观察两组方案的数据效果,判断两组方案的好坏,需要选择合理的分组样本、监测数据指标、事后数据分析和不同方案评估。

7、对比分析

分为横向对比(跟自己比)和纵向对比(跟别人比),常见的对比应用有A/B test,A/B test的关键就是保证两组中只有一个单一变量,其他条件保持一致。

8、交叉分析

交叉分析法就是将对比分析从多个维度进行交叉展现,进行多角度的结合分析,从中发现最为相关的维度来探索数据变化的原因。

五、8个模型

1、用户模型

“不仅要知道用户当下在想什么,更要知道用户背后在想什么,以及用户正在经历着什么。”

传统用户模型构建方式

用户模型:基于对用户的访谈和观察等研究结果建立,严谨可靠但费时;

临时用户模型:基于行业专家或市场调查数据对用户的理解建立,快速但容易有偏颇。(缺乏时间,资源的情况下)

为了节省时间,降低风险,产品团队往往尽快将产品推向用户,快速试错,在这种场景下如何构造用户模型?

首先,整理和收集已经获得的任何可认知用户的经验和数据,将这些信息映射成为用户的描述信息(属性)或用户的行为信息,并存储起来形成用户档案,

实时关注自身数据的波动,及时采取行动

记录用户的行为数据而不是单纯地为用户打标签

360°覆盖用户全生命周期的用户档案

用户的每一步成长都通过行为记录下来,基于用户所在生命周期的不同阶段,针对新用户、流失用户、活跃用户、沉默用户分别采取有针对性的拉新、转化、留存等运营策略。

2、事件模型

事件是什么?

就是用户在产品上的行为,它是用户行为的一个专业描述,用户在产品上的所有获得的程序反馈都可以抽象为事件,由开发人员通过埋点进行采集,通俗讲就是:将一段代码放入对应的页面/按钮,用户进入页面/点击按钮的本质是在加载背后的代码,同时再加载事件采集代码,这样就被SDK所记录下来了。

事件的采集?

事件:用户在产品上的行为

属性:描述事件的维度

值:属性的内容

事件的分析?

人数:某一事件(行为)有多少人触发了

次数:某一事件(行为)触发了多少次

人均次数:某一事件(行为)平均触发多少次

活跃比:在一个时间区间内,触发某一事件的人数占当前时间段内所有活跃人数的比

事件的管理?

当事件很多时,可以对事件进行分门别类地管理。同时,可以从产品业务角度将重要的用户行为标注出来,以便可以在分析时方便、快捷地查找常用、重要的事件。

3、漏斗模型

漏斗模型帮助你分析一个多步骤过程中每一步的转化与流失情况。

举例来说,用户下载产品的完整流程可能包含以下步骤:

我们可以将如上流程设置为一个漏斗,分析整体的转化情况,以及每一步具体的转化率和转化中位时间

我们需要将按照流程操作的用户进行各个转化层级上的监控,寻找每个层级的可优化点;

对没有按照流程操作的用户绘制他们的转化路径,找到可提升用户体验,缩短路径的空间。

更好的利用漏斗模型:

细化每一个环节,展示到点击之间?点击到下载之间?下载到安装之间?安装到体验之间?

拥有埋点意识和全局观念,才能够有效采集,为每个环节的漏斗优化做出决策依据,推动各个部门优化

4、热图分析模型

按计算维度划分,热图可以分为点击热图和浏览热图。

点击热图:追踪的是鼠标的点击情况,进行人数、次数统计并基于百分比进行热力分布,点击热图又分为两种,一种是鼠标的所有点击,一种是页面可点击元素的点击。前者可以追踪页面上所有可点击和不可点击位置的被点击情况,后者只追踪页面上可点击元素的点击情况。

浏览热图(也称注意力热图)记录的是用户在不同页面或同一页面不同位置停留时间的百分比计算,基于停留时长。

应用场景

落地页效果分析

首页流量追踪

关键页体验衡量

5、自定义留存分析模型

定义:满足某个条件的用户,在某个时间点有没有进行回访行为

公式:若满足某个条件的用户数为n,在某个时间点进行回访行为的用户数为m,那么该时间点的留存率就是m/n

N-day留存,即第几日留存,只计算第N天完成回访行为的用户

Unbounded留存(N天内留存),留存会累计计算N天内所有完成过回访行为的用户。

-Bracket留存 (自定义观察期留存)N-day留存和Unbounded留存都是按照独立的天/周/月为观察单位计算,但有时候我们不希望受限于这种固定时间度量,我们希望划分为几个观察期

6、粘性分析

定义:对活跃用户使用产品的习惯的分析,例如一个月使用了几天,使用大于一天,大于七天的用户有多少,例如某些产品上线了新功能,用户使用需要签到,可以由此分析出用户的使用习惯,评估新功能的吸引力和健康度。

作用:使用留存分析,了解产品和功能黏住用户的能力如何,用户喜欢哪个功能,不同用户在同一功能在适用上的差异,有助于科学评估产品,制定留存策略

举例:股票APP,已投资用户和未投资的用户触发功能【查看股票市场】的次数

7、全行为路径分析

行为路径分析分为漏斗分析和全行为路径分析。与漏斗分析模型不同,漏斗分析模型是分析既定的行为转化,例如电商产品,分析从查看产品详情到最终支付每一步的转化率。而全行为路径分析是对用户在APP或网站的每个模块的流转情况,挖掘用户的访问模式,从而优化产品或网站

一般可用树形图表现,如下图,一个线上培训网站,用户大都会打开搜索课程,所以需要优化搜索课程。而在第一次搜索课程后,用户并没有搜索到想要的课程,又进行了第二次搜索,因此可以将用户搜索频率高的关键词设置成可点击元素,链接到用户使用频率高的相关课程。引导用户点击得到想要的结果

8、用户分群模型

分群是对某一特征用户的划分和归组,而分层,更多的是对全量用户的一个管理手段,细分用户的方法其实我们一直在用,比如我们熟悉的RFM模型:

RFM模型是从用户的业务数据中提取了三个特征维度:最近一次消费时间(Recency)、消费频率 (Frequency)、消费金额 (Monetary)。通过这三个维度将用户有效地细分为8个具有不同用户价值及应对策略的群体,如下图所示。

另外四个用户分群的维度:

  • 属性:用户客观的属性,描述用户真实人口属性的标签,比如:年龄、性别、城市、浏览器版本、系统版本、操作版本、渠道来源等就是用户属性
  • 活跃时间
  • 做过,没做过
  • 新增于:何时新增用户较多