本文由作者 七牛 发布于社区
分类是人类大脑的识别模式,分类是化繁为简的方法之一。
——张小龙
随着商品经济的发展,社会分工越来越细,产品的生产制造也从统一化供给逐渐发展到个性化供给。
互联网产品更是千人千面,将用户分为多种类型分别服务,可谓是因地制宜、因势利导、因材施教、量体裁衣。
在用户细分、精细化运营中也会遇到一些常规问题:
- 不进行“量体裁衣”,没有差异化,拉新难
- “量体裁衣”不合理,需求难满足,留存难
那么,我们该怎么进行合理的用户细分呢?
两千年前,书是竹简做的,能读到书的已是王公贵族,识字的人极少,如何把佛法传到家家户户呢?不同地域、部落、贫富、文化的群体,精神需求和接受程度不同,所以需要采用不同的方式。
中国境内佛教就演化了八大宗派分支,各派传教风格迥异。每个宗派内对不同心性的人也采用不同的方法:与上上等人,思辨哲学,探索世间真理;与上等人,清心寡欲,生活处处是修行;与中等人,讨论公案,引申明理;与下等人,以天堂诱之地狱吓之,引导行善。
企业之于用户更是如此了。
用户细分是企业为了实现用户需求的异质性、并集中有限资源进行有效市场竞争的行为。企业在明确的战略业务模式和特定的市场中,根据用户的属性,行为等因素对用户进行分类,并提供有针对性的产品、服务、销售、运营模式,达到用户价值和产品目标的最大化。
系统实施层面,是在抽象理论的指导下,用算法进行标签化统计、分类,并以用户画像的形式表现,最后在策略上、界面上、运营方式上进行“量体裁衣”。
从哪些角度、维度进行用户细分呢?
如何用算法进行标签化统计与分类?
如何验证用户细分的合理性并调整?
首先,用户是什么?
我们常常听说这样的对话:
- 你们公司的学生用户有多少?500万个。
- 用户有三类:发视频的、看视频的、投广告的。
- 在这个场景下,不同用户的认知、需求不同呀!
仔细一想,口语对话中用户的含义是模糊的:
- 第一句,用户其实指的是车主的注册ID数量。
- 第二句,用户其实指的是产品中存在的角色。
- 第三句,用户其实指的是某一类需求的集合。
很明显,前两句是口语上偷懒的、简化的表达,第三句中所含的意义 “ 用户是需求的集合 ” 更为确切。
清晰了对用户的定义,接下来,我们看看互联网公司常用的6种分类模型:
1、《梁宁·产品思维》
根据商业模式中的主要角色分类:
举个例子:
大众点评上的新店霸王餐。大众点评与新开的商家合作推出霸王餐,其大部分分配给用户等级高、活跃度高、经典评论多的头羊,头羊免费享用之后做出点评,吸引大明羊、小闲羊、笨笨羊来消费。
2、《UCPM-产品管理知识体系》
用户在某个场景中,产生感受和需求,到寻找方案、挑选产品、购买产品、使用产品、最后进行售后的整个周期中,将用户分为5类:
- 购买者:执行购买行为并主要关心价格
- 使用者:使用产品并首先考虑产品的性能
- 影响者:为决定的产生提供指导的群体
- 信息管理者:控制信息流向并与他人联络
- 决策者:正式批准购买决定并关心决定的内部政策部分
举个例子:
- 早幼教育产品。决策者、购买者、信息管理者、影响者是家长,使用者是学生;
- 小学教育产品。决策者、购买者是家长,使用者是学生,信息管理者、影响者是家长和学生一起;
- 企业服务产品。一个办公软件的购买要通过采购部的货比三家、财务部的预算、使用员工的意见、专人的管理维护、高层的决策。
3、《用户体验要素》
根据对产品的熟悉程度分为:
- 小白用户:刚使用或不经常使用,对产品不熟悉。
- 普通用户:占用大多数,对产品使用情况良好。
- 专家用户:对产品依赖程度高,能提出很多观点意见,是产品的有力支持者。
如此分法以便于分析:
- 同一人群,在A/B/C场景下,分别遇到什么问题
- 同一场景,a/b/c三个人群,分别遇到什么问题
4、《商业模式新生代》
根据用户需求的范围、用户与用户间的关系分为:
- 大众市场:服务于一个庞大的、有着广泛的相似需求的用户群体。如淘宝、拼多多、抖音等。
- 小众市场:服务于一个具体的、专门的、需求量身打造的用户群体。如花瓣网服务于设计师。
- 求同存异的用户群体:服务于有着相似却不同需求的多个细分用户群。如炒股APP服务于韭菜、独立经济人、操盘手。
- 多元化的用户群体:服务于不同需求的用户群体。如同一个CRM产品,可以私有化部署,可以公有云部署,可以混合云部署。
- 多边平台(多边市场):服务于两个或更多的相互独立又依存的用户群体。如o2o外卖,服务于点外卖的人、送外卖的人、商家、广告买主。
5、《交互设计精髓》
根据界面的设计目标分为:
- 主要人物:一个产品的一个界面只能有一个主要人物模型。
- 次要人物:存在一些额外的特定需求,可以在不削弱产品能力,以服务主要人物的前提下得以满足。
- 补充人物:主要人物和次要人物结合在一起完全可以代表补充人物的需求,一个界面可以用任意多个补充人物相联系。
- 客户人物:是客户而不是终端用户的需求,一些客户人物的界面可能会成为自己独有的管理界面的主要人物。
- 接受服务人物:并非产品的用户,却直接受产品使用的影响。
- 负面人物:用于告知产品不会为某类具体的用户服务,即不是产品的实际用户。
举个例子:
2B产品中,某类用户在日常使用中真正高频关心的数据、高频使用的功能其实并不多。将这些重点的数据和功能放在系统首页、模块首页、功能首页,让用户仅使用少数几个功能就完成大部分的日常工作,便是极致的用户体验。
6、RFM模型
RFM模型是衡量客户价值和客户创利能力的重要工具和手段。广泛应用于众多的CRM产品的用户分析上。主要以三项指标——“最近一次消费距当前的天数、累计消费次数、累计消费金额”来描述客户的价值状况,可分为8类:
这6种模型适用于PM的不同的工作场景,是已经成型的、常规的、粗略的分类模型,但对面市场上的产品越来越垂直化的趋势,公用的细分模型使用效果有所折扣。
所以,越来越多的产品也逐渐从更多细致的维度分类,笔者阅览行业多数文章,结合工作实践,整理总结,可归纳为五个维度:
细化了维度,怎么量化?技术怎么实现?用户如何表现呢?
标签是什么?
标签是用来标志你的产品目标、分类、内容的,是给你的目标确定一个关键词,是便于查找和定位的工具。
用户标签分哪些类型?
从更新频率可以分为:静态标签、动态标签;从开发方式分为:统计类标签、规则类标签、算法类标签(又称:基础标签、模型标签、预测标签);从标签来源分为:系统自动打的、开发商运营打的、用户自己打的。
用户画像是什么?
从上一小节分类模型可以看出,有些模型比较感性,好像可以看到一个真实的人,有些模型比较理性,好像看到的是一堆标签数据。是的,用户画像目前是分两类:User Persona 和 User Profile。
User Persona 是产品设计、运营人员从用户群体中抽象出来的典型用户。一般来自于用户访谈、用户研究,帮助我们去感性的认识当前的产品所主要服务的用户是一些什么类型的人。
User Profile 是基于用户在产品中的真实数据,产出描述用户的标签的集合。是偏理性的数据表现。一般用于产品具体的产品设计、决策依据、运营营销、风险预测、信用评估、个性化推荐等过程。如第一小节最后呈现的五个维度的表格。
User Persona 和 User Profile是一体两面,具有同一性、统一性,在实际应用中要结合业务及场景相互对照使用。
本节主要总结User Profile的实现方式,产品结构如下:
实施步骤可分三步:
1、确定画像维度
- 根据业务场景挖掘真实用户的虚拟代表:User Persona
- 根据User Persona 确定系统中User Profile的标签维度、层级关系、标签类型、标签值、初步的标签规则
2、建立数据处理模型
- 标签权重:标签在某一业务指标中的权重
- 更新频率:实时更新、离线T+1更新、单次计算
- 标签统计规则:如7天点外卖>2次属于中等活跃
- 标签算法:TF-IDF权重归类算法、相似矩阵算法、LAP传播算法...
用户标签权重 = 行为类型权重 × 时间衰减系数 × 用户行为次数 × TF-IDF计算标签权重
1)行为类型权重:
用户浏览、搜索、收藏、下单、购买等不同行为对用户而言有着不同的重要性,一般而言操作复杂度越高的行为权重越大。该权重值一般由运营人员或数据分析人员主观给出。
2)时间衰减系数:
用户某些行为受时间影响不断减弱,行为时间距现在越远,该行为对用户当前来说的意义越小。
这里应用了牛顿冷却定律数学模型。指的是一个较热的物体在一个温度比这个物体低的环境下,这个较热的物体的温度是要降低的,周围的物体温度要上升,最后物体的温度和周围的温度达到平衡,在这个平衡的过程中,较热物体的温度F(t)是随着时间t的增长而呈现指数型衰减,其温度衰减公式为:F(t)=初始温度×exp(-冷却系数×间隔的时间) 。
对应在用户标签随时间的影响上,冷却系数相当于标签权重随时间衰减的系数。公式:λ=-ln(dN/dt)/T=-ln(当前值/初始值)/间隔时间
3)用户行为次数:
用户标签权重按周期统计,用户在周期内与该标签产生的行为次数越多,该标签对用户的影响越大。
4)TF-IDF计算标签权重:
标签的重要性随着它在用户中被标记的次数成正比增加,但同时会随着它在标签库中出现的频率成反比下降;
w(P , T)表示一个标签T被用于标记用户P的次数。
TF(P , T)表示这个标记次数在用户P所有标签中所占的比重,TF越大,标签越重要;
相应的IDF(P , T)表示标签T在全部标签中的稀缺程度,即这个标签的出现几率,IDF越大,标签越不重要。然后根据TF * IDF即可得到该用户该标签的权重值。
公式如下:
(分母+1是防止分母为0)
举个例子:
- TF(用户P1,标签T1)=5/(5+2+1+0)=0.625
- IDF(用户,标签T1)=log(5/(2+1))=0.222
- TD-IDF=0.625*0.222=0.139
3、数据采集,数据处理,生成User Profile分类
将业务数据、日志数据、埋点数据、第三方数据带入数据处理模型中,生成User Profile。
该图片来自网络
举个例子:
疫情期间大家都在家里蹲,待久了就会无聊,众多社交平台相继出现了不法分子通过Luo聊Zha骗男性的案件,区县及社区政府也频繁发短信提醒居民。那么,作为陌生人的交友平台,如何找到这些不法分子呢?
第一步、确认画像维度
1)根据场景挖掘User Persona
2)再确定系统中User Profile的标签
第二步、建立数据处理模型
1)标签权重:
- a、行为类型权重:人为判定、排序、给出权重值
- b、时间衰减系数:按公式计算
- c、用户行为次数:周期计数
- d、TF-IDF计算权重:按公式计算
2)更新频率:实时更新
3)标签统计规则:标签值中所述规则
4)标签算法:TF-IDF权重归类算法、决策树分类算法、神经网络、KNN分类、SVM...
第三步、数据采集,数据处理,生成分类
1)模型建好之后,可以导入样本数据,进行模拟,将果聊诈骗分子的账号全部找出来。
2)可采用多种算法同时分类,观测各自结果,综合比较,最后择优使用。
当User Profile确定之后,
- User Profile与User Persona的差距如何?
- User Persona与真实用户情况间差距如何?
- User Profile与真实用户情况间差距如何?
1、回归分析
延续上一小节的例子,可分两大步:
- 对比判定情况和实际情况,得到四类结果
- 用召回率、准确率、精准率评估,数值越大越好
召回率(Recall):R=TP /(TP+FN)
即(正确识别的不法分子数)/(正确识别不法分子与正常用户数)
准确率(Accuracy):ACC=(TP+TN)/(TP+TN+FP+FN)
即(判定正确的数)/(所有判定的数)
精确率(Precision):P=TP /(TP+FP)
即(正确识别的不法分子数)/(系统识别出的不法分子数)
基本上仅用召回率(R)和准确率(ACC)就可以评估策略的好坏,并进行优化调整了。