硬核干货|如何利用逻辑回归模型,实现用户增长?

网站运营 强烈建议 2024-02-28 07:57 88 0

  黄天文将用户增长分为三大流派,分别是市场营销派、实验增长派和技术派,下面简单介绍下这三大流派:

  1、市场营销派——做品牌和花钱买流量

  市场营销派做不好,叫流量获取,这活谁都能干,只要给钱就有量;做的好才叫用户增长,通过对渠道精细化运营来调控获客成本和质量。

  2、实验增长派——提出增长假设,做实验

  即,发现问题、提出想法、预期效果、测试、复盘,这5步称之为一个增长周期,不断循环这5步,致使数据达到增长目标。

  3、技术派——就是大家常说的“增长黑客”,运用技术套利,实现低成本增长。

  市场营销和实验增长派在之前的文章里已经介绍过(详见本人之前的文章《如何用更少的钱,带来更优质的量?| 渠道质量评估模型》和《没有护城河的流量池,用户来得快,流失更快》),所以今天就来个技术派跟大家分享一下。

  真正做到know your customer(不是反洗钱的KYC哦),要像个“跟踪狂”一样,跟踪用户的关键行为,这个用户看了首页、又看了视频页、看了13篇文章、分享了1篇文章、点击下单按钮了、最终购买了某件商品。

  从第一次启动APP到购买的整个过程,都是你监控的范围。甚至能通过购买前的一些行为,来预测用户的购买概率,从而推动成交量的增长。

  其实技术派的例子也是屡见不鲜:

  如网飞(Netflix)通过分析客户观看的电影和节目,发现凯文史派西参演的电影和政治题材的电视剧都非常受用户欢迎,所以才有的网飞制作电视剧《纸牌屋》;

  商务智能公司RJMetrics的团队发现,在使用其免费产品期间,用过软件编辑图表的用户与没用过此功能的用户相比,转化率高出一倍之多,随后每多使用一次,其购买的可能性就会提高。

  通过以上几个例子,大家可以知道,大体逻辑就是基于用户的行为,来判断用户另外一种行为的概率。纸牌屋的例子是通过用户的观看习惯,来推断新产品是否受欢迎。RJMetrics公司是通过购买前的某些行为,来判断用户是否购买产品。

  因此,我们就引出今天的主题:技术派是如何利用逻辑回归模型实现用户增长的——这也是增长三部曲的最后一部。

  虽然在当下,深度学习模型已经成为时尚,但逻辑回归仍然坚守在第一线,靠的就是其高时效性与高准确度性。许多银行和金融平台利用此模型预测借款人违约的概率,在金融领域都能站住脚,足以看出逻辑回归的江湖地位。

  很多运营同学听到逻辑回归模型都会大惊失色,觉得难度系数过高,所以下文提供了难易两条路线供大家参考。第一条是“懒人”路线,第二条是“挑战”路线。

  “懒人”路线就是按照下文的步骤,把需求提给技术,也就是建模的过程交给技术(别跟我说技术不会逻辑回归模型,只可能是你魅力不够~~),在技术的辅助下,将模型结果拿来用就OK,适合所有运营人士;

  “挑战”路线则是自己建模分析,有时候人不逼一下自己怎么能行呢!没准从此走上了用数据说话的道路,告别“数据神棍”。另外告诉大家一件事,数据运营比运营更来钱,运营的同学还在等什么,赶紧往数据转吧哈哈哈~~

  今天来跟大家分享的题目是,如何运用逻辑回归模型促成交,提高GMV。

  在做模型之前,确立自己的目标是什么?那就是让用户下单,重点放在没有下单的用户身上。如何去做?根据用户行为,构建模型,找出下单用户画像。之后呢?我们要做两件事。第一,引导没有下单但已经具备下单潜质的用户(预下单用户)下单。第二,引导用户成为预下单用户。

  选出你认为对下单有影响的变量,然后给到技术,让技术算法大神根据这些行为list(变量)和最后是否下单(因变量)做一个模型,并告诉你模型的可行性和筛选后剩下的变量。如下图:

  用户行为list图

  最后告诉你这个模型O不OK就搞定,OK就进入下一环节,不OK再继续改善模型,直到模型成功为止。

  有想挑战的同学,推荐的建模工具有SPSS和python,如果是初学者的话,建议使用SPSS,操作简单,不需要编程能力,网上有大量的逻辑回归模型的教学视频,快的一周,慢的一个月怎么也玩明白了。

  简单的说,逻辑回归模型其实就是:将历史用户在下单前或者未下单前的行为,放进模型中,模型会模拟出一个方程,之后我们根据方程套用到新的用户身上,来判断哪些用户下单的概率高,哪些行为对用户下单影响较大,最后根据模型来做后续的策略。

  下面我们就来简述一下建模过程。

  (1) 数据预处理

  如下图所示,红色的“是否下单”这一列是目标值,指的是历史用户最终是否下单;蓝色的各列是用户下单前的行为。

  下图可以这样解读,每一行就代表着用户从进入平台到下单(未下单)的全路径行为。

  样本数据图

  如上图所示,模型中分为两种变量,一种是连续变量,比如“浏览页面数”,是按照自然数统计的;另外一种是哑变量,比如“是否下单”,1代表下单,0代表未下单。

  到此为止样本数据都已经处理完成,接下来就把这些数据导入到模型中,模型会给出相应的反馈结果。

  (2) 检验模型

  不是把数据扔进模型后就完事了,还要看一下模型拟合优度,说白了就是模型能不能用。如下图

  模型评估

  这里只看步骤二红框里的几个数字就可以。

  第一个是-2对数拟然值,这个值越低越好,在100以下就算可以接受,1000以下嘛也将将可以。第二个就是卡方&显著性(Sig),卡方一般小于100,Sig<=0.05即可,说明模型当中的变量(用户行为)对下单有显著影响。

  看完这3个数,就证明模型拟合优度OK,可以使用。当然除了统计学外,也可以通过AUC值作为模型的评价标准。

  劳烦技术大神或算法大神把下单用户的行为告诉你,并且把倍数关系告诉你,如下图:

  倍数关系图

  上图的“是否注册”为2.909,表示注册的用户,其下单的概率是未注册用户的2.909倍,换而言之,注册比不注册下单率高了近3倍。

  再看 “生命周期”,生命周期长与生命周期短的比值0.998,说明生命周期越长,下单的概率越小。

  至此第二阶段就已经完成了,开始进入第三阶段,模型应用篇。

  将上面(一)中的数据输入到模型中,待模型通过检验后,反馈给我们的数据,就是今天的重点。

  模型方程变量图

  上图的B代表逻辑回归的系数,SE为标准误,Wald是Wald卡方值,df为自由度,Sig是显著程度,Exp(B)代表概率。

  模型采用的是向后Wald法,筛选变量,步骤1中,模型发现是否“完成任务”对下单影响不显著,所以在步骤2时,剔除掉此变量,留下的变量都是Sig<0.05的显著变量。

  通过B值构建逻辑回归模型:

  1.069是否注册+0.93浏览新闻视频数+0.06APP停留时长+0.076主页停留时长+0.052启动次数+0.004浏览页面数+0.194看过页面A+0.767看过成交页-0.02生命周期-3.571

  通过Sig我们可以知道:

  当Sig<0.05时,该变量十分显著,经过筛选(步骤2),这些变量的Sig全部小于0.05,说明我们选取的行为对下单的影响是非常显著的。

  通过EXP(B)我们可以得到的结论是:

  有过该行为的用户是没有该行为用户下单率的倍数。以“是否注册”为例,在其他变量不变的情况下,注册用户的下单概率是非注册用户的2.909倍。看过页面A的用户是没看过页面A用户的1.214倍。

  模型结果解读后,是不是觉得有很多东西值得我们去做的,模型虽好但若不能落地等于没做,还是那句老话,不能将数据分析落地执行的业务需求都是耍流氓,所以我们这就开始讲解模型的应用场景。

  这一步开始“懒人”路线和“挑战”路线就合并了,我也终于从“精神分裂模式”回归成一个人了,不论是运营还是数据运营都可以完成本章内容,这一章可千万别懒了。

  下面列举几个应用场景,供大家参考。

  应用场景一 模型触达用户

  触达可以分为两种,全自动触达和半自动触达:

  (1)全自动触达:

  通过上述回归模型,在程序内可以将每一个用户的下单概率算出来,筛选出下单概率高的用户,自动触发短信、PUSH或者红包。

  (2)半自动触达:

  半自动指的是我们并不用上述模型计算概率的方法选择触达用户,而是将模型输出的行为(变量)倍数关系作为参考,手动去选择行为的阈值,这样做可能会比全自动化计算出来的用户多一点,在预算不吃紧的情况下可以用这种方式进行触达。如下图红框所示:

  半自动阈值图

  应用场景二 产品化即时弹窗

  当用户满足上面提到的行为时,自动触发弹窗,引导用户下单。

  这种方法其实要比场景一的转化率高很多,因为触达短信属于后置动作,用户在收到短信时,可能已经错过最好转化时机。而自动弹窗,会在用户意愿值最高时,及时提醒并转化。

  这种产品化弹窗并不少见,比如腾讯的和平精英游戏,会在你获得胜利(吃鸡)时,弹出窗口,提醒你去应用商店给游戏打分。这样做不仅能够提高用户评分率,还能保证好评率,是一种经典的产品运营方式。

  应用场景三 产品化调整

  通过模型我们知道提高下单转化的三个重点指标依次为注册、看过页面A和看过成交页。

  那么我们从产品层面,要做一些调整,比如通过强制注册或者调小注册页的跳过按钮来提高注册率;调整成交页的下单按钮的大小、位置和颜色;改变页面A的入口深度,让用户更容易进入该页等等;不要小看这些操作,比如下图,将注册页由表单形式改成分布式,注册率就能提升7%,如下图所示:

  产品改动提升注册率图

  总而言之,我们通过改动产品,带动重点指标增长,从而提高下单转化率,是一种“曲线救国”的方法。

  模型的拓展主要分为两个方面,自身优化和横向拓展。自身优化主要是针对下单模型如何进一步优化,提高准确度;横向拓展是将模型套用到其他业务上,不光下单可以使用该模型,用户留存、UGC互动行为等都可套用。

  至此,整个逻辑回归模型流程已经介绍完毕,后续还有多种分析方法以及策略,在这里只是抛砖引玉,就不多赘述了。

  今天讲的逻辑回归模型可能有些硬核,其实模型原理很简单,就是根据用户的行为,去推断用户另一种行为的概率。逻辑回归模型是一线机器学习工程师最爱模型,并非浪得虚名,熟练掌握此模型会对业务有非常大的帮助。

  最后,我们就把今天分析的过程捋一捋:

  模型流程图

  (1)确定增长目标

  (2)用户行为数据准备

  (3)模型调试

  (4)模型结果解读

  (5)模型的应用(产品层、技术层、运营层)

  今天给大家介绍的技术派用户增长之逻辑回归模型就到这里了,这也是用户增长三大流派中最难的一种,但也并非可遇不可求,相信自己。

本站资源均来自互联网或会员发布,如果不小心侵犯了您的权益请与我们联系。我们将立即删除!谢谢!