硬核干货｜如何利用逻辑回归模型，实现用户增长？

网站运营强烈建议 2024-02-28 07:57 384 0

　　黄天文将用户增长分为三大流派，分别是市场营销派、实验增长派和技术派，下面简单介绍下这三大流派：

　　1、市场营销派——做品牌和花钱买流量

　　市场营销派做不好，叫流量获取，这活谁都能干，只要给钱就有量；做的好才叫用户增长，通过对渠道精细化运营来调控获客成本和质量。

　　2、实验增长派——提出增长假设，做实验

　　即，发现问题、提出想法、预期效果、测试、复盘，这5步称之为一个增长周期，不断循环这5步，致使数据达到增长目标。

　　3、技术派——就是大家常说的“增长黑客”，运用技术套利，实现低成本增长。

　　市场营销和实验增长派在之前的文章里已经介绍过（详见本人之前的文章《如何用更少的钱,带来更优质的量？| 渠道质量评估模型》和《没有护城河的流量池，用户来得快，流失更快》），所以今天就来个技术派跟大家分享一下。

　　真正做到know your customer（不是反洗钱的KYC哦），要像个“跟踪狂”一样，跟踪用户的关键行为，这个用户看了首页、又看了视频页、看了13篇文章、分享了1篇文章、点击下单按钮了、最终购买了某件商品。

　　从第一次启动APP到购买的整个过程，都是你监控的范围。甚至能通过购买前的一些行为，来预测用户的购买概率，从而推动成交量的增长。

　　其实技术派的例子也是屡见不鲜：

　　如网飞（Netflix）通过分析客户观看的电影和节目，发现凯文史派西参演的电影和政治题材的电视剧都非常受用户欢迎，所以才有的网飞制作电视剧《纸牌屋》；

　　商务智能公司RJMetrics的团队发现，在使用其免费产品期间，用过软件编辑图表的用户与没用过此功能的用户相比，转化率高出一倍之多，随后每多使用一次，其购买的可能性就会提高。

　　通过以上几个例子，大家可以知道，大体逻辑就是基于用户的行为，来判断用户另外一种行为的概率。纸牌屋的例子是通过用户的观看习惯，来推断新产品是否受欢迎。RJMetrics公司是通过购买前的某些行为，来判断用户是否购买产品。

　　因此，我们就引出今天的主题：技术派是如何利用逻辑回归模型实现用户增长的——这也是增长三部曲的最后一部。

　　虽然在当下，深度学习模型已经成为时尚，但逻辑回归仍然坚守在第一线，靠的就是其高时效性与高准确度性。许多银行和金融平台利用此模型预测借款人违约的概率，在金融领域都能站住脚，足以看出逻辑回归的江湖地位。

　　很多运营同学听到逻辑回归模型都会大惊失色，觉得难度系数过高，所以下文提供了难易两条路线供大家参考。第一条是“懒人”路线，第二条是“挑战”路线。

　　“懒人”路线就是按照下文的步骤，把需求提给技术，也就是建模的过程交给技术（别跟我说技术不会逻辑回归模型，只可能是你魅力不够~~），在技术的辅助下，将模型结果拿来用就OK，适合所有运营人士；

　　“挑战”路线则是自己建模分析，有时候人不逼一下自己怎么能行呢！没准从此走上了用数据说话的道路，告别“数据神棍”。另外告诉大家一件事，数据运营比运营更来钱，运营的同学还在等什么，赶紧往数据转吧哈哈哈~~

　　今天来跟大家分享的题目是，如何运用逻辑回归模型促成交，提高GMV。

　　在做模型之前，确立自己的目标是什么？那就是让用户下单，重点放在没有下单的用户身上。如何去做？根据用户行为，构建模型，找出下单用户画像。之后呢？我们要做两件事。第一，引导没有下单但已经具备下单潜质的用户（预下单用户）下单。第二，引导用户成为预下单用户。

　　选出你认为对下单有影响的变量，然后给到技术，让技术算法大神根据这些行为list（变量）和最后是否下单（因变量）做一个模型，并告诉你模型的可行性和筛选后剩下的变量。如下图：

　　用户行为list图

　　最后告诉你这个模型O不OK就搞定，OK就进入下一环节，不OK再继续改善模型，直到模型成功为止。

　　有想挑战的同学，推荐的建模工具有SPSS和python，如果是初学者的话，建议使用SPSS，操作简单，不需要编程能力，网上有大量的逻辑回归模型的教学视频，快的一周，慢的一个月怎么也玩明白了。

　　简单的说，逻辑回归模型其实就是：将历史用户在下单前或者未下单前的行为，放进模型中，模型会模拟出一个方程，之后我们根据方程套用到新的用户身上，来判断哪些用户下单的概率高，哪些行为对用户下单影响较大，最后根据模型来做后续的策略。

　　下面我们就来简述一下建模过程。

　　（1）数据预处理

　　如下图所示，红色的“是否下单”这一列是目标值，指的是历史用户最终是否下单；蓝色的各列是用户下单前的行为。

　　下图可以这样解读，每一行就代表着用户从进入平台到下单（未下单）的全路径行为。

　　样本数据图

　　如上图所示，模型中分为两种变量，一种是连续变量，比如“浏览页面数”，是按照自然数统计的；另外一种是哑变量，比如“是否下单”，1代表下单，0代表未下单。

　　到此为止样本数据都已经处理完成，接下来就把这些数据导入到模型中，模型会给出相应的反馈结果。

　　（2）检验模型

　　不是把数据扔进模型后就完事了，还要看一下模型拟合优度，说白了就是模型能不能用。如下图

　　模型评估

　　这里只看步骤二红框里的几个数字就可以。

　　第一个是-2对数拟然值，这个值越低越好，在100以下就算可以接受，1000以下嘛也将将可以。第二个就是卡方&显著性（Sig），卡方一般小于100，Sig<=0.05即可，说明模型当中的变量（用户行为）对下单有显著影响。

　　看完这3个数，就证明模型拟合优度OK，可以使用。当然除了统计学外，也可以通过AUC值作为模型的评价标准。

　　劳烦技术大神或算法大神把下单用户的行为告诉你，并且把倍数关系告诉你，如下图：

　　倍数关系图

　　上图的“是否注册”为2.909，表示注册的用户，其下单的概率是未注册用户的2.909倍，换而言之，注册比不注册下单率高了近3倍。

　　再看 “生命周期”，生命周期长与生命周期短的比值0.998，说明生命周期越长，下单的概率越小。

　　至此第二阶段就已经完成了，开始进入第三阶段，模型应用篇。

　　将上面（一）中的数据输入到模型中，待模型通过检验后，反馈给我们的数据，就是今天的重点。

　　模型方程变量图

　　上图的B代表逻辑回归的系数，SE为标准误，Wald是Wald卡方值，df为自由度，Sig是显著程度，Exp（B）代表概率。

　　模型采用的是向后Wald法，筛选变量，步骤1中，模型发现是否“完成任务”对下单影响不显著，所以在步骤2时，剔除掉此变量，留下的变量都是Sig<0.05的显著变量。

　　通过B值构建逻辑回归模型：

　　1.069是否注册+0.93浏览新闻视频数+0.06APP停留时长+0.076主页停留时长+0.052启动次数+0.004浏览页面数+0.194看过页面A+0.767看过成交页-0.02生命周期-3.571

　　通过Sig我们可以知道：

　　当Sig<0.05时，该变量十分显著，经过筛选（步骤2），这些变量的Sig全部小于0.05，说明我们选取的行为对下单的影响是非常显著的。

　　通过EXP（B）我们可以得到的结论是：

　　有过该行为的用户是没有该行为用户下单率的倍数。以“是否注册”为例，在其他变量不变的情况下，注册用户的下单概率是非注册用户的2.909倍。看过页面A的用户是没看过页面A用户的1.214倍。

　　模型结果解读后，是不是觉得有很多东西值得我们去做的，模型虽好但若不能落地等于没做，还是那句老话，不能将数据分析落地执行的业务需求都是耍流氓，所以我们这就开始讲解模型的应用场景。

　　这一步开始“懒人”路线和“挑战”路线就合并了，我也终于从“精神分裂模式”回归成一个人了，不论是运营还是数据运营都可以完成本章内容，这一章可千万别懒了。

　　下面列举几个应用场景，供大家参考。

　　应用场景一模型触达用户

　　触达可以分为两种，全自动触达和半自动触达：

　　（1）全自动触达：

　　通过上述回归模型，在程序内可以将每一个用户的下单概率算出来，筛选出下单概率高的用户，自动触发短信、PUSH或者红包。

　　（2）半自动触达：

　　半自动指的是我们并不用上述模型计算概率的方法选择触达用户，而是将模型输出的行为（变量）倍数关系作为参考，手动去选择行为的阈值，这样做可能会比全自动化计算出来的用户多一点，在预算不吃紧的情况下可以用这种方式进行触达。如下图红框所示：

　　半自动阈值图

　　应用场景二产品化即时弹窗

　　当用户满足上面提到的行为时，自动触发弹窗，引导用户下单。

　　这种方法其实要比场景一的转化率高很多，因为触达短信属于后置动作，用户在收到短信时，可能已经错过最好转化时机。而自动弹窗，会在用户意愿值最高时，及时提醒并转化。

　　这种产品化弹窗并不少见，比如腾讯的和平精英游戏，会在你获得胜利（吃鸡）时，弹出窗口，提醒你去应用商店给游戏打分。这样做不仅能够提高用户评分率，还能保证好评率，是一种经典的产品运营方式。

　　应用场景三产品化调整

　　通过模型我们知道提高下单转化的三个重点指标依次为注册、看过页面A和看过成交页。

　　那么我们从产品层面，要做一些调整，比如通过强制注册或者调小注册页的跳过按钮来提高注册率；调整成交页的下单按钮的大小、位置和颜色；改变页面A的入口深度，让用户更容易进入该页等等；不要小看这些操作，比如下图，将注册页由表单形式改成分布式，注册率就能提升7%，如下图所示：

　　产品改动提升注册率图

　　总而言之，我们通过改动产品，带动重点指标增长，从而提高下单转化率，是一种“曲线救国”的方法。

　　模型的拓展主要分为两个方面，自身优化和横向拓展。自身优化主要是针对下单模型如何进一步优化，提高准确度；横向拓展是将模型套用到其他业务上，不光下单可以使用该模型，用户留存、UGC互动行为等都可套用。

　　至此，整个逻辑回归模型流程已经介绍完毕，后续还有多种分析方法以及策略，在这里只是抛砖引玉，就不多赘述了。

　　今天讲的逻辑回归模型可能有些硬核，其实模型原理很简单，就是根据用户的行为，去推断用户另一种行为的概率。逻辑回归模型是一线机器学习工程师最爱模型，并非浪得虚名，熟练掌握此模型会对业务有非常大的帮助。

　　最后，我们就把今天分析的过程捋一捋：

　　模型流程图

　　（1）确定增长目标

　　（2）用户行为数据准备

　　（3）模型调试

　　（4）模型结果解读

　　（5）模型的应用（产品层、技术层、运营层）

　　今天给大家介绍的技术派用户增长之逻辑回归模型就到这里了，这也是用户增长三大流派中最难的一种，但也并非可遇不可求，相信自己。

本站资源均来自互联网或会员发布，如果不小心侵犯了您的权益请与我们联系。我们将立即删除！谢谢！

硬核干货｜如何利用逻辑回归模型，实现用户增长？

热门文章

最近发表

标签列表

硬核干货｜如何利用逻辑回归模型，实现用户增长？

相关文章

热门文章

最近发表

标签列表