【IT168 评论】人类对自然的探索起源于某一个不再畏惧火焰的原始人,但未来的终点会停留在哪里,恕我直言,恐怕那是上帝也曾不知道的秘密。所以,任何一个当下,都是承上启下的当下,我们每一位数据人,都是开启未来大门的人。
没错,我们是数据人,是带着历史使命应运而生的数据人。
就这一代数据人的使命,36大数据特意问了傅志华的看法:
“我个人认为现阶段最重要的使命是要让大数据在企业应用或者行业应用中发挥出价值,驱动行业的成长。为了实现这个使命,需要从业者要有数据信仰,要有长跑的心态,用恰到好处的方法去挖掘和洞察数据的价值,从而驱动企业或者行业成长,形成数据越用越好用,越用越想用多的良性循环。”
傅志华先生在互联网行业、产品与营销研究有十多年的经验,谙熟数据分析和数据挖掘方法,在数据产品化驱动企业数据化运营和营销方面有丰富的实践经验。傅志华先生曾为腾讯、艾瑞、易观、中国互联网协会等多处作为数据负责人,现为360公司数据中心副总经理。
大数据本身是个很“庞大”的行业,精细到各个工作职能,从事数据库、云计算、数据可视化、数据挖掘、DMP、广告精准投放、用户分析、数据架构、算法等等这些人都可以算是大数据行业的从业人员。但是在大数据行业,既懂大数据技术,又懂大数据与业务场景的结合,并有长期大量的项目案例实践经验,还能写得一手干货文章的人,寥寥无几。
作为36大数据最早的专栏作者,他的文章不偏不倚,完全就事论事,尤其是在大数据应用的洞察和应用方面堪称一绝。
傅志华,他就是这么一个“大熊猫”。
上榜理由:
1、大数据技术早期应用实验者
2、早期网络大数据资料的撰写者
3、在大数据业务场景应用耕耘颇深
以下为采访实录:
大数据实施的三个误区
36大数据:对于那些正在实施大数据战略的公司,您有什么建议给他们?有哪些误区是可以避免的?
傅志华:大数据实施往往陷入三个误区:
第一,业务部门没有清晰的大数据需求和规划。业务部门不知道大数据有什么用,更不知道具体在什么场景里能用到大数据;
第二,企业内部数据孤岛非常严重;
第三,组织架构未能有效支撑大数据实施
在大数据时代,企业如何更有效的实施大数据战略,如何规划、如何实施、如何保障大数据的相关工作可以顺利开展。
个人认为,企业要实时大数据战略,需要从五大关键方面规划:
1.制定大数据规划找准切入点;
2.强化大数据领导力设立CDO;
3.设计合理的大数据组织结构;
4.搭建富有执行力的大数据团队;
5.用制度和文化保障大数据实施。
其中,切入点即应用场景非常关键。先从结果出发,从应用场景来看,大数据能帮我做什么?这方面需要企业的领导人、业务的负责人和大数据专家三方去认真的探讨和规划。
我们需要基于企业的现状和企业未来两到三年的发展规划,在这个大框架下去研究,大数据在哪些应用上对企业的发展规划是有帮助的。
如何用数据分析用户生命周期,以及挽留用户?
36大数据:我们发现您很喜欢讲用户的生命周期,请您给36大数据的网友分享一下您对此的见解,以及如何挽回即将离开的客户。
傅志华:通过数据挖掘的手段进行用户生命周期管理,我们可以做到实时对不同生命周期的客户进行实时标记和预警。用户所处不同的生命周期需要做的事情是不一样的,我相信研究过生命周期管理的人都很清楚。用户潜伏期需要做潜在用户识别,发展期和成熟期要做关联交叉销售,成熟期还要做用户防流失。
以用户防流失为例,我们建议重点研究新用户的防流失,主要是因为新用户流失率一般较高,另外是挽回的可能性较大。以某付费应用为例,在用户即将付费前,用户的活跃行为是非常高的,付费以后它的活跃度继续增长,但是付费了一段时间以后,由于用户的产品体验和之前的预期差距越来越大(因为他原来付费的时候觉得这个东西非常好玩),也许他有一些产品的功能点没有体验到,他对这个产品的失落感越来越明显,活跃度就会下降,而这类用户往往流失倾向较高。这就是新用户阶段最常见的流失现象。
我观察了大量的应用和游戏,新用户磨合期的用户流失率比较高,常常是比成熟期的用户流失率还高。所以,用户防流失的重点常常是放在新手用户磨合阶段。
用户流失预警主要通过机器学习算法去建模实现。即用过去一段时间内已经发生的行为数据去建模,通过机器学习的方法识别流失用户的特征,一旦训练好的模型,我们可以通过模型去计算未来用户的流失概率。很多机器学习算法都可以实现此类模型的建模,诸如logistic回归、基于随机森林的决策树,以及最近比较流行的深度学习算法等等。
大数据与人工智能的关系
36大数据:前段时间亮相的360机器人小白,着实抓眼球,请问从您个人角度来看,是怎么看待大数据与人工智能的关系呢?
傅志华:未来人工智能的发展,取决于两个方面:
一方面是深度学习算法技术的成熟和计算效率的提升;另一方面取决于海量数据或大数据的发展。这是因为,深度学习算法如卷积神经网络要发挥作用必须先接受训练。
比如,机器要学会识别图片中的狗,必须先被输入一个包含数量上万或者数十万的标记为狗的 “训练集”,这个训练集数量越大,狗的种类越全,机器学习的效果越好。
互联网巨头除了自身业务可以采集到海量的数据以外,正在用更开放的策略吸引第三方的数据输入,以充实其大数据,更好的促进人工智能的所依赖的大数据基础。
人工智能专家吴恩达曾把人工智能比作火箭,其中深度学习是火箭的发动机,大数据是火箭的燃料,这两部分必须同时做好,才能顺利发射到太空中。因此,对于深度学习和人工智能,需要越来越多的数据。
如何搭建一个优秀的数据团队?
36大数据:大数据的实施和部署,离不开“人”这个重要因素。那么一个合理的大数据团队架构是什么样的呢?需要哪些人组成?
傅志华:个人认为,合理的组织架构应该是这样的:首先,设立公司级的中央数据部门,集中存储和管理数据;其次是每个事业部(或业务部门)设立数据团队;第三是在总办设立CDO的岗位。
这样的好处在于数据能够集中管理,数据贴近业务,可以很好的发挥数据的价值;同时,在总办(高管团队)设立CDO岗位,可以让数据更好的为决策层服务,数据分析所发现的商业价值也可以更快的应用于业务战略调整。
人才是大数据战略实施至关重要的方面,因此,设置符合大数据能力要求的团队显得尤为重要。如果组织缺乏合适的人才或能力,大数据战略实施的结果很可能会令人沮丧。因此,企业做好相应的人才规划,按照合理的规模和构成来建设人才库。
合理的大数据组织架构下,有两类数据团队,一类是各事业部中的数据团队;第二类是中央数据部门的数据团队。
上文提到两类团队其职责不同,因此,能力要求也不一样。事业部的数据团队能力要求是数据分析为主,招聘主要为数据分析师或者数据分析专家。而中央数据部门的数据能力要求较为复杂,包括六大方面的能力,即数据分析、用户研究、数据产品、算法工程(机器学习和深度学习)、数据统计和数据平台。