【IT168 评论】在企业走向数据驱动的过程中,BI是重要的组成部分。而国内不少BI厂商都提供从数据仓库到报表的一站式解决方案,能够提供数据仓库某种程度上体现了厂商的技术实力。不少企业也选择搭建数据仓库将数据统一归集方便企业更好调用数据释放数据价值,但数据仓库实施周期长投入高的特点也让一些企业望而却步,那么数据仓库是企业的必须吗?
数据仓库非企业所必须
帆软是国内知名的BI厂商,专注BI十四年,可以提供从数据仓库到报表、大屏可视化的一站式BI解决方案。帆软数据应用研究院院长杨扬介绍在帆软合作的客户中,包括大的企事业单位在内的大部分客户都没有搭建数据仓库。数据仓库比较重,而且实施周期长,在长实施周期内领导不易发现数据仓库对日常经营管理带来的价值。很多企业会选择搭建一个简单的ODS层、主数据或者中间库,结合前端业务一个小版块比如财务先用起来,有效果再逐步拓展到其它业务。
“当前的这种数据仓库,很多时候还面临一个比较大的问题,就是会被各个业务条线的绩效考核牵引,会导致数据仓库面临大量的调整,所以说是不是要建数据仓库我们可以做一个保留,但是做数据加工整理、聚合整理是有必要的。”杨扬强调,面向主题的数据仓库数据本身是冗余的,大量的调整容易会导致数据口径出错,影响数据使用,所以数据仓库应该拒绝前端交互行为,都是通过ETL抽取数据。比如有些企业会想要通过帆软的填报修改数据仓库的数据,其实会对数据仓库的数据质量带来很多的挑战,
若企业不搭建数据仓库,有的会选择某个业务板块或者主题建中间库等,杨扬介绍选主题容易走入误区,有的企业做了一堆主题分析,结果这个主题分析对业务或者对企业的管理经营没什么太大帮助,这样反而造成负担。如果企业选主题分析可以从以下两点考虑选取:
一是从上向下做,选择高层关注的主题,需要选主题分析的企业一般想在投入产出上快速看到效果,所以第一个考虑满足企业高层的需求,选择企业内部比较关注的点。比如零售企业会选门店盘点,银行会做一些存款产品的分析等,这样高层可能会持续地推动项目,使之不断迭代完善。
二是从下向上做,要把一线基层的KPI以可视化的方式能够让让一线员工能看到,这样员工也会去推动项目不断完善。
不少人认为国内数据底子薄弱体现在数据积累参差不齐,有从业者会指出“都没有建数据仓库”来表达这种薄弱,与国外相比国内企业的整体数字化程度确实存在差距,而适合国情的产品和解决方案才最合适。
杨扬认为对于国内BI厂商来说,国产化进程还会面临诸多难题和挑战。首先大数据方面的标准参差不齐,国内厂商在做产品规划时没有一个统一的导向和标准。其次,虽然国内产品可以满足大部分的数据分析和应用需求,但是一些前沿技术,比如AI+BI、数据挖掘等,还处于理论或者不成熟阶段。
数据标准参差不齐
数据的价值正在日益凸显,而市场进入数据资产化的标志是数据标准的大规模建立。多位大数据/BI专家认为数据标准的建立是企业走向数据驱动的关键,也是当下国内的一个亟待解决的难点。
实际上企业有痛点和诉求,制定数据标准的工作一直在进行着,如果数据统计口径不一样,在前端查看同样的指标,在不同系统会看到不同的结果。就如同有的叫“男人”,有的叫“man”,类似这样的差异可能不利于企业做查询分析、营收测算。“数据标准和数据仓库不一样,数据仓库更多的时候是在做数据的集合,数据标准更多的是在做数据标准的制定。比如编码规则、命名规则或者划分、分享,做什么接口等。”杨扬指出。
不同行业制定数据标准有自己的原则,数据标准制定的时候并不会考虑所有的数据,更多时候是把一些主数据或者很多系统都会用到的数据,比如客户信息或者做分析衡量都会用到的数据,去制定一些对应的数据标准。其中,金融业会把数据标准以其核心系统为准,然后其它边缘系统按照各自的业务主题来定。
其实很多大的企业会有数据标准管理委员会这样的部门,负责制定标准、搭建管理平台和制定行政管理规范。“从标准到管理平台做到管理规范这样一系列操作,它其实就相当于是在制定整个的一个数据标准。”杨扬指出,数据标准的核心点在于一套标准要用在多个板块上面,所以要有联通的板块一起进行设计,没必要追求一套标准适用所有,因为各个行业都有自身通用的一些标准,而这些通用标准只能解决最简单基础问题。
但是数据标准的规范有时候也会受到业务排斥,比如指标分为基础指标和派生指标。在实际运作过程中,数据标准对应的基础信息可能并不能解决业务的问题。所以有的时候业务部门还是比较抵触排斥梳理好的数据标准。
可见企业走向数据驱动并非易事,数据标准可以从企业内部外延到企业外的行业、政府等,大数据时代更多维全面的数据连接打通流转才能有全局的视角,释放数据更大的价值。有业内从业者指出企业内部数据整合打通比较容易,而外部数据由于标准不一等问题难以有真实性和健康度的保障。杨扬认为不论什么规模的企业,目前大部分企业内部数据都没有做到很好掌控,比如即使部署了很多IT系统,还是有很多数据流转在Excel里。“内部的数据相对好掌握可能更多是从数据获取的角度以及在这个具体的某个特定板块下用这个数据的角度看,企业整体把数据给管控起来还是比较困难的。”
AI及自助式BI的中国困境
很多人相信AI与BI的融合是未来,增强分析和智能预测是当下企业的一个关注点。在AI比较火热的时候帆软没有为之所动,继续聚焦BI。帆软认为随着BI智能化的发展,未来企业产品选型的参考重点还是以数据管理和数据分析为主。预计在2025年左右,中国的BI将迈入智能化阶段,而当下国内AI在BI的应用还是泡沫。
AI+BI的发展现状和趋势
杨扬指出,AI落地核心点是和企业组织机构的实际业务结合,目前AI上手难度大,技术思维重,同时企业实际业务标签、模型沉淀比较少,对于企事业单位的业务帮助不高,很容易变成一个空心球。当前BI的应用主要还是在内部经营层面,开始注重场景的闭环,比如零售企业做到库存周转率的提高、制造业高效设备巡检提升效率等,不足之处是很多经验还伴随着比较强的企业特性,比如零售里面在A客户的配货算法,到了B那边就不一定试用,同时很多企业也不愿意针对这些方法进行深度沟通,在整个交流范围上,还欠缺一些,需要不断去梳理标准。
现在最适合企业的是从经营目标出发,找到降本增效的方法,不管通过传统中间库+报表的方式还是通过模型+自助分析的模式,而企业最迫切需要的应该是两块:
1:BI结合实际业务场景提供对应的分析思路;
2:BI项目落地的同时,能够培养员工数据分析思维的学习途径,短期看项目,长期还是看人才。
除了AI和数据挖掘,自助式分析是当下BI的最主要趋势。无论是国外的Tableau还是国内的帆软等BI厂商都在强调自助式分析的重要性和价值,一方面可拖拉拽的灵活定制降低了使用门槛,业务人员可以直接上手释放更多数据价值,另一方面也减轻了IT人员的压力。
多位BI从业人员指出国内自助式分析还处于非常初级阶段,面临着很多困境,无法实现数据分析的自助。造成这种局面的因素有很多,数据文化和人才缺失是比较重要的原因。
杨扬认为造成自助式分析难以推动的主要原因是数据分析项目发起人和使用者间的冲突。企业引入数据分析有两个渠道,一是通过科技部门或者IT部门,二是通过业务部门。
IT部门以前做数据跟踪报表,每次业务提需求基本是上午提下午要,给IT部门很大压力,而IT部门引入数据分析的目的是减轻部门压力,可能会准备些基础数据,有些企业甚至会把明细表全部开放,让业务部门自己在前面去拖拽选取,如此压力就传导到业务部门。
如果业务部门引入自助分析,期望会很高。希望找某个数据的时候,调出来的数据就是所需的数据口径,而且数据准确的无误。但实际过程中业务部门要的不是基础数据,都是需要做进一步加工萃取汇算的派生数据,所以业务部门经常会说调取的数据和业务系统对不上。
IT部门与业务部门各自为战的情况并不少见,杨扬建议IT部门向前迈一步,在项目前期与业务交流,根据不同业务部门对接不同数据口径,业务部门再请IT人员做一些自定义的工具,业务部门要思考如何把这些数据应用到自己想要的场景里面去。他认为比较有效的破局之道是在IT和业务部门之间建立一个角色作为桥梁沟通协调,比如有的企业会设立首席数据官、数据运营官的职位,使各部门之间不再各自为战,形成合力。
企业未来3~5年BI功能需求
“不管做BI还是什么,切记的是搞个大工程。所有部门一起上,那像这样一种情况,其实成功率特别低,但是这个原因有很多种,不管是从业务的内心排斥角度,还是从企业的数据准备角度,以及他企业对这个事情的一个思想准备角度,都没有到位。”杨扬强调,国内BI有广阔的前景,如果追求一步到位往往适得其反,结合企业自身情况选用合适的BI产品和服务,才能不断向着数据驱动迈进。