【IT168 评论】十一黄金周刚结束,或者各位还沉浸在假期出游的惬意中不愿面对这个事实。没错,本周还将上演“工作七天乐”。不知大家是否注意到,今年黄金周大数据展示出惊人的力量。企业纷纷用大数据的力量为消费者提供服务。数据能力的PK赛正式拉开帷幕…
蓄谋已久?说走就走?数据在说话
假期虽然结束,但各大景区早已赚的满满。尽管景区已陷入人海,但依然阻挡不了人们的热情。中国旅游研究院、携程旅行网发布的《2016“十一”旅游趋势报告与人气排行榜》透露,今年国庆黄金周期间,国内旅游市场预计接待5.89亿人次,预计出境游人次将接近600万。
根据某旅游平台数据抽样调查分析,得出结论:
1、国庆假期全国旅游市场火爆,旅游人次、收入大幅增长
2、80后、90后、70后成为国庆出游人群主力
3、女性比男性出游意愿更强
4、假期旅游高峰出现在3日、4日
5、除北上广深之外,重庆、武汉、成都成为主要客源输出地
6、杭州旅游持续“发烧”,三亚、昆明旅游市场开始升温
7、出境游方面,日本、韩国、泰国、越南等周边国家仍然受国内游客的的追捧
提供决策的数据依据可信吗?
大数据基于云计算的数据处理与应用模式,使其能被撷取、管理和处理,并为决策提供依据。因此大数据应用热潮掀起,大数据似乎被赋予了神能量,好像可以解决一切。通过今年黄金周数据公司多个数据报告,小编发现有趣的是各家数据竟然还有些出入…
两份最权威的预测报告,百度的《2016十一出行预测大数据报告》和阿里的《十一出行预测大数据报告》。可以看到,两份报告的数据预测大的方向基本是一致的,但是一些细节上存在一定差异。比如说对于热门景点的预测和出行状况的预测。
根据百度《报告》的数据,统计出了全国热门景区景点TOP20,数据显示最受欢迎的是杭州西湖风景区,其次是北京的奥林匹克公园,排名前五的分别是西湖风景区、奥林匹克公园、外滩、天安门和五台山风景名胜区。而阿里《报告》的数据,则给出了与百度不同的预测。据阿里《报告》的数据显示,杭州西湖、北京颐和园和成都的宽窄巷子会成为人数最多的景点。排名前五的分别是杭州西湖、北京颐和园、成都宽窄巷子、嘉兴乌镇和丽江古城。除了业内知名的杭州西湖,其他的数据两份报告有明显差异。
对于出行状况的预测两者也有一定差异。根据百度《报告》的数据,十一出行时间将会呈现规律性的集中现象。假期头尾两天均十分拥堵,假期中间时段路况相对较好。细化到具体时间节点,10月1日8时和10月7日16时的道路拥堵程度最高。而在阿里的《报告》中,假期堵车的预测时间则被提前到了9月30日,据阿里《报告》显示:9月30日的平均下班时间将提前2个半小时,即从15:00开始进入晚高峰状态,并一直持续到19:00,两者的数据呈现明显差异。当然,我们现在并不是在比较两份数据谁更为准确,因为根据十一期间的真实数据我们会发现,两份预测数据都存在一定的偏差,而且纠结于一份过去的数据并没有太大的意义。
数据报告带来的启发
是什么原因导致了两份数据的差异?这主要是不同的数据报告其数据来源不同所导致的结果。百度的数据是来自于百度地图与旗下的各类O2O软件的数据录入,而阿里的数据则主要是来自是自己庞大的阿里O2O系与滴滴日常收录的乘车信息;易到用车的数据则主要来自于其会员的用车出行数据;携程旅游的数据来源则主要是其平台上会员的旅游订单数据。
以上的几份报告所获得的大数据都并不是全面的,基于他们用户总量不足的原因,他们皆无法获得足够全面的数据。我们都知道,数据量的增加有助于减小数据的误差,可以大大地提高分析的精准度。尽管我们一直说着大数据,但是我们其实并不能得到真正的海量的大数据。因此,抽样是不可避免的。而且这不仅仅是观测不到总体数据的问题,即时能够,我们也并不能去观测数据总体。
同时,归纳演绎法能总结一般规律,却对偶然事件无能。一起突发交通事故就可能造成大数据无法预料的蝴蝶效应,引发大规模的拥堵。这种事故不可预测,其后果也很难提前预知,在国庆节这样的大车流的情况下,一起这样的偶然事件足以推翻大数据的预测。
总结
面对大数据,我们要保持冷静,不能神话大数据。大数据不是功能较多的,它只是基于现实数据进行的分析,可以供参考,但参考价值不该被无限放大。总之,大数据应用只是工具,可用不可尽信。