大数据频道 频道

七夕节,大数据如何成功花式虐狗

  【IT168 评论】七夕已至,情侣街头花式虐狗大赛盛大开幕,小编已经有了躲在家里吹空调吃西瓜的充分觉悟,奈何还是没能躲过单身狗被虐的惨剧。今年,不只是情侣要虐狗,连大数据都要虐狗了,还能不能一起愉快的玩耍了。

  QQ大数据发布“七夕节,年轻CP们的恋爱大调查”,对,从星座、年龄、地域、恋爱状态等多个角度对年轻CP恋爱分析。

七夕节,大数据如何成功虐狗

  百度糯米发布大数据,寻找虐狗案发现场以及虐狗的幕后大Boss。

七夕节,大数据如何成功虐狗

  阿里发布大数据,看看哪些人还在用送花这种老套的招式虐狗。

七夕节,大数据如何成功虐狗

  尽管大数据虐狗千百遍,但我仍待大数据如初恋。上述的大数据之所以能对单身狗造成一万点的伤害,主要是因为采用了计算引擎、数据窗口小组件、可视化等等组合招式。

  大数据的大不仅仅是指其数据量,同时也指其业务流程的大。企业规模、任务、预算都可以通过数据来进行预测。企业管理者越来越愿意利用数据来体现企业价值,信息图表正在成为主流。

  1.考虑数据的衡量标准

  对于很多企业来说,利用数据驱动来获得洞察力是非常艰难的。虽然计算机网络和分析引擎可以提供数字、趋势线、百分比等等统计报表需要的东西,但是无法准确获知这些数字代表的意思。建立数据驱动指标体系是一项非常有技巧、有挑战性的工作。它需要筛选重要数据,匹配数据源和分析工具,构建系统平台维持数据的有效值。

  最好的指标体系就是能够将整个企业的技术人员和运营团队结合起来,协同合作。这样,他们就可以合理协调技术和业务,提高效率,增强可用性,然后通过不同的组合工具将数据展现出来,得到便于理解的视图。

  2. 全面理解“数据”的含义

  “一千个读者就会有一千个哈姆雷特”,同样的,不同的人对数据也有不同的定义。技术人员和从事数学领域的专家口中的数据更多的是机器数据,可以从数据库或者电子表格中直接获得的数据。而操作和分析人员口中的数据更多的是指信息,例如剪辑的音频或视频,网页上的文字或图片以及电子表格中的数字。他们认为这些信息可以直接被研究收集、处理分析,从而获得数据洞察力。 但其实,计算机处理数据的能力十分简陋,数据只有被分解成0和1才能被处理。

  企业中不同的人对数据的不同理解,可能会导致数据驱动方法的选择出现失误,进而影响到业务系统。 所以你需要站在技术人员、操作和分析人员以及决策者的角度来全面的看待数据,找出充分发挥数据价值的方法。另外,你还要知道哪些方法是可行的,哪些方法还在测试中。

  最重要的是你要了解企业不同员工对数据不同看法的优势和局限性,从多种角度出发,结合预算和资源规划数据方案。

  3.考虑企业已经使用的数据

  也许你的公司已经开发了一系列的技术和方法来捕获和分析数据并且已经把数据成功转化为信息。但是很多数据源和技术已经发生了变革。

  数据处理已经可以全自动或半自动化的实现,但是在弥补数据差距和数据驱动决策方面还有很远的路要走。

  4.考虑多种数据源

  我们可以从开放式数据门户获得成千上万的数据,但是与我们领域相关的数据量是非常有限的,更别说是和某项特定的功能、项目相关的数据了。

  如果你想利用政府开放的数据,那么肯定会有大量的machine-ready数据,你需要找出和你需求相关的数据。有肯定是大量的机器准备的数据可用,虽然找出什么是相关的,并将其调整到你的需求将是一个因素。营销、产品或财务这些数据通常是结构化和高可用的数据。其他的数据有防火墙或法律保护的敏感数据、专有数据、生产数据等等。当然也有大量的非结构化的和高度本地化的数据。

  我们可以选择合适的工具和技术来指导决策,我们也期盼数据技术创新能够早日走出实验室,在日常生活中真正应用起来。

  5.考虑数据的成本转化

  天下没有免费的午餐,当然数据也不例外。数据的输入、管理、访问和输出都是要成本支出的。除此之外,数据的授权许可也是需要成本的,所以在收集、处理和分析数据时,要充分考虑技术工具的成本。

  不过,值得开心的是,数据收集和挖掘的工具越来越廉价,充分利用数据优势的新技术层出不穷。但是,如何选择合适的工具来扩展、转换和加载数据仍是我们要考虑的问题。

  6.以小带大,逐步扩张

  在资源有限的情况下,一下子就做大规模的数据驱动是不现实的,所以,我们可以选择先从小规模入手。由小开始,你会发现你所选择的方式哪里是具备优势的,哪里又是有局限性的,小规模的话,就可以尝试多种解决方案,同时观察如果它的规模扩大是不是还能适应业务系统。

  这些步骤可能会花费一些时间和资源,但从小的投资开始,可以确保你能获得合适的数据和工具组合,推动之后的数据驱动,对企业的长期发展来说是充满益处的。

  原文出处:

  http://www.datasciencecentral.com/profiles/blogs/finding-and-using-data-that-matters-6-things-to-think-about

1
相关文章