大数据频道 频道

2016 圣何塞Hadoop峰会趣味报告集锦

   【IT168 编译】2016圣何塞Hadoop峰会,一些有趣公司的演讲者带来有趣案例。下面是一部分业务重点会议。

2016圣何塞Hadoop峰会案例摘要

  什么是数据?你正在做什么?

  主讲人:来自RFS产品的Russell Foltz-Smith

  摘要:我们都在谈论用“数据”做生意,但是数据到底是什么?是有形的实质的吗?是形而上学的吗?它是一个能对其自身研究的“物体”,还是一个只是有关数据的“东西”?例如,当一个机器执行机器学习时,它究竟在学什么?——只是一些关于数据的东西还是关于这些数据代表的现象?然而,这些询问似乎看来有一点形而上学,但这个根本性问题的可能回答也许会改变我们所有人创造、收集和使用数据的方式。这次演讲是一个交互性的、高可视化的数据性质和含义的探索。

  迪士尼/ABC电视集团、Ranger、Kerberos,以及Knox的数据安全策略

  主讲人:来自eSage的Haribalan Raghupathy 和来自迪士尼/ABC电视集团的Matt Olsen

  由于存储和处理大量的异构数据需求的增加,作为集中储存库和事实来源的数据湖应用增加了。数据安全在部署Hadoop企业平台方面,已经成为一个关键的组成部分。适当的数据访问管理和数据保护应准备到位,以阻止未经授权的访问。这次陈述将会概述迪士尼/ ABC电视集团和eSage如何利用Apache Ranger、密钥服务管理器(KMS),和HDFS的透明数据加密作为Hortonworks数据平台的一部分,处理重要的安全组件,如身份验证、授权、审计和数据保护。当然,在Hadoop不谈Kerberos的安全性谈话是不完整的。所以我们会简略地涉及Kerberos,以及Knox 怎样使得最终用户获得更好的访问体验。我们也将会分享一些非常好的实践,以及这些实现过程中,我们已经经历过的一些挑战。

  数据湖和数据实验室优化核舰队的行动和安全

  主讲人:来自EDF法国电力的Marie-Luce Picard和Jean-Marc Rangod

  作为世界领先的电力公司,EDF在法国经营58个核电站。其发电船队的维修政策进行了优化,以确保设备和系统的稳定性和安全性(通过更好的诊断),以及增强竞争力(通过提高性能和可用性)。这个政策以目前存储在筒仓的数据和文件分析为基础,并不总进行全面分析。大数据技术的使用允许集中、快速,和低成本获得所有这些信息,以便完善运营和维护业务。

  在这次报告中,我们会介绍一个构建用于归档和分析来自成千上万个传感器的操作数据、由其他数据(化学,实验结果等等)丰富的数据湖。通过Phoenix查询,或特定的GUI、分析工具,建立在HBase之上的模型能提供高效的访问时间序列数据。我们也会介绍数据科学算法的附加值,从整个舰队的预见性维护分析数据,或者介绍控制能源市场内的合同协议。最后,我们会介绍数据湖结构的创建,以利用已经在生产的数据湖的效益。

  Prescient利用自然语言处理和空间分析保证旅客的安全

  主讲人:来自Prescient的Mike Bishop

  在不断变化的世界中,旅客安全分析是一个实时的、大数据的挑战,及时的洞察力会导致安全和悲剧的巨大差别。什么构成了对一个人或一家公司的合法威胁?什么时候是警告他们存在这个威胁的合适时间?什么是文化差异对一个国际旅行者的危害?什么时候推理能被用于安全填充稀疏数据集的漏洞?什么秘密情报行动的见解有利于私营部门?学习初创公司是如何利用Hadoop、NIFI、 SAP HANA和MongoDB来回答这些问题的,并如何创造了一个全新的保证旅客安全的功能。

  产业互联网:大数据、智能机器和更聪明的劳动力

  主讲人:来自GE Digital(通用电气数字部门)的Uday Tennety

  产业互联网采用新方法使用大数据和互联网,改变人们和机器的交互模式,以提高效率,加快生产力,实现整体的卓越运营。带有嵌入式传感器的网络机器和先进分析工具的到来,已极大地影响了工业生态系统。如今,产业互联网前所未有的允许结合来自设备传感器、操作性数据,和分析功能的数据来发表有价值的新观点。这些有力的分析见解结果通过转变技术基础结构、帮助减少计划外停机时间、提高性能,以及最大化能力盈利能力和效率可能会对企业产生革命性的变革。这次会上,我们会探索驱动工业互联网的力量,以及工业互联网正为行业解决的各种商业问题,例如航空、运输、石油和天然气。我们也会研究这个生态系统的现状,同时了解它对未来的承诺。

  客户情况——时尚零售的情绪分析

  主讲人:来自Hortonworks的Eric Thorsen和来自EXPRESS的Steve Howard

  Express是一个男装女装及配饰的专业零售商,目标顾客为20至30岁。这个公司有30多年的经验,为顾客提供兼具时尚和质量的不同结合。以有吸引力的价值解决工作、休闲、牛仔,和外出约会等多元生活中不同场合的时尚需求。EXPRESS的企业架构师Steve Howard将会说明Hadoop曾如何帮助他们进行客户情况情绪分析、社交倾听网络,及提高顾客忠诚度。

  Macy's(美国梅西百货公司)怎样在Hadoop上实施商业智能见解并技高一筹?

  主讲人:Macy's(美国梅西百货公司)的Seetha Chakrapany

  无论在什么行业,你都会面对怎样利用爆炸的业务数据的困境。有了Hadoop,你可以快速高效地管理你所有的大数据。但是现在,分析师和业务用户都在为了能自助商业智能访问Hadoop中所有有价值的数据而叩响你的门。你会怎么办?这次会上,市场分析总监Seetha Chakrapany将会分享Macy's(美国梅西百货公司)怎样做到直接在Hadoop的交互式视频设备和自助商业智能上实现创新,成功保持美国最大百货公司的榜首位置。

  加入学习他们怎样利用Hortonworks作为网上数据的核心来源,包括付费搜索和广告;以及他们如何允许所有现有的BI工具,包括Tableau、Excel和 SAS访问Hadoop的现存数据。听听他们是如何做到的,你也能在大数据方面具有实施洞察力,驱动即时、可测量的“商业智能大数据”的投资回报率。在本次会议中你将会学到:

  怎样在Hortonworks Hadoop上实现快速的商业分析;

  怎样提供自助式BI访问,同时保持控制;

  怎样利用现有技能为更多用户更快地提供更多价值。

  LEGO:数据驱动的Growth Hacking

  主讲人:来自Salesforce.com的Kamal Duggireddy和Prashant Gokhale

  大部分组织中,增长骇客、数据学家、产品经理,和行政执行想方设法地从企业的大量不同数据流中获得可操作的见解。LEGO成立是为了帮助Salesforce.com公司解决这个问题,LEGO是一个大数据分析与可视化平台。从非结构化日志文件到结构化多维数据集,它利用Hadoop、Kafka、Splunk和Salesforce Wave吸收整合各种数据。

  几种开源分析工具(Hive、Pig、Spark和Panda)被用来丰富、规范和协调数据,提高可发现性及创建自助服务特色。从Hive表格到Search索引,高效储存的不同层次都可获得可操作数据。LEGO让消费者探索、发现和创造可操作数据的特点,使组织中的各级决定数据驱动决策。集成Salesforce Wave平台能在几分钟内使用户分析和可视化每个数据集中的几亿行。这次演讲会描述LEGO如何工作,它的体系结构,以及在Salesforce.com中如何使用它。

  成功、挑战和陷阱使SAAS的业务迁徙到Hadoop

  主讲人:来自Marketo的Shaun Klopfenstein

  随着世界的连接日益紧密,营销人员要监测的活动数量激增。如今,Marketo平台每天要收集和处理数十亿的活动,而且这个数字在未来的几年将会继续增长。为了满足这个需要,我们成功地从传统的LAMP堆栈迁移到Hadoop,同时保持恒定的正常运行时间,几乎没有影响到客户的工作流程。这已成为Marketo的重大举措,很多挑战也随之而来。

  这次演讲将会涵盖我们面对的一些困难和我们开发的解决方案:业务需求,降低主营业务成本同时扩展融资,加密,授权,认证,近实时活动处理,高层体系结构,多租户架构版本及原因,掉电保护,公平,管理挑战和解决方案,协调,部署和作业管理,零停机时间客户数据迁移,零停机时间管理应用程序和基础设施升级,未来研究工作,设计Spark streaming背压区,在多租户架构环境中动态管理Kafka资源,推绎多租户Spark Streaming作业。

  Hadoop的自助分析:经验教训

  主讲人:来自Comcast(康卡斯特公司,美国有线电视传输和宽带通信公司)的Andrew Leamon

  硬件、云、Hadoop应用程序、安装、配置、调试、数据摄取,和筛选的复杂使许多组织发现兑现大数据的承诺很难。一个关键的原因是,直到现在大数据还在由复杂的技术,和有限的IT技术专家、数据学家推动。这次会上,我会分享一个案例,有关我们怎样通过建立流程、工具和资源,授权自主分析的分析师实施他们的数据,为我们的IP电话团队克服这些挑战。大数据不仅仅是关于技术。开发内部流程和支持分析师也同等重要。

  我曾领导Comcast的团队建构一个解决方案,体现我们大数据战略和执行计划中的所有三个组成部分。我将会分享我们考虑到的不同类型的技术架构和部署,集中式或联合式分析资源模型,以及各种内部流程以实现更高的分析效率的经验教训。最后,我将会展示我们的IP电话分析师每天怎样使用自助解决方案,在网络欺诈检测、容量规划、对等操作,和FCC标准领域解决具有挑战性的问题和改进业务结果的。

  译文链接:https://dzone.com/articles/hadoop-summit-san-jose-insights-from-industry-expe

0
相关文章