【IT168 资讯】做大数据有2个关键点,缺一不可。其一,要有数据,其二,要有能力从数据中提炼价值。
数据每家企业都有,不同的只是数据量的多与少,但从数据中提炼价值的能力却不是每家企业都有,要想从数据中提炼价值,来改善企业管理、提升业务,就需要依赖大数据平台这一利器。但基于hadoop自建大数据平台却并不容易,因为开源不是那么好玩的。
近日,荣之联在北京召开发布会,正式推出了自主研发的大数据平台DataZoo。
据了解,DataZoo是以hadoop为基础,并结合行业特性构建的大数据平台产品,入市虽晚,但特色鲜明,不仅是hadoop,还被赋予了 “心脏”和“四肢”。
▲DataZoo架构
从DataZoo公布的架构图可以看出,DataZoo将hadoop生态层作为平台的基础层,并集成了开源社区Hadoop、Hive、HBase、 Spark、Zookeeper、Kafka、Flume、 Sqoop等核心项目。
“心脏”指的是荣之联开发出的五大引擎:批处理、实时流处理、多维搜索、图计算与数据挖掘。五大引擎涵盖了大数据应用的各方面场景,是平台通用大数据能力的体现。
值得一提的是其中多维搜索引擎,具有高性能查询与分析特性,是从荣之联行业案例中孵化而来,对索引机制进行了增强,具有亿万数据规模下秒级的响应性能。
而“四肢”则是荣之联在5大引擎之上提供的4大工具套件,涵盖了从数据采集清洗转换、数据分析与挖掘到数据可视化的数据分析生命周期全方面能力。
这些工具套件的优势在于大大缩减了应用实施的周期,并提高了用户体验度。如运维人员可直接通过web页面监控管理集群的运行状态;应用开发者可以通过界面化操作管理数据源、清洗数据、分析数据与建立模型。
除此之外,DataZoo还集成了丰富的行业模型,用户可以开箱即用平台的行业模型,快速构建行业应用。
据了解,基于该平台,荣之联提供的端到端的大数据解决方案,现已被成功应用于公安、证券、交通、新媒体、车联网及生物医疗等多个行业。