大数据频道 频道

这个平台有点酷!数据收集,存储,分析都在行

  【IT168 技术】如果多个来源的大数据无法容易地收集,存储,分析并获得重要的洞察力,帮助企业提供更好的业务决策,那么这些数据对于企业来说可能就没有太多价值。数据可能来自许多不同的来源,可能处于静止或者运动状态,可能是本地、云端或者是网络边缘创建的,并由不同的数据治理策略进行管理。

  过去几年来,MapR Technologies一直在从商业Hadoop经销商向数据平台公司转变,其提供了一种数据结构模型,使用户能够从多个来源(如表格,数据流和文件)获取大量数据,然后将其作为单个数据池提供给客户。随着Converged Data Platform 6.0的发布,MapR可以帮助用户更加轻松地管理静止和动态数据,并确保平台本身的健康和保障。

  这个更新服务来源于MapR的DataOps团队,这个团队是的变体,其中不仅包括开发人员,还包括数据科学家和数据工程师。通过整合运营和分析,企业可以更快地从所有数据中获得收益。而要做到这一点,企业既需要拥有数据,又需要技能来管理数据,其中最关键的是确保将所有数据汇总在一起并迅速提供。

  MapR行业解决方案的高级技术专家Mitesh Shah表示:企业都在尝试将数据转化为价值,并且希望能够比竞争对手更快、更多的将数据转化为价值。数据科学家就应该是第一时间能够使用数据,而不应该还要等待数据拼接。

  "天下武功,唯快不破!"速度对于企业来说是非常重要的,以前数据科学家可能需要花费数周才能找到所需的数据,清理并分析数据。Shah表示这个过程需要加快,而Converged Data Platform 6.0正是加快了这个过程。今年9月份,MapR平台的最新版本中推出了MapR-DB数据库功能,包括增强支持二级索引和应用程序的自动化,集成机器学习和实时处理。除此之外,还包括开放的JSON应用程序接口(OJAI)2.0 API。通过MapR-DB,用户可以快速获取数据到平台进行存储,处理和分析。Shah表示对数据所做的更改会传播到整个MapR系统。

  通过最近宣布的Data Science Refinery技术,MapR通过与MapR-DB,MapR-XD云规模数据存储和MapR-ES等产品的连接,提供对同一集群内和MapR平台内所有数据的自助访问事件流;支持Apache Spark,Apache Hive,Apache Pig和Python,并且支持通过进行部署。MapR新的变更数据捕获功能与MapR-DB和MapR-ES集成,帮助跟踪数据库或数据流的变化,然后采取措施应对这些变化。

  MapR还提供自动平台健康和安全功能,MapR控制系统(MCS)管理从列,表和流中收集的数据,并通过单一视图监视群集的运行状况。其中包括用于测量各种指标(包括吞吐量,容量,延迟和IOP)的仪表板,并将指标推送到MapR-ES以与企业系统集成。最近还宣布推出了数据库索引功能。

这个平台有点酷!数据收集,存储,分析都在行

  通过 single-click security功能,Converged Data Platform 6.0可以提供更快的身份验证执行和标准加密。Shah表示,这个功能完全可以确保电路板数据环境中的安全,通过"简单的切换开关"就可以帮助客户提高安全性。身份验证应用于一系列大数据工具,包括Hadoop,Spark,Drill,Mahout和Oozie。

  Shah表示:平台上有很多可移动部件。我们正在尝试对每个部分都进行安全性的保护,让这个功能更安全。

这个平台有点酷!数据收集,存储,分析都在行

  该平台的新功能还包括针对云计算多租户的MapR Orbit云套件增强功能,MapR OpenStack Manila插件以支持租户对文件进行自助配置,以及实时自动将文件从边缘移动到云。

  Converged Data Platform 6.0目前已经上市,云提供商如AWS、Azure和Oracle云将在今年年底之前通过市场提供。

0
相关文章