IT168首页 | 产品报价 | 渠道168 | ChinaUnix社区 | ITPUB社区 | OA维修站 | 文库 | 博客 | 会议 | 自测 | 专题 | 订阅 | IT选型顾问
大数据频道

最新文章

日前,浪潮集团副总裁彭震接受了媒体采访,就浪潮服务器在2018年度的业务策略、市场目标等进行了沟通。在采访中,彭震指出,AI将是未来最大的产业机会,生态问题仍然是最大的挑战。

17日更新
标签:浪潮
浪潮彭震:AI走向传统行业,生态是关键

  8月11日,2018 CCF大数据与计算智能大赛(Big Data & Computational Intelligence Contest,简称“CCF BDCI”)全球启动仪式在北京中关村皇冠假日酒店正式拉开帷幕,中国科学院院士、CCF大数据专家委主任

17日更新
标签:大数据
2018 CCF BDCI大赛全球启动:数据驱动,智见未来

1. 网易游戏的数据业务特点和数据流的挑战 2. 数据流采集架构和实践 (1). 数据流平台架构 (2). 服务器日志采集的设计与实现 (3). 客户端数据提交入口设计 (4). 后续迭代计划 3. 基于数据流支撑的业务介绍 (1). 游戏数据集成 (2).

17日更新
洪增林:网易游戏统一数据流平台架构与实践

由msup主办的人工智能与机器学习创新峰会(简称A2M)将于8月25日至26日在上海古井假日酒店举行。 A2M(AI TO Machine)峰会旨在以国际化视角洞察人工智能发展趋势,发现全球人工智能创新工程和杰出团队,整合国际最佳技术实践,构建人工智能案

15日更新
标签:人工智能
2018人工智能与机器学习创新峰会(A2M)即将登陆上海

对任何一家企业而言,建立数据仓库都是非常必要的。随着技术的进步,我们在这件事情上也有了很多新的选择,比如内部部署或者基于云。无论选择哪种方案,最终都可以实现从数据中获取商业智能从而辅助决策的目的,那么我们自然需要衡量哪种方案的性价比更高。

15日更新
数据仓库架构到底选择内部部署还是上云?

在单一DataNode管理多个磁盘的情况下,执行普通写操作时的每个磁盘用量比较平均。但是,添加或者更换磁盘将会导致DataNode磁盘用量严重不均衡,传统的HDFS均衡器关注点是DataNode之间(inter-)而不是intra-,但是Hadoop 3.0及

14日更新
HDFS系列之DataNode磁盘管理解析及实践!

HDFS是基于Java的文件系统,可在Hadoop生态系统中提供可扩展且可靠的数据存储。因此,我们需要了解基本的HDFS配置和命令才能正常使用它。在使用之前,我们首先讨论如何配置安装HDFS。Hadoop以及HDFS都运行在java环境中,因此我们都需要安装J

13日更新
手把手教你HDFS基础配置安装及命令使用!

无论你如何将Hadoop与Spark进行对比,无论Spark生态多么成熟和完善,其底层终归要基于HDFS,毕竟这是目前最成熟的分布式底层文件系统,几乎没有哪家公司愿意重新花费精力研发一个全新的文件系统。

13日更新
扫盲:Hadoop分布式文件系统(HDFS)基础概念讲解!

传统关系数据库经过几十年的发展,架构是否已经到了演进尽头?MPP、读写分离、共享存储、分库分表……琳琅满目的架构从何处来向何处去?未来关系数据库架构可能会如何发展?本主题以达梦数据库架构演进与创新为例,向大家分享我们的看法。

10日更新
从上世纪80年代到今天,达梦数据库技术架构演进与应用全记录

作为CEO,数字化转型战略是弯道超车还是颠覆? 作为CIO,如何衡量数字化转型是否成功? 作为COO,数字化转型如何提升公司的运营效率? 作为CMO,数字化转型如何推动业绩增长? 作为CHO,数字化转型如何推动组织升级,推进人才培养?

10日更新
8月@北京倒计时 | 前沿思想盛宴,升级数字化转型之旅

在大数据库领域,Python是最常被使用的编程语言,因此了解与其相关的数据分析工具是很有必要的。如果你正在使用virtualenv、pyenv或其他变体在自己的环境中运行Python,那么,可以尝试本文推荐的三大开源工具。

TOP 3大开源Python数据分析工具!

本文将会分上下两篇对一个重要且常见的大数据基础设施平台展开讨论,即“实时数据平台”。在上篇设计篇中,我们首先从两个维度介绍实时数据平台:从现代数仓架构角度看待实时数据平台,从典型数据处理角度看待实时数据处理;接着我们会探讨实时数据平台整体设计架构、对具体问题的

09日更新
标签:数据平台
实时数据平台设计:解决从OLTP到OLAP实时流转缺失

年初,笔者开始调研Hadoop在国内企业的应用现状,在前期的互联网企业应用现状调研中,笔者发现目前比较知名的互联网企业基本都在使用Hadoop,其生态组件,比如HDFS、Zookeeper、MapReduce等出现频率极高(完整调研可在文末获取链接)。但是,H

08日更新
耗时两个月,国内传统企业对Hadoop到底什么态度?

8月3日下午,2018(第三届)中国大数据产业生态大会盛大揭晓“2018中国大数据企业50强”。自2016年开始,中国大数据产业生态联盟已经连续两年推出“中国大数据企业50强”榜单。

07日更新
标签:大数据
「2018中国大数据企业50强」盛大揭晓

Kafka是一种高吞吐量的 分布式 发布订阅消息系统,它可以处理消费者规模的网站中所有动作流数据。Kafka的目的是通过Hadoop 并行加载机制统一线上和离线消息处理,并通过 集群 提供实时消息。本文内容较基础,主要围绕kafka的体系架构和功能展开。

06日更新
消息中间件Kafka+Zookeeper集群简介、部署和实践

提起Hadoop,我们就可以想到大数据;提起Oracle,我们就可以想到数据库。国内确实有不少企业习惯于将Hadoop作为数据库使用,因此将其与数据库领域同样占据重要位置的Oracle进行对比是有意义的。

03日更新
Oracle与Hadoop对比:一致性和高性能不可兼得!

MaxCompute包含临时层、基础数据层、应用层三个层次,数据上云后将数据源中的数据先传输到MaxCompute里的临时层中,并将数据进行处理,接着将数据经过简单的转换传输到基础数据层,最后将数据进一步汇总到应用层进而提供服务。

MaxCompute数据仓库在更新插入、加载、全量历史表三大算法中的数据转换实践
最新文章