IT168企业级
IT168企业级
扫码送文库金币
文库app安卓版
文库app安卓版
扫码安装
IT168首页 | 产品报价 | 产品评测 | ChinaUnix社区 | ITPUB社区 | 文库 | 博客 | 自测 | 专题 | 订阅 | IT168试客 | IT选型顾问 hsiaoyang 退出

您身边的IT选型顾问

欢迎加入CIOCTO俱乐部

2018第九届中国数据库技术大会
2018第九届中国数据库技术大会
地理信息双创总决赛:无人机与VR成为焦
寻找2017 中国SDN/NFV优秀案例
2017年度IT168技术卓越奖名单:大数据
2017 OpenPOWER中国高峰论坛

经过这么多年的发展,已经从大数据1.0的BI/Datawarehouse时代,经过大数据2.0的Web/APP过渡,进入到了IOT的大数据3.0

热点推荐

“大数据杀熟”成为热点话题已经一段时间了,为大家科普原理和揭秘本质的文章也数不胜数。然而,相比起“大数据杀熟”背后的策略和原理,我想大家可能更关心的是——我该怎么做,才能避免被“大数据杀熟”。

20日更新标签:程序员 大数据
分享到:
如何对抗大数据杀熟?数据分析师教你反套路

经过这么多年的发展,已经从大数据1.0的BI/Datawarehouse时代,经过大数据2.0的Web/APP过渡,进入到了IOT的大数据3.0时代,而随之而来的是数据架构的变化。

18日更新标签:Hadoop 大数据 IOT
分享到:
下一代大数据即时分析架构——IOTA架构

Apache Hive是一个构建在hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能,但是Hive不能够进行交互

18日更新标签:apache Hadoop 大数据 HBase
分享到:
HIVE和HBASE之间,主要的区别是什么?

通常,企业在知晓编写代码和构建内部解决方案所需的成本和复杂性之后,首先会意识到对ETL工具的需求。提取,转换和加载(ETL)工具使企业能够在不同的数据系统中访问有意义且可用的数据。企业也可尝试组装开源ETL工具。

17日更新标签:ETL 数据分析 大数据
分享到:
现代ETL工具与传统解决方案清单附对比

大家好,我来自清华大学自动化系,主要做机器学习和图像识别的研究。现在人工智能很流行,机器学习也推到风口浪尖上,图像识别已经变成产品,新闻媒体告诉我们AlphaGo、AlphaGo zero已经战胜了人类、皮肤癌的识别超过

16日更新标签:大数据 机器学习
分享到:
清华大学张长水教授:机器学习和图像识别

过去的几个月中,我参加了一些公司数据科学、机器学习等方向初级岗位的面试。我面试的这些岗位和数据科学、常规机器学习还有专业的自然语言处理、计算机视觉相关。我参加了亚马逊、三星、优步、华为等大公司的面试,

分享到:
一文搞定数据科学和机器学习的最常见面试题

本文介绍如何在E-MapReduce上使用Kafka Connect实现同步RDS binlog数据。在我们的业务开发中,往往会碰到下面这个场景:业务更新数据写到数据库中,业务更新数据需要实时传递给下游依赖处理,所以传统的处理架构可能

14日更新标签:Hadoop 大数据
分享到:
Kafka Connect如何实现同步RDS binlog数据?

随着苏宁大数据平台的规模越来越大,HDFS集群Namenode逐渐出现性能瓶颈,特别是在凌晨任务的高并发期,Namenode的RPC响应延迟较高,单次写RPC请求甚至超过1s,严重影响了集群的计算性能。因此解决HDFS的扩展性问题,

09日更新标签:Hadoop 大数据 HDFS
分享到:
基于Alluxio的HDFS多集群统一入口的实现

大型企业到底如何看待数据及数据驱动?从热潮到落地,大数据的力量有无受到区块链、人工智能等新浪潮的冲击?在清华数据科学研究院联合大数据文摘发布的《顶级数据团队建设报告》中提到,数据化转型更多是一个至上而下

08日更新标签:人工智能 大数据 区块链
分享到:
报告:连续六年调研大企业数据变革,结果如何

传统的Hadoop架构是建立在相信通过大规模分布式数据处理获得良好性能的唯一途径是将计算带入数据。在本世纪初,这确实是事实。当时,典型的企业数据中心的网络基础架构不能完成在服务器之间移动大量数据的任务,数据

07日更新标签:Hadoop 大数据
分享到:
Hadoop 3.0版本测试,终将计算与存储解耦!

如果要给机器学习划分流派的话,初步划分可以分为『归纳学习』和『统计学习』两大类。所谓『归纳学习』,就跟我们平时学习所用的归纳法差不多,也叫『从样例中学习』。归纳学习又分为两大类,一类是像我们归纳知识点

07日更新标签:大数据 机器学习 深度学习
分享到:
Tensorflow快餐教程(8) - 深度学习简史

4月30日,阿里云发现,俄罗斯黑客利用Hadoop Yarn资源管理系统REST API未授权访问漏洞进行攻击。Hadoop是一款由Apache基金会推出的分布式系统框架,它通过著名的 MapReduce 算法进行分布式处理,Yarn是Hadoop集群的资

07日更新标签:Hadoop 大数据 阿里云
分享到:
预警:黑客利用Hadoop Yarn未授权访问漏洞

很早就有采集知乎用户数据的想法,要实现这个想法,需要写一个网络爬虫(Web Spider)。因为在学习 python,正好 python 写爬虫也是极好的选择,于是就写了一个基于 python 的网络爬虫。

04日更新标签:Python 程序员 大数据
分享到:
用Python写一个小白也能懂的分布式知乎爬虫

2017年,Gartner的一份《2017年数据管理技术成熟度曲线》报告极其明显得标识出Hadoop即将进入衰落席。对此,IT168走访了国内一系列大数据厂商,在过去几个月,我们共同探讨了Gartner提出该观点的依据、用户对Hadoop生

03日更新标签:Gartner Hadoop 大数据
分享到:
抛开Hadoop生死论,我们可以聊聊生态演进!

盗梦空间中的造梦场景或许不再只是科幻电影的内容了。麻省理工学院硕士生Adam Horowitz领导的一个研究小组刚刚发布了一个“梦境控制系统”。通常,在我们进入深度睡眠的过程中,总有几分钟处在半睡半醒,迷迷糊糊的状

分享到:
现实版

波士顿动力的网红机器狗不仅能稳步行走,还能送快递,但是科学家们对狗和AI的畅想远不止于此。华盛顿大学与艾伦人工智能研究所的答案是,记录一只汪星人在各种环境中行走、取物,在狗公园玩耍、吃东西的数据,将狗的

03日更新标签:大数据 机器学习
分享到:
全方位搜集汪星人数据|华盛顿大学最新研究

鉴于上次一篇文章——“云HBase小组成功抢救某公司自建HBase集群,挽救30+T数据”的读者反馈,对HBase的逆向工程比较感兴趣,并咨询如何使用相应工具进行运维等等。总的来说,就是想更深层理解HBase运维原理,提高运

02日更新标签:运维 大数据 HBase
分享到:
HBase运维基础——元数据逆向修复原理

循环神经网络(RNN),长短期记忆(LSTM),这些红得发紫的神经网络——是时候抛弃它们了!LSTM和RNN被发明于上世纪80、90年代,于2014年死而复生。接下来的几年里,它们成为了解决序列学习、序列转换(seq2seq)的方式,这

02日更新标签:人工智能 大数据 机器学习
分享到:
RNN和LSTM弱爆了!注意力模型才是王道!

作为专业人士,我们需要做的第一件事就是认清我们做错了什么。在一些特殊情况下,没有人运维系统的某一部分,结果就导致发生重大事件时,我们无法立即解决。解决这类问题理论上很容易,比如及时的信息反馈,尽量不要

02日更新标签:软件开发 编码原则 大数据
分享到:
程序员遇代码失误:不要急着给失败下定义!

从Siri问世时语音交互产品的可有可无,再到现在语音交互成为某些场景下的刚需,众多大厂的布局都在宣告着iOT时代的到来。我们见识过各种各样的智能语音产品,主要分为三种类型:知识型、任务型和问答型。任务型似乎是

02日更新标签:微软 人工智能 人机交互
分享到:
微软小冰“有情商”级别语音智能如何评判?
专家讲LoRa如何撑起中国物联网半