大数据 频道
  • 大数据全流程平台在互联网金融的实现

    如果有这么一家公司,它把数据视为它的生命线,那么它对数据系统一定有非常非常多的需求,它可能会要求它们的数据系统足够灵活,可以非常方便的加减数据源,它可能需要实时查询裸数据,也有可能对这个数据进行各种各样的计算,它还有可能去提高每次访问的实时性,同时也有可能提高批量离线分析时的性能以及水平扩展能力,如果你是一个架构师,你会怎样设计这套系统呢?

    覃里 · 2016-12-23 16:21
  • 对话首家大数据“国家队”CTO王帅宇

    “颜值担当,身材满分,演讲很棒。”这是12月18日,在北京供销大数据集团举办的“加快大数据中心一体化进程·2017北京峰会”上,笔者从一些媒体同行口中听到的对王帅宇系列评价。

    覃里 · 2016-12-23 14:57
  • 陈军: 日志易就是要做中国的Splunk

    陈军,日志易CEO。笔者这些年采访的众多CEO中比较特别的一个,70后创业者,大器晚成,虽然直至不惑之年才开始走上创业之旅,但丰富的工作经验与人生阅历让他比起一些年轻的创业者要稳重不少。

    覃里 · 2016-12-20 15:53
  • 为什么企业采用了数据驱动,还是会失败

    大数据以及大数据技术的爆发使得人们渐渐把“数据为王”的论调奉为圭臬,甚至有很多公司在数据管理、商业智能和分析方面砸数百万美元,企图从中获得价值,但是只要利用了数据,企业就一定会成功吗?

    田晓旭 · 2016-12-16 09:27
  • 从“信息孤岛”走向“国家大数据中心”

    数据作为国家基础性战略资源,已随着信息技术的日新月异渗透到各行各业,不断拉动着技术进步与产业发展。近年来,在国家各项政策的支持与推进下,大数据产业与应用逐步深化,海量数据的挖掘和运用成为大热门。

    田晓旭 · 2016-12-15 14:46
  • 盘点今年大数据创业:实力派能熬过寒冬

    在喜新厌旧的互联网技术圈,已有3年历史的“大数据”听起来似乎已经过气了。虽然Hadoop在2006年已经发明,但“大数据”这个概念大概是在2011到2014年左右才真正火了起来。也就是在这段时间里,至少是在媒体或者专家眼里,“大数据”成为了新的“金子”或者“石油”。

    田晓旭 · 2016-12-14 14:22
  • 如何使用Azure ML Studio开启机器学习

    机器学习正在迅速成为数据科学家和开发人员预测的前瞻性技术。根据机器学习的实际数据规模与计算性能需求,云空间往往是机器学习应用的一大理想运行环境。在许多可用于神经网络的工具中,Microsoft的Azure ML Studio提供了一个快速的学习曲线,它不需采取深层数据或编码的方式来启动运行。

    覃里 · 2016-12-13 15:05
  • 最适合Java开发者的大数据工具和框架

    当今编程人员面对的最大挑战就是复杂性,硬件越来越复杂,OS越来越复杂,编程语言和API越来越复杂,我们构建的应用也越来越复杂。根据外媒的一项调查报告,以下列出了Java程序员在过去12个月内一直使用的一些工具或框架,或许会对你有意义。

    覃里 · 2016-12-09 15:53
  • 数据集成工具领域,TOP10厂商优劣分析

    数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。在企业数据集成领域,已经有了很多成熟的框架可以利用。架构师或开发人员对数据集成工具的效率应该有所要求。好的数据集成工具是具有分布式处理能力,可读取,分析,交互,在具有分布式处理能力的动态模型中能快速对本地和外来数据做出反应。

    覃里 · 2016-12-09 00:00
  • 成功登陆资本市场沃趣挂牌新三板

    沃趣从成立,到正式挂牌新三板,只用了4年。公司从最初的五人小灶,到如今拥有80多位资深数据库及系统技术专家,究竟是什么因素促成了它的成功?又有哪些经验值得创业者借鉴?

    覃里 · 2016-12-05 00:00
  • 低调还是高调?透过一场大赛重新认知SAS

    SAS在细分市场上的主要竞争对手是Oracle、IBM、Microsoft、SAP、Teradata等IT厂商。但在国内,SAS显然要比竞争对手Oracle、IBM、Microsoft、SAP的知名度低一些。因此,有人说SAS并不重视中国市场,也有说SAS太过低调,最初笔者也颇为认同这类观点,不过事实显然并非如此。

    覃里 · 2016-12-02 16:27
  • NoSQL与SQL谁会笑到最后?结局万没想到

    在NoSQL热潮之后,我们看到了新旧数据库之间的碰撞。多年以来,我们看到了传统数据库和新型数据库之间的市场分裂。根据Gartner所言,这两个世界都在进行着进一步的巩固。正如Gartner分析师Nick Huedecker所言,每周都有很多SQL进入NoSQL数据库的子市场。以NoSQL作为两个市场分界线的人已经越来越少了。也就是说,其实传统数据库和新型数据库正在逐渐融合。

    覃里 · 2016-11-29 21:14
  • 2017年大数据领域的十大趋势

    曾有媒体将2013年称为“大数据元年”,经过两三年依然热度不减,但是也有专家认为前几年大数据一直处于一个很尴尬的局面,大数据不接地气,人人都在谈大数据,但真正应用大数据的人很少,2016年,各行各业的大数据应用都渐渐从空洞的理论落地,所以很多专家认为2016年才是真正意义上的大数据元年。

    田晓旭 · 2016-11-26 00:00
  • 叱咤大数据的Regex真的是正则表达式?

    正则表达式已经存在几十年了,它甚至早于今天甚嚣尘上的大数据,UI,机器学习以及其他几乎所有的工具和技术。许多开发人员通常认为正则表达式很神秘并且难以学习,并嘲笑使用正则表达式来验证电子邮件地址的人。但是,正则表达式非常强大,优雅,简单和通用。

    覃里 · 2016-11-22 11:07
  • 非替代品,MongoDB与MySQL对比分析

    对于只有SQL背景的人来说,想要深入研究NoSQL似乎是一个艰巨的任务,MySQL与MongoDB都是开源的常用数据库,但是MySQL是传统的关系型数据库,MongoDB则是非关系型数据库,也叫文档型数据库,是一种NoSQL的数据库。它们各有优点,关键是看用在什么地方。

    覃里 · 2016-11-18 15:24
  • 双十一7年之痒,昔日“电商”走向消亡

    “Fashion Back.”时尚界一个古老而通俗的规律,所谓潮流,每到一个固定或偶然的周期,就会回归从前出现过的样子,花样轮回,周而复始……充满艺术气息的商业规律。所以消费市场的种种,都在遵循着这个由来已久的规律,所以电商也必然会走入循环的莫比乌斯环。

    覃里 · 2016-11-15 09:46
  • 双11在即,看亚马逊、谷歌云SQL之争

    谷歌云端数据库在线程较少的情况下,性能上还是可能会击败亚马逊的Aurora,但Aurora目前仍处于第一的位置。谷歌云SQL第二代严格上来说仍然是测试版,但它声称性能比公司的第一代基于SQL的云数据库高七倍,功能强20%%。那我们来看看谷歌云SQL与亚马逊Aurora的性能对比,到底孰优孰劣?

    覃里 · 2016-11-10 16:42
  • 大数据抓取:他们要控制你的汽车方向盘

    没错,他们就是想要控制你的汽车方向盘。他们是谁?为什么要控制汽车方向盘呢?大数据好像百无禁忌,跟谁都可以组CP。随着越来越多的厂商投入到无人驾驶汽车研究的大潮中,这一颇具前瞻性的领域获得了大量关注。谷歌无人车14个月遇272起事故,这你敢坐?可能很多人都将责任归咎于数据获取与分析过程不当,那我们来看看这锅应不应该大数据背。

    覃里 · 2016-11-09 16:33
  • 泼点冷水,区块链真的该降温了!

    IBM成立了专门的实验室,英国发行了电子货币牌照,中国国家工信部发布了白皮书,受此殊荣的背后赢家就是“区块链”,股市动荡回落翻绿而区块链概念股领涨。外媒调查显示,65%%的企业预计在三年内使用区块链分布式数据库,尤其是金融和医疗行业居多,根据对全球400家银行和金融业的调查显示,银行和金融市场针对付款和贷款服务均采用区块链分布式数据库,目前已取得显著成效。

    覃里 · 2016-11-07 08:59
  • Spark与EVAM组CP,应对实时流式事件处理

    Apache Spark是一个开源大数据处理框架,其速度快并具有很好的易用性,并且可用来应对复杂分析。Spark可以支持流式处理,图表数据,机器学习,以及Hadoop和map/reduce。它是探索建立实时事件处理的理想平台。

    覃里 · 2016-11-03 17:11