大数据 频道
  • 朱曜鑫:阿里巴巴第四代数据库架构最佳实践

    阿里数据库架构体系的演进路线和思考过程;我们为什么选择X-DB,新体系结构在实践中如何为业务赋能;X-DB 的技术优势和典型业务场景介绍;新技术体系演进过程中的经验介绍。

    刘美利 · 2018-08-30 10:31
  • MaxCompute Tunnel上传典型问题场景

    对于MaxCompute系统数据的上传和下载,可以通过Tunnel批量数据通道和DataHub实时数据通道两种途径来实现进出MaxCompute。

    赵钰莹 · 2018-08-29 13:40
  • 汽车之家数据库服务化平台从0到1的实践过程

    分享一下汽车之家数据库服务化平台从0到1的实践过程。详细介绍平台的整体架构,技术栈以及各系统模块的工程化实现方案。希望给正在做数据库自动化,平台化的同学一些借鉴和启发。

    刘美利 · 2018-08-23 11:17
  • 数据挖掘中易栽的10个坑,你中了没?

    研究结果:按照《神经网络》期刊的统计,在过去3年来,只有1/6的文章中做到了上述两点。也就是说,在独立于训练样本之外的测试集上进行了开集测试,并与其它广泛采用的方法进行了对比。

    刘美利 · 2018-08-21 16:51
  • 从上世纪80年代到今天,达梦数据库技术架构演进与应用全记录

    传统关系数据库经过几十年的发展,架构是否已经到了演进尽头?MPP、读写分离、共享存储、分库分表……琳琅满目的架构从何处来向何处去?未来关系数据库架构可能会如何发展?本主题以达梦数据库架构演进与创新为例,向大家分享我们的看法。

    刘美利 · 2018-08-10 17:07
  • MaxCompute数据仓库在更新插入、加载、全量历史表三大算法中的数据转换实践

    MaxCompute包含临时层、基础数据层、应用层三个层次,数据上云后将数据源中的数据先传输到MaxCompute里的临时层中,并将数据进行处理,接着将数据经过简单的转换传输到基础数据层,最后将数据进一步汇总到应用层进而提供服务。

    赵钰莹 · 2018-08-02 15:04
  • 下一代分布式消息队列Apache Pulsar从入门到实现

    Apache Pulsar是一个企业级的分布式消息系统,最初由Yahoo开发并在2016年开源,目前正在Apache基金会下孵化。Plusar已经在Yahoo的生产环境使用了三年多,主要服务于Mail、Finance、Sports、 Flickr、 the Gemini Ads platform、 Sherpa以及Yahoo的KV存储。

    赵钰莹 · 2018-08-02 09:34
  • 目标检测技术演化:从R-CNN到Faster R-CNN

    目标检测旨在准确地找到给定图片中物体的位置,并将其正确分类。准确地来讲,目标检测需要确定目标是什么以及对其定位。

    田晓旭 · 2018-07-30 20:47
  • 机器学习到底是什么?

    关于机器学习最简单的定义来自于Berkeley所表述的:机器学习是AI的一个分支,它探索了让计算机根据经验提高效率的方法。

    田晓旭 · 2018-07-30 20:29
  • 教程:MySQ 数据库主从同步安装与配置详解

    MySQL5.6 数据库主从同步安装与配置详解(Master/Slave)本篇文章主要介绍了MySQL5.6 数据库主从同步安装与配置详解,具有一定的参考价值,有兴趣的可以了解一下。安装环境

    刘美利 · 2018-07-30 16:09
  • 大数据云的数据交换共享平台架构探索

    本文将具体解读如何借助大数据和云计算技术解决数据孤岛,烟囱开发,技术门槛等痛点,满足用户多元化、复杂的需求,降低数据开发、管理的难度。

    覃里 · 2018-07-26 11:20
  • 如何在.NET中使用MongoDB和CRUD操作教程

     NoSQL是一种面向文档的数据库系统,以特定的格式储存,如JSON。MongoDB是当前NoSQ数据库产品中最热门的一种,它具高性能、易部署、易使用的特点,以及丰富的轻量级二进制格式。 MongoDB最大的特点是支持的查询语言非常强大,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引,是一个面向集合的,模式自由的文档型数据库。

    刘美利 · 2018-07-23 14:32
  • 美团如何基于深度学习实现图像的智能审核?

    AI(人工智能)技术已经广泛应用于美团的众多业务,从美团App到大众点评App,从外卖到打车出行,从旅游到婚庆亲子,美团数百名最优秀的算法工程师正致力于将AI技术应用于搜索、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助美团数亿消费者和数百万商户改善服务和体验,帮大家吃得更好,生活更好。

    赵钰莹 · 2018-07-16 10:30
  • AIOps智能监控在阿里故障管理工作中的实践!

    在自动化运维还不普及的时候,运维人员更多的运用手动的方式完成运维工作,这种方式耗时长,效率低。由此,如何合理发挥人工智能技术辅助运维人员进行故障管理工作逐步成为了业界关注的焦点。阿里巴巴的GOC团队通过研究并使用AIOps系统到运维业务场景中的方式,积累了大量的智能运营的方法论和技术体系。

    赵钰莹 · 2018-06-27 08:57
  • 实践:一小时神经网络从入门到精通(放弃)

    目前本人对于机器学习也还只是入门状态,对于很多名词仍然是一知半解(感觉机器学习中的很多术语本身也是模棱两可的),对于很多公式也是不求甚解,因此这篇文章是尝试用自己的语言和理解来复述所学习到的知识,如果有错误之处还望大牛们不吝斧正。

    赵钰莹 · 2018-06-20 17:03
  • Kubeflow实战系列:阿里云上小试TFJob

    模型训练是机器学习最主要的实践场景,尤其以使用机器学习框架TensorFlow进行模型训练最为流行,但是随着机器学习的平台由单机变成集群,这个问题变得复杂了。GPU的调度和绑定,涉及到分布式训练的编排和集群规约属性的配置(cluster spec)也成了数据科学家们巨大的负担。

    赵钰莹 · 2018-06-13 18:11
  • 一条数据HBase之旅,简明HBase入门教程开篇

    这是HBase入门系列的第1篇文章,介绍HBase的数据模型、适用场景、集群关键角色、建表流程以及所涉及的HBase基础概念,本文内容基于HBase 2.0 beta2版本。本文既适用于HBase新手,也适用于已有一定经验的HBase开发人员。

    赵钰莹 · 2018-06-12 18:03
  • DFSMN在阿里应用及采用开源代码训练模型

    DFSMN模型是语音识别中一种先进的声学模型,语音识别中的声学模型是语音识别技术中的核心所在。具体来说,声学模型是根据输入语音进行发音可能性的识别,结合语言模型、解码器,就构成了完整的语音识别系统。本次开源的DFSMN模型,是阿里巴巴的高效工业级实现,相对于传统的LSTM、BLSTM等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

    赵钰莹 · 2018-06-12 17:47
  • 深度学习在美团搜索广告排序的应用实践

    AI(人工智能)技术已经广泛应用于美团的众多业务,从美团App到大众点评App,从外卖到打车出行,从旅游到婚庆亲子,美团数百名最优秀的算法工程师正致力于将AI技术应用于搜索、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助美团3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好。

    赵钰莹 · 2018-06-11 17:39
  • 阿里巴巴资深大数据工程师:大数据处理实践

    不同于以往的授课式课堂风格,这次斯坦福大学的教授Hadley Wickham开设了一门论文讨论课。课程名为:Readings in Applied Data Science。要求学生每周阅读3~4篇论文,并给出反馈。

    赵钰莹 · 2018-06-10 19:33