大数据频道 频道

天云大数据出席第九届中国系统架构师大会

  【IT168 资讯】作为国内优异架构师盛会之一,2017中国系统架构师大会(SACC2017)10月19-21日在京拉开帷幕。大会以“云智未来”为主题,云集国内外优异专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。本届大会共设置两大主会场,18个技术专场,吸引来自互联网、金融、制造业、电商等多个领域,100余位技术专家及行业领袖出席峰会,天云大数据作为人工智能代表厂商出席本次大会,天云大数据副总裁李从武发表主题演讲。

  人工智能回到ABC

  李从武在演讲中提到,金融领域的科技实践已经从规则流程驱动转向智能数据驱动,即BI向AI的战略升级。无论是信用卡评分、信用卡风险评估、反欺诈,过去依赖的大多是规则流程,但面对大数据时代的新经济,大量的专家规则、资产数据和财务数据的权重不再突出,利用复杂性量化的机器学习可以帮助我们在商业实施当中抽象内容,在不能清晰定义欺诈现象的前提之下,一样能够通过数据分析把风险或欺诈动态实时发现。

  详细来说,算法方面(Algorithm),传统数据分析平台无法支持前沿的机器学习算法,而现在面向企业级应用要处理的亿级数据,需要底层强大的计算能力,传统的逻辑回归、决策树需要借助新型算法具有较大提升从而提高模型性能。

  数据层面(Big data),传统的金融行业如银行等每天产生大量的数据,这些沉淀下来的历史数据对于未来的风控有直接的指导意义。但对于数据的管理和应用传统的数仓都有一定的限制。数仓需要经过ETL等步骤才能将数据上收,因此难以使用实时数据进行建模。此外,数仓不支持在线扩容,数据越来越快的产生,数仓在扩容时需要较长的宕机时间,降低生产效率。利用hadoop生态组件存储数据,不仅可以在线扩容,而且可以实现在线数据建模,使模型能够反映当下的情况。因此特别适合千万量级以上的数据治理和分析场景。

  算力方面(Cloud computing),传统的数据挖掘平台如SAS等,通常是在单一计算机上做抽样离线训练,随着数据量的加大,很快达到计算瓶颈。抽样数据无法反映全量数据的真实特性,离线的历史数据也难以反映当前的新情况。通过spark分布式内存计算框架,可以对全量的在线数据进行建模。不仅全面的反映了数据特性,而且也能在模型上反映新出现的情况,使模型不断自我学习迭代升级。这都由于强大的计算能力大大缩短了建模周期。以银行为例,以往建模大约需要几周的时间,但现在同等的条件下,只需要几小时甚至几十分钟。计算能力的提升使得传统的建模调参变为用数据选择模型,将所有相关算法运行一遍,找到效果较好的,再进行调参优化。在调参时还可以设置超参数选项,实现一次操作建立多个模型,从而找到调参的方向,方便调参。

  天云大数据Maxim AI 支持Fintech从BI——AI升级

  人工智能的核心要素不光要有算法,还需要有数据,更重要的还需要有算例,三者有效融合,才能够创造实实在在的应用环境。A(Algorithm)、B(Bigdata)、C(Cloud computing)的有效融合提交成为AI商业推广与工程化实施的关键。三者的融合,使得无需掌握太多前沿知识范畴即可实验深度学习。Maxim AI 即是天云大数据推出的AI产业化产品,通过AI的PaaS化,使得以前没有用过AI的团队也可以快速进入这个领域,以前使用传统SAS的数据挖掘平台可以更高效规模化的使用,把计算能力和数据科学能力融合在一起,面向业务定义快速生产AI的流水线。

  举例来说,天云大数据在近期与某大型股份制商业银行的合作中,银行以信用卡风险管控为代表的新型业务决策模式,对该行原有数据挖掘平台提出新的需求:

  1、数据快速决策时效性要求;

  2、多样性的海量数据处理与运用(如:外部征信数据、内部行为数据等);

  3、可控成本的全量数据建模。

  传统的数据挖掘建模模型算法都是采用单机机器进行,处理能力有限,速度比较慢。采用天云大数据的挖掘建模平台Maxim AI,实现算法分布式运行处理,可以快速运行算法,从而大大加快了本项目的模型算法孵化进程。Maxim AI提供AI模型训练的全生命周期管理,降低了模型训练所需周期,提升模型训练效率,从基础数据选择、数据解析、模型算法选择、模型训练、模型效果评估、模型优化到模型发布全流程的图形化界面操作,改变了原有模型训练业务多系统人员参与的模式,每年减少千万级IT投入。

  Maxim AI目前支持多种前沿的分类和回归算法,如随机森林,梯度提升,深度学习等算法。前沿算法的应用可以较大的提升模型的性能。除此之外,通过复杂网络构建社交关系网络,从而得到网络特征实现升维,可以表达出以前无法表达的高维关系特征。对于许多金融场景如反欺诈等有着很好的模型提升效果。在某历史项目中,欺诈的识别率由原先的30%提升到90%。MaximAI平台不仅支持freecoding的免代码开发模式也支持开放的订阅模式,用户看到好的算法,可以直接放到平台上运行。

  天云大数据作为国内知名能够同时提供分布式计算平台产品和AI平台基础设施的科技厂商,在2017年6月《银行卡产业发展蓝皮书》中,作为唯一Fintech产业合作方被推荐引用。拥有博士后工作站和优异高新企业称号,并于2016首批进入中关村前沿科技企业重点计划。

  公司在分布式计算领域有自主产品,填补了联机事务等领域空白,并在多个大型银行核心交易系统部署验证。在人工智能方向领先于BAT发布了分布式AI平台,于2016年在大型股份制银行落地。该平台与科大讯飞一起获得了北美ZDnet评选的十大AI赋能平台奖项。

  凭借分布式AI能力,天云自2016开始为金融机构提供数据模型深入信用风险欺诈等金融业务领域,为人行光大兴业银联等提供信用业务相关计算与数据科学模型,由此获得国际一线机构KPMG评定的中国Fintech50强,亚太Asset财经评选的TrippleA金融科技领先奖,财视的Fintech30强金融科技介莆奖,与蚂蚁金服京东金融等同列的先进金融科技企业。

1
相关文章