大数据频道 频道

陈军: 日志易就是要做中国的Splunk

  【IT168 评论】陈军,日志易CEO。笔者这些年采访的众多CEO中比较特别的一个,70后创业者,大器晚成,虽然直至不惑之年才开始走上创业之旅,但丰富的工作经验与人生阅历让他比起一些年轻的创业者要稳重不少。

陈军: 日志易就是要做中国的Splunk

  接受采访时,他并无CEO的架子,并不回避笔者尖锐的问题,回答简洁而直率,不像有些被访的CEO,只要一开口满满的套路不说,滔滔不绝还收不住。

  他的创业故事并不玄幻,标准的海归归国锻炼再创业。在访谈中,陈军针对IT运维分析,深入阐述了自己的理解和观点。日志数据的背后又到底隐藏哪些价值?

  16年积累,诞生日志易

  陈军的母亲是广东海洋大学计算机教授,受家庭环境的熏陶,陈军6岁开始玩旧式计算机打孔纸卡, 14岁用Basic语言编程。大学毕业后,因为当时国内计算机并未形成产业,IT工程师并非如今这么吃香,因此,陈军又留学美国南加州大学继续攻读计算机硕士。之后,在硅谷征战互联网行业11年,曾先后就职于Cisco、Google,主攻网络和搜索技术。

  2009年,一个越洋猎头电话让陈军结束了在谷歌每天爬取100亿张网页的硅谷式生活,回国并加入了腾讯,当时腾讯给陈军的职级是T4.3,比这个职级更高的只有T5,当时腾讯内部只有两个T5。在腾讯,陈军做过云计算和搜索,后来又被挖到高德地图当过技术副总裁。

  之前的16年的工作经历让陈军对运维人员工作中的痛点有深刻的理解,2014年初,陈军创办“日志易”,并担任CEO,同年3月获得了徐小平真格基金等投资者1400万元的投资,2015年12月获得红杉资本投资的6000万A轮融资。近期,日志易还获得了中关村前沿项目500万资金支持。

  对于资本,陈军表示,创业就像一个人穿越沙漠,资本就是随身携带的水。必须知道走到哪一点融到钱,太多没必要,太少可能会渴死。目前日志易不缺钱,账上现金还有还有五千多万,重点还是不断迭代完善产品,把业务做好,服务好客户。

  立足日志分析,做中国的Splunk

  日志易是一个强大灵活的日志管理分析工具,主要用于对日志进行集中采集和实时索引,并提供搜索、分析、可视化和监控告警等功能,使用场景主要是IT运维监控、业务分析、安全审计。

  日志易对标的是Splunk,Splunk是全球先进家上市的大数据公司,核心产品也是用于日志分析,目前市值80亿美元。陈军曾在多个场合直言不讳的表示,日志易就是要做中国的Splunk。

  对标Splunk说起来很容易,但实际上却有着非常高的技术门槛,如实时搜索引擎;这也是为什么Splunk火了这么多年,但在国内对标它的公司却极少的原因。

  众所周知,普通搜索引擎,如Google、百度,使用的是批处理技术,新闻搜索是最快的,也只能搜出15分钟之前的内容。而日志易的搜索引擎是实时搜索,使用的是流式处理技术,日志从产生到搜索分析出结果也就几秒钟的延迟,其次是处理量大,日志易可以每秒处理200万条日志数据,检索1000亿条数据只需要60秒,陈军自豪的说。目前,日志易已申请12项日志处理方面的技术发明专利。

  在谈到如何与Splunk在中国竞争时,陈军表示,日志易与Splunk没有区别,起码在用户需要的核心功能上是没有差别的。但日志易在北京、深圳均有开发团队,在北京、上海、广州、深圳、南京、成都有技术支持工程师,可以快速为用户提供定制化服务及适合中国用户的功能,百分之百满足用户的需求。而Splunk做不到,Splunk在中国只有售前,没有原厂售后。另一方面,作为本土创业公司,日志易在价格上有很大优势。

  目前,日志易对外提供有两种模式,分别是针对大中型企业内数据中心(私有云)部署的企业版,及针对小企业的(公有云)SaaS版。据陈军透露,目前日志易SaaS版签约客户已经有数千家,而私有云部署版则已达到上百个,其中不乏中国移动,国家电网,小米,乐视,通用汽车,格力电器等知名企业。

  日志易与APM的区别

  之所以在这里要特别提到APM,是因为日志易与众多APM工具的作用相仿,容易让人混淆,很多人可能搞不清楚它们的区别,因为两者都可以用于监控应用组件性能,实现如交易笔数、交易成功率、交易响应时间、交易响应率等指标的统计,都具有业务关联交易追踪功能。

  日志易与APM的区别在于它们使用的数据源不同,这里不得不提下IT运维分析(IT Operation Analytics, ITOA),相比非常成熟的IT运维管理(IT Operation Management),ITOA是近年兴起的概念,把大数据技术应用于分析IT运维产生的海量数据。

  ITOA的数据来源主要有四类:一类是机器数据。其实就是日志,服务器、网络设备源源不断会产生日志。第二类是通信数据,通过网络抓包做流量分析的数据,市面上也有不少这样的产品。第三是代理数据,这种用的不多,就是在.NET/Java字节码里插入代码来做统计分析用。还有一种就是探针数据,就是在全国各地模拟布点,发起模拟的用户请求,对系统进行检测。

  国内的主流APM数据源以代理数据和探针数据为主,代理数据,通过插入代码获取,好处是可以进行代码级精细监控,但是它的弱点就是具有侵入性的,因为每次执行它的代码都会执行插入的代码。除了安全跟可靠性的问题,还会带来了性能的损耗。探针数据是一个模拟用户的请求,可以实现端到端的监控,但它不是真实用户的度量。

  陈军最后表示,日志易与APM并不冲突,可以相互补充,APM系统为日志易提供日志所无法提供的网络性能数据,通过相互融合,为用户提供更全面、准确的应用性能监控及网络性能监控。

0
相关文章