大数据频道 频道

聚合大数据分析和应用玩家 他们搞啥?

  【IT168 资讯】近年来,大数据正日益成为国家基础性战略资源,蕴藏着巨大的潜力和能量。在国家层面,发展大数据已成为提升竞争力的战略选择;在经济层面,发展大数据已成为打造新动能的关键要素;在行业层面,发展大数据已成为驱动转型发展的重要引擎;推动大数据发展已成为从政府到民间、从行业组织到企业机构的社会共识。

  在这样的背景之下,2016年9月13-14日,国内独立第三方移动数据服务平台TalkingData主办的T112016暨TalkingData智能大数据峰会在北京中国大饭店召开。峰会以“智能数据生态”为主题,可见TalkingData正在通过企业聚合的方式,让越来越多做大数据分析和应用的玩家入场。

  的确,TalkingData带领众多玩家展示了移动大数据的魅力。并且公布了部分数据--其基于大数据分析、挖掘、应用的DaaS业务收入,已经占据其总营收的八成比重,公司已经盈利,并有足够现金流。随着大数据服务的变现,他们即将联合海外空间大数据与商业智能公司。他们还想这笔生意越做越大。

  联合海外伙伴,数据分析能力开放共享

  早前,TalkingData就以大数据经营为增值点的服务战略转型,通过与上下游企业合作,改变和创新了解市场的手段。在刚刚举办的T11峰会上,TalkingData宣布了其”海外技术战略”,即通过与国外优秀的数据分析型企业达成战略合作,将核心技术引入中国,以共赢的方式,拓展国内的大数据应用市场。对此,TalkingData过去一年来还成立了专门的海外基金,用于投资硅谷先进数据分析与算法的相关公司。 TalkingData首席战略官William Plumer在公开演讲中提出,要基于全球顶尖技术打造一个大数据平台,而目前对接的海外合作伙伴,囊括人工智能、商业智能,以及空间大数据分析等品类的公司。William认为,国内外提供大数据技术的公司将基于市场拓展需要和资本力量迅速走向整合,以客户需求为导向,共同直面大数据分析挖掘与应用的各项挑战,才是当务之急。

  TalkingData的海外创业公司伙伴如何玩转大数据价值?

  1.Sentience——基于机器学习的移动和驾驶行为画像网站:http://www.sentiance.com

聚合大数据分析和应用玩家 他们搞啥?

  Sentiance 要做的,是基于智能手机和移动可穿戴设备等的传感器数据,描绘出现实和实时的用户画像,服务于移动场景下的各种可想象和拓展的商业模型,这些丰富的用户画像,涵盖了对个体流动性、通勤特征以及驾驶模式等多样数据的建模和理解。 例如,各种方式的交通出行活动、个性化的移动画像,以及热力图,这些都将借用其平台的数据抽样和特征提取算法,生成一些对应的结构视图模型,如出行模型、用户高频造访地点的模型,抑或是常见轨迹等。 此外,现今的移动设备多内置加速计、陀螺仪等多样的运动传感器,结合这些数据,能够衍生出更多详细的、多层次的画像模型,如复杂驾驶行为的分析、驾驶员评估等,这些画像可以应用在驾驶安全管理、UBI车险评估、汽车维修方案预估,以及个性化的司机驾驶引导和辅助等等现代驾驶服务场景中。

  值得一提的是,类似的商业模式在国内也已经开始发端,并被认为是智能交通的未来场景下极富潜力的趋势型应用,而Sentiance的优势,在于多传感器的融合采集手段、优化的数据抽样算法,以及基于机器学习的建模和精准识别等。

  具体到技术和服务的提供上,可以总结如下。首先是通过专用的传感器融合平台,将实时环境感知的能力赋予B端客户,如DMP(Data-Management Platform,数据管理平台)、SME(Small and medium enterprises,中小企业信息平台),以及移动设备的应用开发者等。 这样的平台允许企业基于此绘制自己独特的用户行为画像,并向其中填充个性化的、可预测的情景感知服务。 Sentiance创立于2013年,成立之初即获得65万美元的种子轮融资。TalkingData的数据峰会上,Sentiance CTO通过视频表达对切入中国市场的期望和信心,他们希望借助TalkingData在中国广泛垂直的覆盖,推进其解决方案和情景感知平台的本地化落地。初期,他们将会把重点放在智能移动和保险业务中。

  2.PathSense:性能上精雕细琢的LBS服务网站:https://pathsense.com/

聚合大数据分析和应用玩家 他们搞啥?

  PathSense是坐标加利福尼亚的一个10人创业团队,他们致力于做传感器软件方面的专家。借助于SDK(三款面向安卓,一款面向IOS),他们试图使移动设备的定位更加精准、迅速,且耗电量低。值得一提的是,这其实是一个连续创业的故事,在PathSense之前,他们曾创立一家名为 “Trapster(电子狗)”的公司,但却因困扰于GPS的高耗电量难题而作罢。幸运的是这个问题终于在今天得到了很好的解决。 细化开来,他们的业务包括为企业提供系统到系统、网对网的软件服务,为移动设备提供地理围栏、动作识别和高GPS定位精度等技术支持。地理围栏,是目前基于移动设备的新型LBS技术,通过不断优化的定位算法描绘出虚拟的地理边界,并以此为基础拓展应用场景,如家人定位、基于位置的广告投放等,都需要地理围栏技术的辅助。 “打造中国最好的地理围栏”,这是PathSense在TalkingData数据大会提出的豪景,但这并非无据可依,在影响LBS技术的三大关键指标——定位速度、定位精度和耗电量上,PathSense用数据展示了自身的优势。 (1)定位速度和处理速度 PathSense展示的数据显示,其定位处理速度是谷歌的2倍,这就是说减少了一半的定位延迟。而在动作识别方面,其处理速度则达到谷歌的6倍,即只花5秒就可以监测到一个用户是否在开车,而这个数字对谷歌来说是30秒。 (2)定位精度,尤其是城市定位服务 定位精度方面,PathSense声称其在高楼林立的大城市里依然能够达到98%,比如纽约、旧金山和香港,而谷歌只能达到23%,苹果则是73%。 这个数据来源于他们基于多源数据优化的定位方案,即使用移动设备内置的诸如陀螺仪、加速计、磁力计和其他种类传感器,同时还结合路径预判的算法进行位置追踪。由于只在软件激活的一瞬间进行GPS定位,而不是持续使用,他们能将电池能耗降至很低的水平,而精度却往往更高。

  3.耗电量:如上面所介绍的,由于并非持续跟踪GPS信号,PathSense的耗电量仅为谷歌的40%。 能够看得出,PathSense的产品定位是对标谷歌和苹果的,但他们并不是想与巨头的服务保持一致,而是发挥小身材团队的巧劲儿,更专注于性能、精准度和电池效率的提升。 3.GraphSQL网站:http://www.graphsql.com/company/

聚合大数据分析和应用玩家 他们搞啥?

  GraphSQL的核心技术,是从散乱、复杂的数据中找到其所存在的内在关系,并最终以关系网络图表的方式呈现。

  这种数据挖掘与可视化的手段,让希望从海量数据中洞察关联,进而了解业务驱动因素的企业,提高他们的分析水平和效率。具体来说,GraphSQL适用于社交、兴趣推荐服务场景的大数据挖掘,有关时间、位置、行为、人际关系等由用户产生的数据,都可以借由GraphSQL挖掘有用的信息。

  GraphSQL创立于2012年,团队成员则来自Google、Teradata、IBM、SAP、Twiiter,还有大数据挖掘分析领域的各种学术界的专家。2013年企业获得了255万美元的种子投资,最新一笔未透露金额的融资发生在2016年2月。早在3年前,GraphSQL联合创始人靳若明就指出,图(Graph)数据挖掘于分析是一个重要的课题,其应用前景将十分可观。

  4.Treasure Data:对接众多大客户的商业智能工具网站:https://www.treasuredata.com/ Treasure Data提供的,是端到端、全面管理的大数据云服务,这样的模式是可靠而极简的。这家成立于2011年的创业公司,从一开始,就将产品和服务定义为覆盖数据采集、存储,以及分析的完整化平台服务,其收集多源数据,分门别类存储,并提炼数据的意义,以供商业决策。 不同于传统的云平台数据服务,Treasure Data的特点是革新了大数据分析的交付模式和技术,系统中的各个部分均是可定制化的。这意味着用户在将数据提交到另一个系统之前,不仅能看到数据并且可以进行分析,进而确保只发送那些相关性的数据。 自2011年成立之初,Treasure Data就获得280万美元的种子融资,而后财路平顺,至今累计获得7轮近5000万美元的融资总额。13年,Treasure Data创始人兼CEO Yoshikawa曾表示,Treasure Data其实并不需要筹集资金,当时他们已经拥有超80个客户,每天对7000亿行数据执行大约20万次的数据查询。典型的客户包括丰田、Facebook、雅虎和无印良品等。

  5.Dataiku网站:http://www.dataiku.com/solutions/

  Dataiku是一家致力于把堆积于企业的各类原始数据利用起来,并将其进行价值转化的商业智能服务公司。现阶段,Dataiku面向医疗健康、生物医药、零售与电商、金融与保险、公共事业、交通运输等领域提供不同种类的大数据挖掘与分析服务,例如历史数据的分析,数据管理,需求预测,客户分析等。与此同时,Dataiku还向特别针对具有地理空间属性的数据,提供空间大数据分析服务。

  Dataiku认为,尽管空间商业智能分析有着近百年的历史,但运用现代化的空间算法手段还是一个相对较新颖的领域,因而在现有的大数据服务当中,空间化的分析手段是非常重要的组成部分。

  创立于2013年2月的Dataiku公司,于2015年1月完成320万元A轮融资。在Dataiku团队看来,严肃的企业决策背后,是对更充满趣味性的数据挖掘与分析的探讨。

  6. Sisense

  网站:http://www.sisense.com/

  Sisense同样是一家将复杂的原始数据精益化,并通过图表、空间化数据表达等方式,为用户提供可视化分析服务的创业公司。Sisense的分析工具能嵌入到用户自己的软件中,挖掘业务分析所需要的数据,并做以展现。目前,Sisense的业务覆盖金融、政务、健康、零售、旅游等领域,已服务近50个国家和地区。 Sisense的历史可以追溯到2000年,其创办的初衷是希望让数据分析更简单流畅。在低调的技术沉淀过程中,Sisense有了自己的大数据分析与可视化引擎,并成功于2010年走向市场化,在纽约正式创办了商业公司。Sisense最近的一笔5000万美元D轮融资发生在2016年1月,公司建立至今,已累计筹得近1亿美元融资。 数据智能“四境界”——感知,识别,认知,预测 智能化,这是今天聊得最多的一个词。TalkingData CEO崔晓波在会上发表的演讲中,提到了基于数据的人工智能认识世界的“四境界”,他们分别是——感知,识别,认知,预测。 在崔晓波看来,感知、识别、认知、预测,将是大数据分析挖掘人工智能化的四个主要标志。接下来,企业产生的商业价值,以及人从大数据中挖掘中汲取的智慧,将与人工智能技术的发展,成正相关关系。

  感知,来自丰富移动设备所配备的各类传感器,这些传感器收集个体本身以及周边环境的信息,形成这种智能化的初级能力。数据显示,平均一部手机,就包含有13~16款内置传感器。识别,是在多品类的数据基础上所做的分类。今天,语音识别、图像识别,乃至个体姿态的识别,都在大规模发展。认知,无人驾驶汽车对复杂路况的判断、人工智能诊断病情,都属于认知的过程,但目前还处于一个早期阶段。而预测,还离我们有很远的距离。

  人们利用几十年的时间,让机器学习和标记,这使我们今天对各种各样的物体进行识别和理解。在崔晓波看来,不论人工智能未来到底有多聪明,一切都是源于数据的力量。

0
相关文章