【IT168 评论】人工智能的爆发同样带火了语音智能,作为人工智能的重要入口,语音识别也变得越来越重要。国内有京东与科大讯飞合作的叮咚,国际上有亚马逊主推的明星产品Echo,再到谷歌Master和百度小度的大战,这都在提醒我们越来越多的互联网公司准备开辟这一领域,越来越多的语音技术大厂正在迅速成长。
本文盘点了目前可查的互联网公司语音开放平台,不少互联网公司还都基于此推出了智能音视频设备,互联网公司比拼多年技术积累的时候到了,哪一款会成为国内的亚马逊Echo呢?
阿里巴巴
去年的云栖大会,阿里巴巴人工智能实验室负责人浅雪宣布AliGenie正式升级为语音开放平台。至此,BAT三巨头全部杀入语音交互专场。
所有的语音识别产品最重要的就是使用场景,必须经过充分的训练才可以达到理想的效果。阿里巴巴依托强大的电商平台自然不愁缺少使用场景。目前开放的AliGenie同样有面向企业和个人两个层级的开发平台。该平台可提供语音交互技术、自然语言处理能力、云服务系统、开发工具包、软硬件及量化标准。
为了鼓励开发者使用该平台,阿里人工智能实验室甚至针对热门排行的技能开发者提供现金奖励、流量扶持和商业化资源。基于AliGenie,阿里推出的最为熟知的产品就是天猫精灵。一句“我在,你说”曾经成为发布会的热搜关键词之一。
腾讯(腾讯云小微语音开放平台)
腾讯布局语音智能比阿里巴巴还要久,虽然腾讯的机器人Qrobot热度看起来似乎不及天猫精灵,但是腾讯在社交领域的地位同样为小微平台带来了巨大的使用场景和开发者。腾讯小微最特别的地方在于其集硬件、软件和服务机器人三位于一体的服务框架。开发者的接入成本比较低,但可直接在小微平台网站中设置Skill激活词、语言模型,通过云端模型训练,小微可以根据模式识别用户意图并完成相应功能。
小微最开始发布的时候就自带了一批合作伙伴,包括在人工智能方面已经取得了不错成绩的搜狗。
百度(DuerOS开放平台)
百度对人工智能的投入以及布局恐怕是BAT中最多的也是最早的。百度的人工智能实验室在语音智能、自动驾驶等各方面均有所努力。在最强大脑的赛场中,我们也曾经见过小度的实力。虽然小度战胜了人类选手,但这场比赛赛后引起了网友激烈的讨论。
部分观点认为小度依然是靠大数据和基础的自然语言理解能力构建的检索式机器人,并非推理式机器人,在特定的赛制下可以取得不错的效果,无法体现技术先进性。
部分观点认为小度的人脸识别能力和语音交互能力还是值得肯定的,百度多年在人工智能方面的技术积累在国内还是处于领先地位的。
如今,百度搭载自家DuerOS平台的智能视频音箱“小度在家”正式面向消费者推出。DuerOS开放平台同样面向企业和个人开发者两个群体,包括智能设备和技能两大开放平台,主要就是对外提供对话式人工智能的能力。
小米
小爱同学是小米公司首款人工智能(AI)音箱的唤醒词以及二次元人物形象,现在基本成为小米AI音箱的代名词了。不少用户认为小米智能音箱的性价比确实是极高的,但单论语音交互能力并不是最出色的,好在小爱同学连接的是整个小米智能生态,对智能家居生活的创建很有帮助。
笔者并未在小米的官网上发现语音开放平台的身影,但在小米开放云中发现了语音服务的功能,这意味着小米开放云可以提供智能语音服务。
搜狗
在此前的综艺中,搜狗汪仔圈粉无数。这款机器人是搜狗搜索语音机器人团队、清华大学天工智能研究院以及国际顶尖机器人实验室三者共同完成的智能答题机器人。在江苏卫视的《一站到底》节目中,这款机器人的表现算得上是出色的,一度被用户拿来与百度的小度机器人比较。
依靠强大的搜索平台,搜狗很早就迈入了语音智能开发之路。搜狗的语音智能开放平台早就被应用在搜狗输入法、搜狗语音助手和搜狗手机地图等各类应用中,支持的功能十分丰富。并在各类场景中得到了充分的训练。
京东
早在2016年,京东就发布了智能云语音服务开放平台,同时发布了搭载搭载AIUI智能语音识别系统的叮咚系列产品,AIUI并不是京东的智能云语音服务开放平台,而是科大讯飞研发的一套语音交互解决方案。
笔者并没有找到太多关于京东智能云语音服务开放平台的信息,只了解到这是一个基于家庭全景数据的服务分发平台。同时,京东对外开放叮咚开放平台,该平台可提供智能语音技术,但介绍中提到是基于成熟的讯飞智能云。
如果非要做出比较,不少用户认为搜狗汪仔在答题方面确实较百度小度更为聪明。小米的小爱同学在智能音箱方面比天猫精灵更为聪明。与这些业余军不同的是,中国也有不少语音识别大厂开放了其语音平台能力,这些平台的功能和准确度以及应用场景都和互联网公司不同,下一期笔者将盘点目前国内做得还不错的语音识别技术大厂。