2016年语音交互行业关键词:向巨头学习、差异化竞争、注重商业模式

[ 导读 ] 本文以语音公司巨头科大讯飞、语音行业领域方案提供商思必驰、语音产品型公司出门问问、语音大数据分析公司普强信息为例,剖析基于语音技术的不同发展路径公司过去一年的表现。

图片来自“123rf.com.cn”

2016年已经到尾声了,语音交互行业不仅在语音识别、降噪、声纹技术上有很大的突破,在语音产品商业化也有很多尝试和落地,在用户教育层面也不遗余力,一年过去了,以语音巨头科大讯飞引领着技术的突破,而垂直化的商业应用公司也不断冒出,推进市场化成熟。

这个年终盘点分为四个案例讲述,第一是语音巨头科大讯飞,科大讯飞是技术和财务透露最完整的语音公司,文中罗列科大讯飞2016年最大的技术突破及新产品,这能够代表行业最高的水平,通过科大讯飞的财报分析也能够窥探语音产品的商业化可行之路。第二是思必驰、第三是出门问问、第四是普强信息。

科大讯飞2016年的技术突破

科大讯飞公司在以“从能听会说到能理解会思考”为目标的讯飞超脑项目上持续加大投入,在感知智能、认知智能以及感知智能与认知智能的深度结合等领域均取得显著的研究成果,这也代表中国的语音技术的最高水平。

1、感知智能领域

语音合成:实现了全新基于深度学习的语音合成系统,进一步显著提升合成语音的自然度和表现力。

语音识别:针对人与人之间自由交谈、会议演讲等场景,语音实时转写通用正确率继续提升,是业界唯一能够在实际应用场景中达到实用门槛的中文语音转写。

2、认知智能领域

机器翻译:研发了新一代神经网络机器翻译引擎,翻译效果在旅游、新闻、演讲等场景有明显提升;维汉口语翻译在真实场景效果实现突破。

机器阅读理解:机器阅读理解效果是人工智能在自然语言理解和联想推理方面的研究水平重要体现。在全球竞争激烈的英文机器阅读理解任务上,首创性提出新技术框架并取得最好测试效果;在中文方面,业界首个发布中文阅读理解测试集,引领中文认知智能研究方向。

常识推理:获得国际著名的常识推理比赛Winograd Schema Challenge 2016的第一名成绩,该任务是国际常识推理领域的新型评测任务,被学术界普遍认为是替代图灵测试衡量机器智能水平的重要学术挑战。

3、感知智能+认知智能

语音交互:通过语音识别和语义理解在底层的深入融合,研制完成可量产的支持远场识别、全双工、多轮交互、方言识别等特性的 AIUI 产品方案,提升了人机语音交互的成功率和人机交互开发的便捷性,是未来智能汽车、智能家居、智能机器人的关键核心技术。

机器评测:通过图像识别和语义理解深入融合,进一步优化了试卷、作业扫描识别和评测的准确度,实现了机器对填空、翻译、问答、中英文作文等在内的文科主观题型机器自动评分。

科大讯飞财报显示:2016年上半年度报告显示营收有14.62亿元,对比上年同期10.39亿元,同比增长40.7%,归属上市股东净利润2.56亿元,对比上年同期净利润1.43亿元,同比增长78.97%

主营业务收入

1)语音支撑软件及产品:语音支撑软件及产品包括自行开发研制,采用授权许可方式向各行业语音应用开发商提供的语音核心技术产品,以及依据公司研发成果为客户提供个性化定制开发服务。

2)教育行业产品和服务

教育行业产品和服务收入包括教育产品和服务收入及教学业务收入。

教育产品和服务收入系指公司基于人工智能核心技术,在智慧教育领域中提供的产品销售、技术开发及服务收入。

教育教学收入是指公司根据协议规定向其服务对象提供服务取得的收入,包括学费收入、住宿收入等。

3)互联网产品和增值运营

互联网产品和增值运营系指面向移动互联网的用户提供智能语音产品及提供以智能语音为特色的应用服务和整体解决方案收入。

其中语音电信增值业务具体指由公司提供软、硬件设备,中国联通、中国移动等电信运营商提供通信网络和客户资源的合作业务,双方按协议约定比例对取得的语音通话话费收入进行分成。

语音电信增值业务服务:公司每月根据电信运营商的计时系统统计数据,依合同约定费率、分成比例计算确认收入。

4)IFLYTEK—C3

IFLYTEK—C3业务收入主要系指公司面对公共安全及智慧城市行业的应用收入。公司在与交易相关的经济利益能够流入企业。

5)大数据产品和服务

大数据产品和服务收入主要系指基于大数据技术对移动通信数据分析应用产品、服务及数据平台广告服务收入。

移动通信数据分析应用服务:公司在提供劳务的结果能够可靠估计,与交易相关的价款能够流入企业 时,根据合同规定的技术服务内容、服务期间及合同总金额,按提供技术服务进度及服务期间确认收入。

数据平台广告服务:公司按照提供服务的方式,面向不特定的客户,通过平台终端登陆双方指定的程序,按照广告显示次数或者按照点击次数计费确认收入。

6)系统集成

此类收入包括智能化系统收入、智能化工程收入及音视频监控的产品销售收入和技术服务与维护收入。

①智能化系统收入包括外购商品、自行开发软件产品的销售和安装。

②智能化工程收入

③音视频监控收入

④技术服务与维护收入

技术服务与维护主要是指根据合同规定向用户提供的服务,包括系统维护、技术与应用咨询、产品升级等。

在2016年11月23日的科大讯飞发布会上,科大讯飞首发了几款产品,这几款产品将成为2017年度科大讯飞发力市场的产品。

1、讯飞听见。在实时中文语音转写的基础上,融合全新的多语种翻译技术,实时将中文演讲翻译成英语、日语、韩语,维吾尔语并同步展示在大屏幕上。

2、讯飞快听APP。通过打造个性化音库,为用户提供个性化语音合成服务,能随时随地朗读任何文章;配音阁,致力于为用户提供智能语音合成、真人配音及各种特色化、个性化配音服务。

3、飞鱼助理。汽车智能车载系统,实现在车载环境下通过语音实现全程控制。

4、晓译翻译机。基于科大讯飞中英口语翻译技术,快速、准确地实现了中英口语的即时互译。

5、在智能家居方面,科大讯飞以超脑魔盒为入口,打造了一个通过语音便捷控制家居设备的智能环境。

6、在智能机器人应用领域,科大讯飞全球正式首发了完全自主产权的智能客服机器人---晓曼,晓曼机器人是科大讯飞在机器人领域的集大成者。在政府、金融、运营商、医疗等多个领域具有广阔应用场景。

7、在教育领域,科大讯飞以机器自动阅卷技术为切入点,实现多维度教学发展行评价和基于知识点的学生个性化学习。

8、万物互联输入法可提供在远场、移动、无屏输入场景下便捷流畅的智能化输入交互。

科大讯飞代表的技术突破也是全行业的技术突破,科大讯飞的商业探索也代表着全行业的商业落地探索,科大讯飞从数据收集到语音产品输出整个链条、多行业涉及,如何跟巨头分食市场成为创业型公司的必须思考的问题。

在跟企业负责人交流过程中,共同的特征有几个:①专注某个刚需型领域,足够垂直,而不是全行业;②选择市场化程度比较高的领域,适当的股权、战略合作;③选择做自己擅长的事情(产品、营销、技术等)。

思必驰--语音行业领域方案提供商

思必驰定位是国内专注智能硬件领域的语音企业,目前专注在智能车载、智能家居、智能机器人三个垂直领域提供自然语言交互方案。拥有语音识别、语音合成、语音识别++、语义理解、智能对话等核心技术,并推出AIOS对话操作系统(纯软件解决方案)、环形“6+1”远场麦克风阵列(软硬一体化解决方案)、线性4麦阵列等完备的整套方案。

笔者曾经采访过思必驰首席科学家兼上海交大教授俞凯,他认为思必驰定位是一个技术型的平台(语音行业领域方案提供商),目前专注于三个垂直领域提供自然语言交互的方案,在这三个领域成熟的时候会延伸到其他更多的领域。

思必驰CMO龙梦竹对2016年思必驰的营收情况分析,智能车载场景下的语音产品营收占大头,智能机器人语音产品增速最快,营收体量最小,智能车载语音产品量大,成熟,增速较平稳,而她分析2017年最大的产品增速将来自智能家居,智能家居会是继智能车载成为一个强刚需入口,而她预测智能机器人由于产品技术尚不成熟、产品售价高仍然不会有很大的出货量。

在产品更新方面,罗列一下

在2016年10月24日,思必驰发布升级版的AIO3.1,新增的one-shot功能。特点是识别唤醒与语义理解一体化,保证语音交互的统一性与连贯性,完成操控。

在2016年7月20日,思必驰展示了AIOS3.0升级功能及麦克风阵列方案,还首发提出了VUI语音交互界面概念,新增七大功能(导航中的快捷交互、跨领域打断、合成音切换、音乐中的快捷交互、微信及微信地图接人、自定义唤醒词、路况及限行查询)

出门问问--语音产品型公司

出门问问定位是一家努力将人工智能技术落地到消费产品、定义下一代人机交互方式的公司,创始人是前谷歌科学家李志飞。

2015年6月,出门问问发布了纯圆智能手表 Ticwatch,搭载自主研发的 Ticwear 操作系统,2015年12月,出门问问发布 Ticwatch 缎金版。

2016年6月,出门问问推出搭载 Ticwear 4.0 智能手表操作系统的问问手表 Ticwatch 2、可穿戴移动支付 Ticpay、首款智能车载后视镜问问魔镜 Ticmirror 以及 ADAS 高级驾驶辅助系统问问魔眼 Ticeye,至此,出门问问“软硬结合”的人工智能产品化道路愈加清晰。

2016年1月26日,出门问问发布“问问应用商店”,与 Android Wear一起打造可穿戴生态圈。

出门问问在 2016 年 6 月 17 日宣布历经 13 天的 Ticwatch 2 京东众筹终于以超过 1500 万人民币的成绩收官!出门问问的成功是在智能手表的基础上,融入了语音交互,让产品升维,而互联网平台又为这种创新提供了一个爆发的销售平台,在语音手表足够垂直和细分的领域,李志飞的专注和创新的让出门问问手表走出了中国,走向国际。

想比起语音基础研究和语音方案提供公司,出门问问更擅长产品集成和品牌打造,因此这种差异化让出门问问在前端的客户认同与认知上增色不少,也便于新产品的铺路。

普强信息--语音大数据分析公司

普强信息是一家以智能语音识别和语言处理技术产业化为主要发展方向的公司,成立于2009年,拥有两款产品,包括“千语千寻”语音识别引擎和“千语千寻”360语音分析系统。

产品的核心原理是将运营中心座席与客户的对话实时接入“千语千寻”系统的算法和模型,不仅能将不同地域口音的来电转换成文字,还能根据不同的系统用户需求,标注出关键用词。借助普强“千语千寻”360度语音分析系统,对联络中心庞大的客户对话录音内容进行全面质检和挖掘分析,感知客户情感倾向,建立客户满意度评测模型和外呼实践知识应用管理体系。

语音大数据是在企业经营活动中产生的个人与企业通过语音交互所产生的音频信息资源,广泛存在于金融、保险、移动互联网、互联网等业务系统当中,如客户服务系统、呼叫中心。这些语音数据中包含着客户需求、投诉、满意度、建议、竞争性情报等大量的有价值的信息,根据业务需求挖掘语音数据信息,使其符合业务系统的要求;挖掘潜在客户需求,客户行为标签,进而产生商业价值,是语音大数据研究和应用的关键。

普强信息CEO何国涛在硅谷语音及通信产品领域拥有愈20年的研究、开发和管理经验。他认为作为创业型企业应该时刻考虑产品商业化的问题,在国内,生活场景的语音数据掌握在腾讯和百度手里,语音交互是搜索的一个入口,所以BAT对语音的争夺其实就是对搜索入口的争夺,作为创业型公司要做产品和盈利,以车载语音前装市场为例,行业进入门槛高于技术门槛,其次,智能车机对于语音模块要求本地化,这意味这语音模块要以DSP芯片形式落地,将产品思维从售卖语音调用入口改为售卖语音芯片。

2016年即将过去,期待2017年,语音交互行业的大爆发。

作者精品系列:

云丁科技发布家用智能门锁品牌“鹿客”,宣布11月已完成B+轮融资

赵京雷:阅面科技更注重商业化落地,研究型AI公司烧钱无底洞

速感科技陈震:技术算法不能成为永久的壁垒,创始人要思想“换胎”

 
®关于本站文章™ | 若非注明原创,默认 均为网友分享文章,如有侵权,请联系我们™
㊣ 本文永久链接: 2016年语音交互行业关键词:向巨头学习、差异化竞争、注重商业模式