本文写于两年前,一直是未公开状态,属内部交流使用,现在也换公司了,公开发布下。
一、相关公司介绍
1.科大讯飞
网址:http://www.iflytek.com/
公司:安徽科大讯飞信息科技股份有限公司
时间: 1999年12月
地点:安徽,合肥
状态:运营中
阶段:上市公司
行业:企业服务
子行业:行业解决方案
TAG:企业服务,行业解决方案,语音,输入法
简介:科大讯飞是知名的智能语音技术提供商,专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成,产品涵盖语音引擎、行业应用、教育产品、手机应用、互动音乐等多个领域。
2.云知声
网址:http://www.unisound.com/
公司:北京云知声信息技术有限公司
时间: 2012年6月
地点:北京,海淀区
状态:运营中
阶段:成长发展期
行业:移动互联网
子行业: B2D开发者服务
TAG: API , B2D开发者服务, BAAS , SDK ,人工智能,人机交互,开发工具,开发者服务,盛大系,移动互联网,语音
简介:云知声是一家专注于智能语音识别及语言处理技术的移动互联网公司,推出了一系列语音识别服务中间件和语音识别服务云平台,可广泛应用在移动互联网、智能家电、可穿戴设备、车载导航、医疗、教育、呼叫中心等领域,为企业和用户提供专业的语音识别服务。
二、公司融资情况
1.科大讯飞:已上市
2.云知声:
l种子天使2012年10月
1000万人民币
A轮2013年10月
1亿人民币;
启明创投、磐谷创投;
B轮2014年12月
5000万美元
高通投资(Qualcomm Ventures)、启明创投;
三、主要产品线
1.科大讯飞主要产品:
讯飞输入法:
产品介绍:iOS 8上唯一支持语音输入的第三方输入法,专为iPhone用户打造,无需越狱,即可安装!用户评分最高的手机输入法,超过1亿用户使用,智能手机装机必备。讯飞输入法,创造极致输入体验!
功能特色:
1.速度快:全新“蜂巢Ⅱ代”输入引擎,完美融合拼音、语音、手写输入,输入更智能;
2.输入准:内置百万超大词库,拼音云输入全面升级,准确率提升30%,速度翻倍;
3.更智能:支持语音、手写、拼音“云+端”输入自适应学习,使用越多,输入越方便!
灵犀:
产品介绍:灵犀,中国移动和科大讯飞联合推出的智能语音助手,更是国内首款支持粤语的语音助手!灵犀既能语音打电话、发短信、查天气、搜航班,还能查话费、查流量、买彩票、订彩铃,更可以陪你语音闲聊讲笑话!
功能特色:
1.如果您想偷懒,灵犀MM可以帮你打电话、发短信、定闹钟,是您的贴身小秘书;
2.如果您在路上,灵犀MM可以帮你查天气、查路线、查美食,是您的生活小导游;
3.如果您爱娱乐,灵犀MM可以帮你听音乐、订彩铃、下应用,是您的娱乐小主播;
4.如果您很无聊,灵犀MM可以陪你聊八卦、讲笑话、说新闻,是你的闲聊好朋友!
录音宝:
产品介绍:录音宝是由科大讯飞推出的手机录音软件,界面清爽,高清音质,支持精准定位、听声识人,操作非常简单,让您方便录、容易听!
功能特点:
1.无限时长:随时随地,现场录音不限时长,想录多久录多久,保存完整记录;
2.随时标记:录音过程中可随时标记,供您回听录音时精准定位,快速查找;
3.听声识人:以不同颜色自动区分多人对话,谁在说话,一目了然;
4.录音转文字:可将录音转换成文字显示,一键复制,方便整理;
5.文件导出:录音及文字可轻松导出,方便存储及使用;
6.一键分享:录音可分享至QQ、微信、朋友圈、微博等社交平台;
7.通话录音:支持大部分安卓手机双模双卡双向通话录音。
讯飞语点小V(车载蓝牙硬件):
产品介绍:作为科大讯飞重点打造的软硬件一体化产品,语点车载声控电话采用智能语音唤醒技术、高效的语音识别技术、流畅动听的语音合成技术,并结合先进的AEC(回声消除技术)和AES(噪声抑制技术),成就其卓越的通话音质。在行车过程中,全程采用语音操控的交互方式,无需触碰按钮即可拨打和接听电话;和手机连接后,自动同步通讯录,使用简单便捷,将为消费者带来前所未有的安全体验。
功能特色:
1、6个月超高续航时间,10小时长连续通话;
2、具有语音播发短信,APP智能应用等多种功能,还有贴心的隐私保护设计,在有私密来电时,可一键切回手机通话。
3、语点车载声控电话拥有蓝牙音频串流播放功能(A2DP),可智能播放手机音乐和导航指令,高清立体音质清晰悦耳,来电自动暂停,结束自动启动,为用户提供极致的娱乐体验。
产品不足:
1.不能主动中断通话,必须等对方挂断;
2.对车载环境识别有待改进,当在车门外来电话时,因为蓝牙还连着,所以默认是由车内小V接听,需要手动把蓝牙关闭,才能转到手机上。
3.喇叭声音较小,车内声音稍大一些,就听不到了;
4.只支持绑定的手机号,对于有多个号码的用户来说,没绑定的号码只能用手机接听。
5.目前的固件版本只支持普通话,不支持方言。
2.云知声主要产品:
语音魔方解决方案
产品介绍:语音魔方是智能语音交互的整体解决方案,让智能设备听懂用户的话,用户说话就能实现操作和控制;方案适用于智能电视、智能家居、车载、可穿戴设备;方案整合语音识别、语义理解、知识图谱等云知声核心技术,经过数年专业语音交互的积淀和几代产品的更新,倾心打造。
应用场景:车载环境、可穿戴设备、智能电视语音交互方案;
智能语音导航解决方案
产品介绍:1. IVR电话语音导航。通过将客户的自然语音进行转写和翻译,并通过基于自然语言的语义分析系统与企业IVR语音系统对接,为企业提供智能电话语音导航方案;用户只用轻松的说出想要的服务内容,就可以找到自助服务的入口,并完成自助服务。2.语音分析系统。语音分析系统将用户和坐席的连续通话录音转写成文字,通过事先建立的业务模型和业务规则对文本结果进行深入的数据挖掘。其中,可以对坐席的语音进行质检,保障业务的合规和完整性;对客户的语音可以进行大数据处理,了解客户的来电需求,挖掘用户潜在的商业机会。3.智能语音对话系统。该系统可以提供智能化的高级人机语音交互方案,通过对客户知识库系统的梳理,通过关键字匹配和建立对话模型等方式,最大限度的利用客户的知识库系统实现自助服务。该系统可以应用于智能客户领域,可以在网页客服,微信客户,电商客服中帮助降低成本,提高服务质量。4.手机语音导航系统。该系统基于公有云/私有云架构,为行业客户提供定制化的手机APP语音导航方案;通过智能语音导航改变传统的按键式自助服务,用户使用自然语音与系统交互,实现菜单扁平化,提升用户满意度,减轻人工服务压力,降低运营成本。
云知声语音输入法
产品介绍:云知声输入法是一款语音输入超准的手机输入法。让手机用户不再纠结于方寸键盘间频繁点选,用语音轻松输入文字。其语音识别反应快、识别准;针对噪音、口音、输入标点/数字、网络条件等进行了优化,让语音输入更有效、更实用。可实现在线和离线语音识别,并且能自由切换在线/离线引擎。来自云知声语音识别引擎的强大支持。你值得信赖!
功能特色:1.语音识别准:平均准确率超过93%;2.识别反应快:Wi-Fi或3G下几乎实时返回识别结果;3.语音输入快:每分钟轻松输入200-300字,非语音输入方式望尘莫及;4.不怕有口音:完美识别标准普通话及有口音的普通话;5.语音输入数字:可识别数字并输出适合的格式;6.抗噪声技术:在吵杂街道环境也可以顺畅输入;7.超省流量:输入100字只需要20-40kB流量,1M流量可输入2500字;8.自动加标点:智能引擎根据用户输入内容为用户添加必要的标点符号
语控精灵
产品介绍:语控精灵[1]是由北京云知声信息技术有限公司研发的一款语音软件。无需连接网络,通过语音即可操作手机功能,打电话给朋友,发短信给朋友,打开应用,开关手机功能。打电话、发短信、开应用随你语控;让手机随时随地听懂你。
功能特色:[1]通过点击桌面悬浮窗来快速启动语控操作;[2]通过贴近耳朵(需要有陀螺仪硬件支持,摇一摇快捷启动语控操作;[3]通过语音播报可以彻底释放手眼操作,提高操作安全性;[4]在联网状态下,可以通过语音输入短信内容,而且所占流量极小;[5]支持语言:普通话
四、所选产品
科大讯飞“灵犀语音助手”(Android v3.1.2099)
云知声“语控精灵”(Android V1.0.4)
入选理由:“灵犀”和“语控精灵”作为国内知名智能语音企业的明星产品,都嵌入了其各自的核心技术和资源,都有着庞大的用户群和良好的口碑,特别是在全语音控制方面。本次分析的目的在于剖析其核心功能和背后的语音识别技术,以及各自版本迭代、演变的情况,从而为**网语音识别产品提供借鉴和参考价值。对于语点小V,因为是蓝牙硬件产品,暂时没有相关的设备,所以只在产品介绍时列出其不足,等日后具备体验条件后再补充进去。
五、竞品分析
1.应用市场数据对比
1.1“灵犀”总下载量
可以看到灵犀在各大应用市场的下载量还是有很大差异的,这很有可能是和官方的发布渠道有关,可以看到,百度应用市场的下载量是最高的,达到3000多万。
1.2“语控精灵”总下载量
可以看到,语控精灵的下载量是百级别的,且应用发布渠道和力度都要比“灵犀”欠缺N个等级。这对于云知声这种知名智能语音企业来说,有点不可思议,于是笔者尝试联系了“语控精灵”的相关负责人,得到的答复是,语控精灵暂时以OEM合作为主,没进行市场推广,所以to C端的下载量就比较少了。
其实从从前面两张图就可以大致了解到两种语音识别产品的不同玩法,“灵犀”更偏向于To C端,在市场推广上下的工夫比较大,更何况有中移动这个“大户”在推进;而“语控精灵”更偏向于To B,走的是OEM的玩法。
1.3用户满意度
灵犀用户满意度:
语控精灵用户满意度:
如果仅从用户评分情况来看,在360的应用市场中,“灵犀”的用户平均评分为8.4,而“语控精灵”的用户平均评分为8.6,语控精灵貌似更胜一筹,但是考虑到两者巨大的下载量差异,“灵犀”8.4的评分,似乎更为不易。
1.4用户反馈意见
灵犀用户评论数:
语控精灵用户评论数:
有关评论数的情况如上图所示,截止至2015年8月20日,灵犀在360应用市场上的评论数达到2162个,语控精灵则是13个。笔者分别整理了这两个产品的用户评论,希望能从评论中找出用户对功能的关注点。首先在应用市场中摘出用户评论,然后将其粘贴到excel中,在excel中统计用户反馈的各种功能出现的频率,最后将挑选出出现频率较高的几个功能,整理成功能列表。如下图:
功能列表
用户关注次数
可以看到,除了核心功能外,用户对“期望型功能”的关注度也非常高,而灵犀走的是大而全的路子,各种生活中常用的“期望型功能”都比较多,这也是其用户满意度高的根本原因。
对于语控精灵,由于其用户评论数较少,不具备参考价值,所以此处略过。
2.产品定位及优势对比
2.功能特色对比
灵犀
语控精灵
从上表可以看出,灵犀作为一款老牌的To C端的产品,其功能很多,有些还是颇具特色的,其功能框架如下图所示:
可以看出,灵犀走的是“大而全”的路子,功能有很多,略显臃肿,这也和其自身的定位有关。“语音秘书”,顾名思义就是要囊括生活中方方面面。也恰恰是这个原因,使得很多功能显得没那么有必要,用户的使用频率也相对较低,而“语控精灵”,则主要做的是语音控制下的核心功能,使用场景较为频繁,且主打To B市场,很多功能应该也可以定制。下面我们就挑选出几个最常用的使用场景来对比下两款产品的功能实现过程。
3.常见场景功能对比
1.1打电话
l灵犀:
说出“手机联系人姓名”或者“电话号码”直接拨号
如:
–“打电话给张三”
–“帮我呼叫13999999999”
l语控精灵:
说出“手机联系人姓名”或“企业黄页”直接拨号
如:
–“打电话给尹星”
–“拨打中国移动客服电话”
1.2.发短信
灵犀:
说出“联系人姓名+短信内容”直接将短信写好并可选择“发送”或“取消”。
如:
–“发短信给李四,今天晚上请你吃饭”
语控精灵:
说出“联系人姓名+短信内容”直接将短信写好并可点击“发送”,如不想发送,不操作即可。如:
1.3.联系人
灵犀:
语音交互方式可以是,“发送联系人”、“查询联系人信息”、添加联系人。
如:
–“将张三的号码发给李四”就写好短信
–“查询张三的号码”就查询出张三的号码
–“新建联系人,张三,13999999999”就在手机中新增该联系人
语控精灵:
暂不支持。
1.4.设置提醒
灵犀:
语音“‘提醒’+时间+事情”,三者顺序可任意颠倒
如:
–“提醒我下午三点开会”,然后就会自动设置好明天下午三点的提醒;
语控精灵:
语音“‘提醒’+时间+事情”,如:
1.5.播报
灵犀:
播报格式可在“设置”中进行设置。
常见的播报方式如:
–来电播报:电话来了,灵犀提醒“你有电话来自张三”;
–短信朗读:新短信来了,灵犀朗读“你有短信来自张三,今晚请你吃饭”
语控精灵:
暂不支持。
1.6.查天气
灵犀:
直接说出“城市+天气”,也可以选择提问来查询。识别出天气后,会进行语音播报。
如:
–“查询北京天气”
–“广州的天气怎么样”
–“明天会不会下雨”
–“明天出门要带伞吗”
语控精灵:
直接说出“城市+天气”,也可以选择提问来查询。与灵犀不同的是,语控精灵不会播报天气内容。
1.7.地图搜索
灵犀:
直接说出“xxx的位置”,或通过询问路线来查询。
如:
–“东方广场的位置”
–“北京站怎么走”
–“广州天河广场在哪
此时系统会优先调用手机中的百度地图软件,然后进行目的地搜索。
语控精灵:
直接说出“xxx到xxx怎么走”,然后系统会调用百度地图,如果没手机没安装百度地图可以打开网页地图。
1.8.听新闻
灵犀:
直接说出“我要听新闻”或“播报新闻”即可自动播报最新的新闻资讯。
语控精灵:
直接说出“看新闻”,然后程序会自动调出最新的新闻资讯。
除了上述较为常见的使用场景外,两款语音识别产品还有一些其他功能,如:查缴话费、流量、讲笑话、音乐点歌、热门视频、小说推荐等,生活服务类的功能有很多,但因其使用场景比较冷门,用户使用频率比较低,在此不做进一步分析。
4.版本迭代演变过程
从上述更新日志可以看出,灵犀主要的版本迭代过程为:
→离线语音识别(2013.4)
→讲笑话(2013.5)
→小说阅读(2013.8)
→定时新闻播报(2013.9)V2.0
→声纹锁屏(2013.10)
→周边服务(2013.11)
→语音图片搜索(2013.12)
→来电防骚扰、音乐设为彩铃(2014.2)
→搜狐视频、天气预报起床闹铃(2014.4)
→点歌功能、设置隐私播报(2014.5)
→语音订购流量包(2014.6)
→语音唤醒、智能家居控制(2014.8)V3.0
→锁屏下智能语音开启应用(2014.11)V 3.0.1788
→带伞提醒、语音打开手电筒(2014.12)V3.0.1830
→电影购票(2015.3)v3.1.1909
→网页小游戏(2015.3)V3.1.1939
→移动用户积分商城兑换(2015.7)V3.1.2085
→购买演出门票(2015.8)v3.1.2099
由于功能的复杂性,暂时未找出其更新迭代的依据(如达到多少用户量,考虑做什么功能,用户量达到何种规模,可以做哪些新服务),笔者初步判断其各个版本的迭代过程应该是按照其项目的需求来添加的,做一个新项目,就把新的功能添加到产品中。
对于语控精灵来说,目前迭代的频率和次数都较低,不具备参考价值。
5.语音识别技术分析
调研科大讯飞语音识别核心技术专利,包括语音识别技术、语音合成技术、自然语音处理技术、语音测评技术、声纹识别技术,通过对技术专利的调研,确定哪些技术使得科大讯飞产品的识别率如此之高,并从技术方面窥探**网与之的差距,从而为**网后续产品的研发提供一些理论和技术依据。(由于时间关系,牵扯到200多份专利技术文档的整理归纳,初版的竞品分析暂且跳过这部分内容,日后再陆续加入)
六、商业模式
1.灵犀
按活跃用户分成:
后向运营分成:
对于“灵犀“形成的后向运营收入,双方按照谁拓展谁主要获益的原则进行分配。由甲方签署协议的,甲方将后向收益的30%支付给乙方;由乙方签署协议的,乙方将后向收益的30%支付给甲方。(这里的甲方和乙方分别指中移动和科大讯飞)
l灵犀带动的移动自由业务分成:
由“灵犀”产品带动的移动自有业务形成的收入,甲方按照“灵犀”带来业务收入的12.5%支付给乙方。具体结算和支付方式双方另行协商。(这里的甲方和乙方分别指中移动和科大讯飞)
l第三方合作佣金分成
灵犀可以实现订酒店、订车票、买电影票等生活服务,这里是采用第三方应用接入的方式,在灵犀上面达成的交易,会有第三方佣金分成。
2.语控精灵
主推To B市场,业务领域包括:智能电视方案、智能车载方案、音乐搜索方案、视频搜索方案、购物搜索方案、语音输入方案、音频转写方案、微信接入方案等,走OEM定制。
七、SWOT分析
分别分析科大讯飞的优势、劣势、机会和威胁,再将外部机会和威胁与企业内部优势和弱点进行匹配,形成四种不同类型的可行战略组合:优势——机会(SO)组合、弱势——机会(WO)组合、优势——威胁(ST)组合和弱势——威胁(WT)组合。
S优势(strength):
1.国际领先的语音核心技术优势;
2.牵头制定中文语音交互技术标准;
3.中文语音技术市场70%以上份额;
W弱势(weakness)
1.多语种语音技术和解决方案不足;
2.资金、管理和品牌等综合实力有明显差异
O机会(opportunity)
1.新兴应用的爆发增长和移动互联时代的想象力;
2.国家发展战略性新兴产业重大战略;
T威胁(threat)
1.国际IT巨头纷纷进入、国内竞争者不遗余力争夺市场;
2.核心技术的发展和应用、市场的推广和教育品牌的发展都需要一个时间过程;
八、总结与借鉴
总结上述两款产品的定位,一个是面向To C的语音门户,走的是大而全的路子;一个是面向To B的语音助手,走的是聚焦核心功能的路子。对于**网的产品,涉及到的产品线较广,有智能车载系统产品、有车载环境下的语音控制产品等,可能的路径有:1.智能车载系统走rom玩法,只铺设核心功能和平台,然后给开发者一个便捷的开发环境,聚焦于前装市场,先提高装机量;2.语音控制产品,主打前装,兼顾to C的用户体验,不做大而全的功能,也没有这个时间和精力,科大讯飞的灵犀前后迭代了将近5年的时间,我们的优势不在于此,我们可以更多的把资源投入到车载环境下的语音控制中,把核心功能和常见应用场景做到极致。
转载请注明出处。