一、产品概述
(1)体验环境
andriod版:华为P8,andriod 6.0,APP 版本:5.0.3005
ios版:iphone 6,ios 10.3.1,APP 版本:5.0.1791
(2)产品的概括
前几个版本的logo一直是中规中矩的设计(如下图),名字叫“灵犀语音助手”:
从5.0版本开始,名字更新为“咪咕灵犀”,logo及整个视觉风格都大变样,如下为新的logo和官网的界面截图:
笔者猜想有三个方面的考量:
一是要抱上“咪咕”这个统一的品牌,
二是原本是以“语音助手”作为主打,现在要结合智能语义识别,贴上“人工智能”的热点,连带着画风都转变成外星人ET(可能现在的小朋友都不知道这个梗了),
三是也许觉得主要目标人群都是一群宅基腐,中二病比较严重,所以这么中二的文案和风格(实际如何未做调研,但笔者本身是中二晚期,所以觉得还行,隔壁正常人瞅了一眼则回复了一个“不知所谓”的眼神)。
(3)产品定位
主要定位是将语音、语义识别、自然语义分析的技术应用到各类真实的生活场景中,目前支持语音播报、语音记录、翻译、语音小助理等功能,
美好愿景是改变用户文字输入输出的使用习惯,引导用户转移到更便捷、更符合人性本能的对话使用习惯上。
(4)用户需求分析
●A . 用户是谁——
笔者粗略分析,有两拨人是该产品的主要目标用户群,一类是手机重度用户,所谓的阿宅一族(非贬义词,而且这个队伍现在在不断壮大),会抱着手机对话、调戏siri和微软小娜,另一类则刚好相反,是相对不怎么会使用电子产品的人,基本可锁定为50岁以上妈妈辈用户,不排除一部分传统行业商务人士,微信聊天习惯发语音、使用手写输入法,面对种类繁多的APP(比如外卖、地图、点评、商旅)一时搞不定的。
●B . 用户特征——
针对笔者上面一条提到的第一类用户,因为已经有同类语音助手产品“珠玉在前”,并且有标杆外企(苹果和微软)的品牌加分,对识别的效率、语义理解的准确度都必然有苛刻的要求,而第二类用户,则更关注使用的方便程度和学习成本,即插即用、即点即说是其核心诉求。
●C . 目标用户的需求——
目前语音助手已成为人工智能的入口之争,但无论是中文还是英文都暂未有令人信服的产品出现,但语音输入比文字触键输入要更加符合使用便捷度,也更容易普及到更宽泛的年龄层(可参照智能电视的语音遥控器使用人群),另一方面,城市化之后人们社交的疏离感反而加剧,更容易接受人工智能的概念产物、甚至从中得到心灵慰藉。
●D . 解决方案——
在引导用户使用语音助手这一点上,咪咕灵犀把核心的功能显示在首页最顶上的三个按钮上,分别对应“提醒”、“速记”、“翻译”,这是目前语音助手或者说中文语音助手做的最成熟、用户接受度最高的三个应用场景,而智能小助手的功能则放在第二个tab,语音听书等则放在更深的第三个tab。只有当用户使用了锁屏唤醒功能的时候,会自动显示智能小助手的板块(这块目前还有些明显的bug,按下不表,后面专门展开讲),唤醒智能小助手之后能够使用搜索、地图、播放歌曲、餐厅评价等功能。整体看来,中规中矩,基本诉求都已经包括进去了。
●E . 用户使用场景——
一般来说,除了宅基腐的日常会专门来调戏语音助手、跟她对话以外,基本上多数人还是会在这几个情况下会用到语音助手:设置提醒(最好是有明星、cv加持或者自定义的声音),语音转文字记录,日常翻译,解放眼睛听新闻听电子书听FM,查询(地图上的地址输入,自从可以语音识别之后就没有手动打过那些奇怪的地名)。
(5)市场状况现状和分析
●A . 行业分析——
语音助手这一领域,10年前就一直鼓吹是下一个颠覆性应用,但直到今天也还在摸索中前行,最近一年内,不知是真的技术和市场累计到了质变的时候,还是资本市场在各种热点都大风刮过之后又嗅到了下一个可以聒噪一阵的话题,各大巨头纷纷布局,紧赶慢赶都推出了语音助手类产品,并基本都1+1搭载着硬件智能音箱,其中最为瞩目的如下:
●B . 产品数据——
咪咕灵犀是中国移动和科大讯飞联合推出的语音应用,科大讯飞在中文语音领域勤勤恳恳钻研技术的地位无人匹敌,中移动手握最大规模的手机用户,许是刚起步还未大面积推广的原因,单从APP数据上来看,并无亮点可言,在语音领域也暂未占有一席之地:
二、产品分析
(1)产品结构图
笔者认为是由于ios和andriod的开放程度和应用市场审核要求不同,造成产品结构和使用流程上ios版和andriod版有些许差别,为描述清晰,以下会分开具体分析。
ios版:
其中前4个分栏功能来自于科大讯飞,第5个分栏从上到下分别来自咪咕、携程、大众点评、高德、滴滴和魔百盒。
andriod版:
其中前4个分栏功能来自于科大讯飞,第5个分栏从上到下分别来自咪咕、携程、大众点评、高德、滴滴,智能家居的连接功能,目前支持一系列电视、电视盒子和海尔U+、broadlink以及科大讯飞的智能音箱。
(2)使用体感
由于咪咕灵犀语音助手的APP定位特殊性,造成整个APP呈现出功能点分散、每个细分功能点交互十分简单的形态,根据上一小节的结构图,笔者简单针对每个功能点进行了自测。
其中语音速记的准确率、翻译的准确度、语音小助手的理解力,都完全取决于科大讯飞的接口。根据报道中的试验数据,识别准确率可达97%,笔者实测了三段内容,第一段为普通文字、普通语速,第二段为普通文字、1.5倍速语速,第三段为文言选段、普通语速,识别和翻译效果都不错(介于选择文字段落的随机性,结果就不做贴图),总体看来andriod的识别效果明显优于苹果,但离脱离人工校对还有一段“最后一公里”的艰难历程要走。
“提醒”栏里的功能显得十分鸡肋,加之完全是机械女声播报,没有任何使用粘性。
“其他”栏里的前5个功能,完全来自于其他APP的H5页面嵌入,很显然是大而全功能的堆砌,体验十分不佳,也是UI方面问题集中区,后面会具体讲到。
“其他”栏里最后一个功能点,笔者反而认为应该是语音助手最核心的卖点,ios版中局限于电视盒子语音遥控器的功能,andriod版中通过另外下载插件的形式,支持多种智能设备的接入,但是两个系统下接入流程都不清晰,只有一个空页面,在手边没有设备的情况下让人十分困惑,并且根据笔者的了解,就算有设备待接入,也需要在配网之前让设备处于“可被发现”的状态,并未在APP这一板块看到任何说明和指引。
三、功能体验
虽然有中国移动、咪咕品牌和科大讯飞三者加持背书,同时在雷锋网、36氪等知名科技评论网站也能看到灵犀的发声,在笔者体验之初就有初始加分项,但仔细测试下来,仍轻易发现了不少待改进的地方,笔者努力归总整理出来供产品团队参考。
1、仅针对APP本身的问题,其他例如积分商城商品过少、机械女声感知太差、语义理解错误、响应速度等原罪问题不在本小节讨论范围内
2、“灵犀灵犀”唤醒功能,只有andriod版支持,要先自行设置声纹密码之后可通过直接喊“灵犀灵犀”唤醒程序,当然手机有锁屏密码的情况下也是不行的,本来这样的限制已经把很多场景阻挡在外了,笔者反复测试了多次,确定每次只能唤醒一次,并不能连续唤醒,也不支持自己设置唤醒口令,难以置信。。。
3、麦克风占用问题,正在使用唤醒或者播放功能的时候麦克风占用是能够理解的,但是整个唤醒功能待命的时候,麦克风一直处于占用状态,等于是其他语音类的应用都不能用,这个有点。。。
4、速记功能,因为目前中文的识别还是在97%的瓶颈,免不了人工的校准,如果加上一个录音回访的小功能,就完全媲美锤子最近发布的“闪念胶囊”了,现在这个会逼死强迫症,每次笔者都会忍不住去手动修改没识别出来的词或者断句不对的地方,反而比整句文字输入还要耗时。。。
5、即搜即听功能,首先搜到的歌曲都是网络歌曲排在前几位,没有做过排序,其次播放过程中自动锁屏就播放停止,非常突兀,再次正在播放的歌曲是没有进度条的。。。
6、导航功能,代表一大类适用驾驶场景的功能,全流程中并不能完全解放手和视线,比如到某地或者查找某地,需要用手在手机上确认地址,然后默认的地图打开,最后点开始导航。。。
7、智能家居板块,包括ios版的语音遥控器,没有任何操作指引,以笔者的玩荐经验,甚至怀疑能不能顺利的连接上。。。
8、UI上,有些页面简直用“可怕”来形容,比如下面这个:
四、如果我是PM
第一次接触到灵犀语音助手,是因为一直混的中抓圈里萌的格格(cv风华无双)给里面的灵犀电台配了一篇文章,格格在微博转出来的灵犀电台的H5页面死活打不开,为了听格格的配音只好下载了APP(已经不知道是为了格格下载的第多少个APP了,从YY到B站到M站到红豆),在灵犀电台里随意翻了翻,惊觉全部都是中抓圈的大神来录的节目,然后转战官微,发现最近的热点事件是举办了“最强声波灵犀新媒体主播大赛”,决赛的评委是季冠霖、阿杰和童自荣(此处要加一排!!!!!!!!!!!!!!,不清楚这几个名字的童鞋自行百度一下,你会发现新大陆的,trust me),作为追日抓cv到开始追中抓cv的小透明来说,真是要直接喊爸爸了。。。
不好意思,上面一段跑题了,克制,克制。
中国的互联网圈延续了国人扎堆的优良传统,在智能音箱上也一样前赴后继冒出了不少参赛者,资本市场的热情、消费者的冷遇,几家欢喜几家愁。
然而笔者坚持认为,催熟一个产业链不一定是坏事,并且中国移动+咪咕+科大讯飞的组合,运作得好完全有潜力搅动这一池春水:
1、中国移动的家庭宽带网争夺战策略中,把电视盒子和智能音箱作为标配预制进庞大的存量家庭用户——运营商强大的布局推广力,请参考宽带、手机卡和机顶盒在全国的存量,
2、咪咕相对独立的产品线整合能力完成智能家居品牌的接入,同时咪咕阅读已有和二次元千丝万缕的勾搭关系,cv和语音天然有契合点和粉丝群交集——有一个统一的品牌露出有多么重要,另外二次元真的是一片蓝海,请参考近期的全职高手代言麦当劳“那么大圆筒”案例,
3、语音识别领域的几大难题(空间距离、噪声、间断和口音)以及人工智能的语义分析,则交由专业的细分领域公司解决。智能硬件这一科技领域,运营商要摆好自己的正确位置,对产品参与过多容易跑偏,而没有运营商的入场,产业链也无法产生短期规模效应和全年龄覆盖效应。
最后,答应我,
不要和飞信搅在一起,科技的红尘滚滚向前,在车轮的碾压之下,不会容许历史的倒退。
以上。
时间及经验有限,未尽事宜、不当之处,欢迎拍砖。