老罗发布锤子M1的时候,科大讯飞也跟着出名了。一时间出现了好多人跟着说讯飞输入法好,好在哪里呢?语音识别率高,高达97%。
我不知道讯飞输入法和当前一些主流输入法的具体差别。至少我这麻木感的大脑没感觉到太明显的差距。至于语音识别这等高科技的东西,感觉微信语音正确转化率就挺高的。
所谓的把语音转化为文字再发出去,我想有语音消息,为什么要识别转发文字呢?可能和之前挺火的鸡汤文"不要微信给我发语音"有关吧。
其实,我也挺赞同那篇鸡汤的,感觉句句戳到聊天中的痛点。什么"口齿不清,不方便听,听语音没有阅读文字快,语音不能保存转发……"仿佛这一切都催生着一个伟大的工具诞生解决这个痛点。
嗯,我也是这样认为的。
前几天,很困,眼睛疼,脑子里有一些好的灵感段子。我就突然想到了这个大火的技术,打开便签,计划用语音转化文字记录下来。刚开口就满心的尴尬,于是弃之睡觉。
后来才发现在这篇文之前,语音识别这个功能就已经早早的应用在了输入法里了,只是很少被高频使用。是识别率不高?识别速度慢?后来看了一下主流输入法的语音识别报告,在2015年的时候技术就和现在的水平相差无几了。
后来我想文字和语音到底有什么区别呢?
文字:承载语言的符号和图像,交流信息的工具。
属性上:文字在语言学中指书面语的视觉形式。在日常生活中,突破口语的时间和空间限制。人类可以在书面语的基础上完整地传承人类的智慧和精神财富,使人类能够完善教育体系,提高自己的智慧,发展科学技术,进入文明社会。
简言之就是文字是视觉符号,可以跨越空间和时间,用来记录和交流的载体。
语音:语音,即语言的物质外壳,是语言符号系统的载体。它由人的发音器官发出,负载着一定的语言意义,目的是用来进行社会交际的声音。
辩析:人类长期只有口语,系统的语言成为人和禽兽分离的重要工具,文字使人类能进入有历史记录的文明社会。把时空的影像变化转码成视觉可见的符号系统,使后人能通过间接的文字想象出画面,了解历史和学习技术经验,使文字成为文化的主要载体。
在语言的形、音、义三个基本属性当中,语音是第一属性,人类的语言首先是以语音的形式形成,世界上有无文字的语言,但没有无语音的语言。
看了一堆晦涩难懂的定义理论,才定义出:文字是跨越时间和空间的语言交流的载体,语音是社会交际的语言系统载体。
交际是二人或者二人以上之间在特定场合发生的语言,行为的社交活动。而交流是一种通过语言沟通,信息流通的过程。
所以当我打算记录一些想法和思想用语音的时候就会莫名的尴尬。有一种自己和自己交际的尴尬感觉。
而用文字记录的时候,交流是不需要立刻有交流对象的,这种交流是可以跨越时间和空间的思想交流。
查阅了一些语言学理论知识困的睡着了。梦见出现了一种意识转化文字的工具,达到了所思即所写的水平。在那一天,文字工作者们可以解放双手,随时随地记录灵感片羽。