我们每天都在和输入法打交道,老爸老妈用手写,速录大神用亚伟,但大中小学生和职场同事们多数用的还是各种拼音输入法吧,本文给出的建议,有可能帮助不少日输入量5000字以上的同胞将输入效率提升50%...以上,敬请关注。
据我观察,包括我家领导和办公室同仁在内的多数人使用输入法简单粗暴:下载-默认安装-使用,集中注意力写材料或者聊天的时候,每分钟输入速度在40-60来个字不等
我给个方子,简称ABC,三步走,对于我们这样的非速录专业人员来说,同样的指法熟练程度和敲键频率下,提高到80-100来个字/分钟,还是没啥问题的。
A:AI。1、选好工具提升10%,输入法智能化程度越来越高,按字按词输入的方式已经落伍,应该选用对整句输入支持更好的输入法。我最早使用微软拼音,后来试过英库、谷歌、QQ、百度等等,后来停在了搜狗,原因后面再说。现在几乎所有拼音输入法都支持整句输入,而且智能化程度越来越高,生活常用语和公文常用语一路打下去几乎不用做修改,少按好多空格键和方向数字键选词。2、使用双拼,提升至少5-10%,好处请移步知乎,这里不赘述;3、南方人:设置模糊音提升3-5%,对于南方人来说,模糊音设置必不可少,可以把这个看作是某种程度上的AI初级阶段吧。
B:Big Data,大数据。1、使用现成词库提升5%,其他输入法在初期都得靠自己做词库,当初选搜狗,就是看中强大的细胞词库,行业词库,城市词库等等,很多人对输入法是装了就用,不会留意下载词库,影响效率。2、自定义词库,提升5%,建一个文本文件,把工作中学习中生活中积累下来的各类文件中公司名人名文件名地名啥的全粘过来,用emeditor处理一下,一行一词,导入自定义词库。3、自定义句库。这是大招,在有些情况下输入效率可提升10-20%,详细说一下:
首先,用everything查.doc,把所有想处理的word文档复制集中到一个文件夹下;
其次,在word中ALT+F11,插入模块,用下段代码将word文档中所有文本提取到D盘mrqk文件夹中相应的txt文档中:
第三,用以下python代码将所有pdf的文本提取出来,放到D盘xpdf里面,当然您得先准备下载好pdftotxt.exe,放到代码中相应目录
第四,在cmd中切到D:\mrqk,输入type *.txt > D:\a.txt,切到D:\xpdf,输入type *.txt > D:\a.txt,把所有txt文档全部集中到一个txt文档中
第五,关键步骤来了,用emeditor或者ultraeditor处理a.txt,在替换中把所有非中文字全部替换成换行,也可以根据需要进一步断句,再去除全部重复行,稍微有点正则表达基础会好一点,没看懂就照抄吧:
第六,把太短(2-3个字构成)的常见词去掉,再去除全部重复行,得到基本可用的句库:
第七,为啥说基本可用呢,搜狗对多音字的处理一直不太好,我反映过几次,搜狗太忙不理我,好在做多音字替换后也能用。
这个句库导入搜狗后可能有几百万行,我的自定义句库词库有三百来万行,远远超过系统词库(之和),常用的词句一点就来,最好在设置里面调整下开始联想音节数为3,这样输入到第三个音节就能在句库中找到备用了:
C:Cloud。大家现在用的普遍都是多终端,每个终端分别输入产生的词库最好能复用。1、注册账号,所有设置和常用词库放在云端,提高效率1-2%也好。2、设置每页候选项数为9,同步设置到云端,但搜狗总是自动改回到5,我也很无语。
本文用到的工具:
搜狗拼音+everything+VBA+python+pdftotxt,文本处理方面用的是emeditro,也可以用ultraeditor,超大文本去重时速度会快一些。
最后说明一点,搜狗7.0以前导入百万条以上的大句库词库经常报错,现在已经OK了,其他输入法基本无法导入几十万条以上的自定义词库句库,这是我使用搜狗的重要原因之一,搜狗整句输入中对自定义词库句库的支持还有进一步提升空间,がんばってください!