在MySQL 5.7.6之前,全文索引只支持英文全文索引,不支持中文全文索引,需要利用分词器把中文段落预处理拆分成单词,然后存入数据库。从MySQL 5.7.6开始,MySQ...
在MySQL 5.7.6之前,全文索引只支持英文全文索引,不支持中文全文索引,需要利用分词器把中文段落预处理拆分成单词,然后存入数据库。从MySQL 5.7.6开始,MySQ...
前言 es是什么?es是基于Apache Lucene的开源分布式(全文)搜索引擎,,提供简单的RESTful API来隐藏Lucene的复杂性。es除了全文搜索引擎之外,还...
函数说明 语法:unnest(anyarray)返回值:setof anyelement(可以理解为一个(临时)表)说明:unnest函数将输入的数组转换成一个表,这个表的每...
百度的广告和无效信息超多,每次使用百度都要从一堆垃圾中挑出自己想要的结果。大部分时候也搜索不出自己想要的结果。 无意中发现了“多吉搜索”,使用起来非常的舒适,界面简洁,搜中文...
数据指标体系是建立用户画像的基础,也是在进入开发前的关键环节,是需要结合业务场景制定的数据指标。建立用户画像一般从2个维度: ①用户维度(userid):基于当前用户账号相关...
Pandas.DataFrame操作表连接有三种方式:merge, join, concat。下面就来说一说这三种方式的特性和用法。 先看两张表: merge。相当于SQL中...
回归,最初是遗传学中的一个名词,是由生物学家兼统计学家高尔顿首先提出来的。他在研究人类的身高时,发现高个子回归于人口的平均身高,而矮个子则从另一个方向回归于人口的平均身高。 ...
转眼一年就要过去了,最近在工作和生活中都有一些感悟,记录一下。 关于读书 其实这一年我读的书并不多,技术书籍还好,文学类的几乎就没有读过。上学的时候读了很多文学类书籍,可是最...
通过阅读比较多的 Hive 调优材料,并根据自己的实践,总结 Hive 调优如下,让 Hive 调优想法不再凌乱、碎片化,而是形成结构。 部分参考链接说明 本文参考的部分链接...