如果一次性要查出来比如10万条数据,那么性能会很差,此时一般会采取用scroll滚动查询,一批一批的查,直到所有数据都查询完为止。
1.scroll搜索会在第一次搜索的时候,保存一个当时的视图快照,之后只会基于该旧的视图快照提供数据搜索,如果这个期间数据变更,是不会让用户看到的
2.采用基于_doc(不适用_score)进行排序的方式,性能较高
3.每次发送scroll请求,我们还需要指定一个scroll参数,指定一个时间窗口,每次搜索请求只要在这个时间窗口内能完成就可以了
GET /lib3/user/_search?scroll=1m
{
"query": {
"match_all": {}
},
"sort": ["_doc"],
"size": 3
}
GET /_search/scroll
{
"scroll":"1m",
"scroll_id":"DnF1ZXJ5VGhlbkZldGNoAwAAAAAAAAZeFmpCdE8teXZzU2hlZWlaWGJCeHFtbFEAAAAAAAAGYBZqQnRPLXl2c1NoZWVpWlhiQnhxbWxRAAAAAAAABl8WakJ0Ty15dnNTaGVlaVpYYkJ4cW1sUQ=="
}