240 发简信
IP属地:北京
  • top 中指标详解

    摘录一篇备忘。 It can be seen from man top in terminal as For CPUs:

  • 如何向ElastAlert添加告警方式

    截止v0.1.31版本,Elastalert本身提供了多达20中告警方式。 然而由于业务需要,国内用户往往需要定制更多告警方式,如微信(聊天、群聊天、订阅号),短信,钉钉等新...

  • 120
    logging.handler 调整 elastalert 日志格式,并按天滚动

    背景: 我的项目都使用filebeat来采集日志 大部分项目都是Java项目,直接使用slf4j来打印日志,每行日志的开头都是时间戳 因此在filebeat中直接配置一个匹配...

  • 离线安装python包

    当本地开发环境可以联网而服务器不能联外网。我们可以把本地的包打包好放到服务器上一次性安装。 首先本地应该安装好pip,setuptools,etc不赘述了。 然后服务器上安装...

  • vue如何在script中使用图片

    我们知道,在<template>中引入图片只需要指明相对路径,打包后就可以正常使用了。 但是在data中引用图片是,在dev模式下只能写绝对路径才能找到图片,写相对路径是无效...

  • elastalert的简单运用

    elastalert是yelp使用python开发的elasticsearch告警工具。github: https://github.com/Yelp/elastalert ...

  • elastalert的聚集通知

    最近需要配置一套elastalert来监控日志,以下情况: 日志用Logstash每天一个生成一个index存入es。 日志中存储运行期的各种信息,包括物理位置,名称,运行信...

  • elasticsearch.yml详解,基于ES V5.5.1

    elasticsearch.yml是yaml格式的elasticsearch配置文件,列出来了针对生产环境下的一些重要配置。其默认路径为:$ES_HOME/config/。 ...

  • 数学之美在google中文黑板报的原文

    数学之美 系列一 -- 统计语言模型 数学之美 系列二 -- 谈谈中文分词 数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用 数学之美 系列四 -- 怎样度量信息?...

  • 再补充一句,TF/IDF概念被公认是信息检索中最重要的发明,在搜索、文件分类和其他领域有广泛的应用,1972年由剑桥大学的巴斯克-琼斯(Karen Sparck Jones)提出。但是,为什么IDF是一个对数函数,而不是平方根什么的?信息论的学者已经发现并指出,其实IDF的概念就是一个特定条件下、关键词的概率分布的交叉熵(Kullback-Leibler Divergence)。

    [转]全文检索

    原文链接# Lucene学习总结之一:全文检索的基本原理,这是我遇见最好的入门,近10年前的文章如今读来依然让人耳目一新。这里做一些摘要并收藏 Lucene是一个高效的,基于...

  • 以上例子的数字来自google黑板报,我自己用计算器计算时发现有一些误差,但是误差在接受范围内,未作更改

    [转]全文检索

    原文链接# Lucene学习总结之一:全文检索的基本原理,这是我遇见最好的入门,近10年前的文章如今读来依然让人耳目一新。这里做一些摘要并收藏 Lucene是一个高效的,基于...

  • Document Frequency(df)又被叫做“逆文本频率指数(Inverse document frequency, IDF)”。用另一种方法描述其公式更易理解:idf = log(D/Dw),其中D为总文档数,Dw为含有关键词的文档数。如我们在10亿篇文档中查询包含“原子能 的 应用”的文档。其中停词“的”在10亿篇文档中都存在,则idf = log(10亿/10亿) = log(1) =0。假定专用词“原子能”在200万个文档中出现,则idf = log(10亿/200万) = log(500) = 6.2。又假定通用词“应用”在5亿篇文档中出现,则其idf = log(2) = 0.7。也就是说,找到一个“原子能”的匹配相当于找到9个“应用”的匹配。那么文档中我们搜索的句子“原子能的应用”的相关性为:tf1*idf1+ tf2*idf2 + tf3*idf3 = 0.0161,其中“原子能”贡献了0.0126,而“应用”只贡献了0.0035。

    [转]全文检索

    原文链接# Lucene学习总结之一:全文检索的基本原理,这是我遇见最好的入门,近10年前的文章如今读来依然让人耳目一新。这里做一些摘要并收藏 Lucene是一个高效的,基于...

  • 在互联网发展史上留下脚印的先辈

    看帖子的过程中看到很多对计算机与互联网发展起到重要作用的先辈,然而在国内几乎不曾听过他们的名字。这里会记录一些看到的留下脚印的先辈。 Roy Fielding Fieldin...

  • 坟贴收藏

    最近上网看一些es和lucene相关的内容,基本上涉及到的方方面面都会点开了解一下。过程中发现很多优秀的远古贴,这些作者可能思路清晰,可能逻辑严谨,可能语言风趣,可能风格清新...

  • Elastic常用帖子记录

    Powershell原生支持的cURL - Invoke-WebRequesthttps://blog.csdn.net/quicknet/article/details/2...

  • Apache Lucene - Index File Formats V7.3.0

    Apache Lucene - Index File Formats(索引文件格式) Introduction(引言) This document defines the i...

  • Lucene的索引文件格式(基于V7_3_0)

    拜读刘超觉先的Lucene学习笔记Lucene学习总结之三:Lucene的索引文件格式(1)、Lucene的索引文件格式(2)、Lucene的索引文件格式(3),受益良多,但...

  • 120
    [转]Lucene索引过程分析

    原文链接# Lucene学习总结之四:Lucene索引过程分析(1)、# Lucene索引过程分析(2)、#Lucene索引过程分析(3)、# Lucene索引过程分析(4...

个人介绍
此刻的不如意,来源于之前的每个决定