240 发简信
IP属地:海南
  • Flink SQL Query 语法(四)- Rattern Recognition

    主要引用官方文档 https://ci.apache.org/projects/flink/flink-docs-release-1.13/docs/dev/table/sq...

  • 当_op_type是update的时候,action中必须包含'doc'关键词,用于表示更新的内容。而_op_type是index的时候,action中则必须包含'_source'关键词,表示插入的内容。而_op_type提供了默认值index,所以最后成功的那个操作已经变为了插入,而不是更新。

  • 120
    一场pandas与SQL的巅峰大战(一)

    作为一名数据分析师,平常用的最多的工具是SQL(包括MySQL和Hive SQL等)。对于存储在数据库中的数据,自然用SQL提取会比较方便,但有时我们会处理一些文本数据(tx...

  • 120
    一场pandas与SQL的巅峰大战(二)

    上一篇文章一场pandas与SQL的巅峰大战中,我们对比了pandas与SQL常见的一些操作,我们的例子虽然是以MySQL为基础的,但换作其他的数据库软件,也一样适用。工作中...

  • 120
    应用:推荐系统-威尔逊区间法

    我推荐一种之前在惠普做过一种排序方法:威尔逊区间法 我们先做如下设定: (1)每个用户的打分都是独立事件。 (2)用户只有两个选择,要么投喜欢'1',要么投不喜欢'0'。 (...

  • python开发:特征工程代码模版(一)

    作为一个算法工程师,我们接的业务需求不会比数据分析挖掘工程师少,作为一个爱偷懒的人,总机械重复的完成一样的预处理工作,我是不能忍的,所以在最近几天,我正在完善一些常规的、通用...