井底蛙蛙呱呱呱

发简信

井底蛙蛙呱呱呱

12
关注
1508
粉丝
371
文章
433954

字数
1760

收获喜欢
228

总资产

IP属地：吉林

井底蛙蛙呱呱呱

推荐系统遇上深度学习(一二五)-[阿里]CTR预估中的端到端用户行为检索
今天给大家带来一篇阿里在长用户行为序列建模中的探索，前面也介绍过SIM和UBR4CTR两篇论文，均是通过两阶段检索的思路，从长用户行为序列中选择与目标item相关的用户行为，...

文哥的学习日记
2013 2 5
井底蛙蛙呱呱呱

延迟转化
当我们在谈论Delayed Feedback（延迟转化）这件“小”事[https://www.modb.pro/db/462290] False Negative类解决方案 ...

116 0 1

井底蛙蛙呱呱呱

@叉_9be2 不好意思，可能是手误啥的。不过也好多年没做这个了。

circos使用笔记
circos是用来展示数据的绘图工具，其数据展示方式主要通过配置文件来决定。不同的展示方式可通过不同的配置文件来进行设置，如染色体整体展示，添加刻度，柱状图，热图，添加文本标...

井底蛙蛙呱呱呱
12264 2 23 1
井底蛙蛙呱呱呱

用户画像算法（用户标签）
基于知识图谱的推荐综述基于知识图谱的推荐系统综述[https://geek.zshipu.com/post/%E4%BA%92%E8%81%94%E7%BD%91/%E7%...

107 0 0
井底蛙蛙呱呱呱

pycharm中TensorFlow 2.x自动补全/跳转失败处理
由于TensorFlow 2.x官方安装包的一些问题，在pycharm中无法进行自动补全以及点击跳转源码。要解决这些问题，需要对源码做一些修改。分两步1、修改site-pa...

173 0 1
井底蛙蛙呱呱呱

转《TensorFlow 2.0 中的 tf.keras 和 Keras 有何区别？为什么以后一定要用 tf.keras？》
随着 TensorFlow 2.0 的发布，不少开发者产生了一些疑惑：作为 Keras 用户，TensorFlow 2.0 的发布跟我有关系吗？TensorFlow 中的 t...

38 0 0
井底蛙蛙呱呱呱

tensorflow dataset构建输入时进行padding
序列特征作为一个常见的特征类型，在输入模型时常常需要进行padding，而基于模型的不同，padding方式也有差别。 1、在数据输入模型之前进行padding 当我们输入的...

181 0 1

井底蛙蛙呱呱呱

熵表示的是不确定性（官方称为混乱度），比如你去买彩票，有两家店一家中奖的概率是4/5，另一家是1/2，则4/5这家中奖的不确定性肯定更小的。

白话梳理树模型——从决策树到lightGBM
本文仅为简单梳理树模型升级过程，尽量少牵扯到数学公式，用大白话来理解。预备知识熵，熵用来描述事件的不确定性，越随机熵值越大。如何理解不确定性呢？假设现在有一个伯努利分布...

井底蛙蛙呱呱呱
2441 3 3
井底蛙蛙呱呱呱

第七章处理函数
Flink本身提供了多层API，前面介绍的DataStream API只是其中的一环。在前面的章节介绍了诸多Flink提供的算子（如map、filter、widow等）。除...

330 0 0
井底蛙蛙呱呱呱

@咩小饬不好意思啊，不做生信好多年了，没办法回复这个问题。

VCF文件格式解析
VCF文件全称为Variant Call Format，表示基因组的变异信息，通常为GATK和Samtools软件处理所得到。VCF文件大致可以分为两个部分： 1、以##开头...

井底蛙蛙呱呱呱
17860 4 25 2
井底蛙蛙呱呱呱

第六章 Flink中的时间和窗口
时间语义上图是数据流式处理过程，涉及到两个重要的时间点：事件时间（Event Time）和处理时间（Processing Time）。事件时间（Event Time）：即...

2643 0 7
井底蛙蛙呱呱呱

第1~4章 Flink简介
Flink是一个框架和分布式流处理引擎，用于对无界和有界数据流进行有状态计算。 Flink的主要应用场景包括：电商和市场营销。如实时数据报表、广告投放、实时推荐等；物联网...

165 0 0

井底蛙蛙呱呱呱

第五章 DataStream API (基础篇)
一个Flink程序，其实就是对DataStream的各种转换。具体来说，代码基本上由以下几部分构成：获取执行环境（Execution Environment）；读取数据源...

744 0 0
井底蛙蛙呱呱呱

转《Python中的注册器模块》
简介在一个稍大一点的python项目中，我们很有可能会用到注册器（register）。这个注册器不是用户账号注册的模块，而是项目中注册模块的一个模块。举个例子，一个深度学习...

820 0 1
井底蛙蛙呱呱呱

Scala中object、class与trait的区别
转自《https://blog.csdn.net/fjse51/article/details/52152362[https://blog.csdn.net/fjse51/...

613 0 1
井底蛙蛙呱呱呱

《精益数据分析》
本文为《精益数据分析》的一些读书笔记，提取一些比较重要的点摘录下来。第一部分别再欺骗自己了第1章我们都在说谎通过Airbnb使用专业摄影的房源订单量更多得出启示：有...

1805 0 3
井底蛙蛙呱呱呱

@魏公村球童应该是的

使用pytorch处理不同长度序列
在使用RNN处理序列类型数据（以语句序列为例）时，常常会面临数据长度不同的情况。如果每次仅输入处理一个样本，由于RNN的参数共享机制，不同长度的序列并不会出现什么问题。但是如...

井底蛙蛙呱呱呱
12529 3 4

井底蛙蛙呱呱呱

git分支冲突时如何解决
此处仅介绍在开发完成git提交代码时，发现合并分支（一般为master）中已有变动，此时本地开发分支（也即待合并分支）与合并分支有冲突，需要解决。这里仅介绍idea中如何进...

2486 0 1
井底蛙蛙呱呱呱

Linux之crontab定时任务
****前言****无论是做开发还是做运维的程序猿，crontab命令是必须用到的命令，特别是对于运维的人，自动化运维中，crontab也属于其一。然而就来记录常用的cron...

AlicFeng
79775 2 30
井底蛙蛙呱呱呱

Hadoop、Hbase、Hive三者关系
Hadoop本质上是：分布式文件系统(HDFS) + 分布式计算框架(Mapreduce) + 调度系统Yarn搭建起来的分布式大数据处理框架。 Hive：是一个基于Hado...

3457 0 1