0d1d21783a83 - 简书

发简信

2
关注
0
粉丝
0
文章
0

字数
0

收获喜欢

IP属地：安徽

0d1d21783a83

深度学习框架Keras中的embedding简单理解
深度学习keras框架中的Embedding是一种用在在深度学习模型中把原始文本中的单词与向量相关联常用方法，在介绍Embedding之前，先了解以下几个概念：数值张量深...

ClementCJ
10855 1 4
0d1d21783a83

tensorflow从入门到搭建学习模型
0、安装tensorflow 安装方法并不困难，只需要按照tensorflow官网https://www.tensorflow.org/install/（中文显示）的指导完成...

XDgbh
1490 0 2

0d1d21783a83

推荐系统入门实践（3）召回之youtube-dnn
DNN召回这里指的是youtube的Deep Neural Network for YouTube Recommendation论文里提到的模型，论文里同时提出了召回和排序...

夏安的算法学前班
5579 9 4
0d1d21783a83

推荐系统遇上深度学习(四十六)-阿里电商推荐中亿级商品的embedding策略
本文分享的论文题目是《Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba》 ...

文哥的学习日记
13193 2 38
0d1d21783a83

推荐系统评测方法和评测指标
一般推荐系统的参与方有3个：用户、物品提供商、推荐系统提供网站，评测一个推荐系统时，需要考虑3方的利益，一个好的推荐系统是能够令三方共赢的系统。 1. 评测实验方法获得评测...

歌当对酒
12428 1 14
0d1d21783a83

批处理和流处理
大数据是收集、整理、处理大容量数据集，并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限，但这种计算类型的普遍性、规模，...

大诗兄_zl
32359 0 30 1
0d1d21783a83

事实表分类及使用场景
事实表分类一、周期快照事实表周期快照事实表中的每行汇总了发生在某一标准周期的多个度量事件，即使周期内没有活动发生，也需要插入一行0或者null的行，所以每个周期数...

一个神经质的工程师
1845 0 1

0d1d21783a83

ElasticSearch中"distinct","count"和"group by"的实现
最近在业务中需要使用ES来进行数据查询，在某些场景下需要对数据进行去重，以及去重后的统计。为了方便大家理解，特意从SQL角度，方便大家能够理解ES查询语句。 1 - dist...

彬彬酱
89923 6 41
0d1d21783a83

Spark源码分析之SparkSubmit的流程
准备本文主要对SparkSubmit的任务提交流程源码进行分析。Spark源码版本为2.3.1。首先阅读一下启动脚本，看看首先加载的是哪个类，我们看一下spark-sub...

叫我不矜持
2034 1 4
0d1d21783a83

SparkContext源码剖析(version 2.3.1)
SparkContext 是通往 Spark 集群的唯一入口，可以用来在 Spark 集群中创建 RDDs 、累加器（ Accumulators ）和广播变量（ Broad...

白面葫芦娃92
360 0 1
0d1d21783a83

理解ReentrantLock的公平锁和非公平锁
学习AQS的时候，了解到AQS依赖于内部的FIFO同步队列来完成同步状态的管理，当前线程获取同步状态失败时，同步器会将当前线程以及等待状态等信息构造成一个Node对象并将其加...

大数据Zone
8375 1 24
0d1d21783a83

IO模型
在UNIX的世界中一切皆文件，文件本质上是一串二进制流。在数据交换过程中，需要对流进行数据的收发操作也就是I/O输入输出操作（Input/Output）。由于程序和运行时数...

JunChow520
3001 0 12

0d1d21783a83

es中的term和match的区别
term 和 match 总结在实际的项目查询中，term和match 是最常用的两个查询，而经常搞不清两者有什么区别，趁机总结有空总结下。 term用法先看看term的...

f22448cd5541
61710 6 43
0d1d21783a83

Flink检查点（checkpoint）、保存点（savepoint）的区别与联系
今天听同事做关于Docker的技术分享，结束时已经有点晚了，没法仔细选题，所以就写一个所有人都知道的小知识点吧。 checkpoint（检查点）和savepoint（保存点）...

LittleMagic
2545 1 11
0d1d21783a83

被爱的天青色
写了 18659 字，被 142 人关注，获得了 207 个喜欢
0d1d21783a83

第九章事实表设计总结及补充
三种事实表比较 1）事务事实表：记录事务层面事实，跟踪业务过程行为 2）周期快照表：记录指定周期内一些聚集事务值或者度量状态 3）累计快照表：通常由多个时间字段，用于研究业务...

被爱的天青色
869 0 2
0d1d21783a83

第九章事实表设计之事实表基础
事实表特性 1）事实表描述了业务过程，包含引用的维度和业务的度量，与维度表相比数据量大得多，增长速度快得多 2）描述业务过程的细节程度称为粒度 3）可分为可加性，半可加性、不...

被爱的天青色
2302 0 8

0d1d21783a83

Hive高级查询操作
Hive高级操作 1.使用LIKE、AS创建表,表重命名，添加、修改、删除列表结构数据复制根据已存在的表结构，使用like关键字，复制一个表结构一模一样的新表根据已经存在...

溯水心生
5890 0 7
0d1d21783a83

MapReduce工作流程最详细解释
欢迎关注公众号“Tim在路上”MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型，MapReduce的计算过程被封装的很好，我们只用使用Map和Reduc...

Tim在路上
95717 0 54
0d1d21783a83

Redis基础、高级特性与性能调优
本文将从Redis的基本特性入手，通过讲述Redis的数据结构和主要命令对Redis的基本能力进行直观介绍。之后概览Redis提供的高级能力，并在部署、维护、性能调优等多个方...

kelgon
61203 23 625 2

暂无个人介绍