152层的 Resnet的图片输入尺寸为224*224,那对于大多数情况,图片的分辨率都是大于这个数值,那么该如何把图片的尺寸裁剪到这样一个尺寸,又如何进行数据增强呢? 第一...
152层的 Resnet的图片输入尺寸为224*224,那对于大多数情况,图片的分辨率都是大于这个数值,那么该如何把图片的尺寸裁剪到这样一个尺寸,又如何进行数据增强呢? 第一...
更新啊,都一年多了还没更新,呵呵呵
深度学习在用户画像方面的应用系列本系列文章适用读者:对神经网络有些认识,想了解实际工作中神经网络是如何落地到用户画像或推荐系统场景中的。 实际上,用户画像的方法有很多,我把他们暂且分为两种,一种是传统机器学...
最简单的注册UDF ---- 直接将lambda表达式注册成UDF下面是一个简单的清洗函数 结果 很多时候逻辑比较复杂,匿名函数不能完成工作,可以自己def一个函数,将def...
takeSample()里面的第一个参数的意思表示为是否有放回抽样把
Pyspark实战指南开始时间: 2019-11-26 预计时间7天。作者:托马兹[美] 本书常用下载地址:1.RDD章节文件下载:http://tomdrabas.com/data/VS14M...
TFRecord生成 一、为什么使用TFRecord? 正常情况下我们训练文件夹经常会生成 train, test 或者val文件夹,这些文件夹内部往往会存着成千上万的图片或...
pycharm虚拟环境 Python的代码运行需要一个运行环境,所要使用的第三方包也在这里进行管理。在创建Python项目的时候,pycharm可以选择所需要使用的虚拟环境,...
Google开源的BERT的确很良心,代码写得非常好,是一个不错的学习案例,这里我从实战的角度从预训练到下游任务实战做一个全面的梳理。原理部分的讲解请参考我上篇博客。 这里简...
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。 将一个句子或者一个段落输入到 NLTK 相应的模块,该模块可以将这个句子或段落中的每个单词标注上其...
写的很好,有用
Windows下搭建Python虚拟环境搭建 Python 虚拟环境,可以方便地Python2,Python3 共存。避免包的混乱和版本的冲突。为每个程序单独创建虚拟环境可以保证程序中能访问虚拟环境中的包,保持解释...
搭建 Python 虚拟环境,可以方便地Python2,Python3 共存。避免包的混乱和版本的冲突。为每个程序单独创建虚拟环境可以保证程序中能访问虚拟环境中的包,保持解释...
序 前两个月在做项目突然发现Canopy算法发现网上直接用python实现的不多,因为Mahout已经包含了这个算法,需要使用的时候仅需要执行Mahout几条命令即可,并且多...
前段时间Google推出了重磅的模型BERT(Bidirectional Encoder Representations from Transformers),刷新的多项记录...
8G显存的P4卡十分钟左右吧,可能不要十分钟,挺快的
Bert系列(一)——demo运行谷歌推出的Bert,最近有多火,估计做自然语言处理的都知道。据称在SQuAD等11项任务当中达到了state of the art。bert的原理可参考论文,或者网上其他人翻...
本篇文章主要是解读模型主体代码modeling.py。在阅读这篇文章之前希望读者们对bert的相关理论有一定的了解,尤其是transformer的结构原理,网上的资料很多,本...
标准差(或方差),分为总体标准差(方差)和样本标准差(方差)。 前者分母为n,后者为n-1。后者是无偏的。 pandas里的df.std()和df.var()都是算的无偏的。...
Word2vec简介 Word2Vec是由Google的Mikolov等人提出的一个词向量计算模型。 输入:大量已分词的文本 输出:用一个稠密向量来表示每个词 词向量的重要意...
TensorFlow中的tf.gfile模块提供了文件操作的API,包括文件的读取、写入、删除、复制等等。文档中对于该模块的介绍为:Imports for Python AP...
这篇文章主要介绍tensorflow对数据的处理知识:特征列feature columns。 特征列FeatureColumns 特征列是指一组数据的相关特征,包含了数据的相...