PyTorch - 文集

PyTorch

45篇文章 · 19969字 · 1人关注

[PyTorch]可以将处理好的数据使用torch.save存储成二进制文件方便下一次加载
可以将一些需要处理的文本文件处理一次后就使用torch.save（或者pickle）存储成二进制文件方便下一次加载

5018 0 0
[PyTorch]中的随机mask以及根据句子的长度进行mask
new_empty是获取一个同样device和同样dtype的tensor，bernoulli_(p)是根据概率p产生0,1序列(p是0)，ex...

3420 0 0

[PyTorch] register_hook
每一个tensor都有register_hook方法，每次当关于这个参数的gradient被计算出来以后都会调用这个方法，因此可以用于debug...

0.1 2831 0 1
[Pytorch] 如何参数共享以及对参数进行相应的初始化
就是与embed_tokens.weight用同样的参数对参数进行相应的初始化初始化的时候还可以让padding的部分为0

2209 0 0
[PyTorch] Move to cuda移动到GPU上执行
对于每一个样例，都移动到cuda上

1363 0 0
[PyTorch]多卡运行(transformer-xl)
原理多GPU运行的接口是torch.nn.DataParallel(module, device_ids)其中module 参数是所要执行的模...

3795 0 0
[PyTorch]Transformer-xl中的学习率schedule
定义调度器 step-wise学习率退火，可以看到在warmup阶段学习率是慢慢的上升的，而过了warmup阶段使用相应的学习率schedule...

3123 0 0

[PyTorch]Transformer-xl 构建模型
在train.py函数里面直接写自己编写init_weight函数，tf中直接就有编写更新dropout的函数update_dropout，...

1799 0 0
[PyTorch]加载data以及vocabulary_来自transformer-xl，
corpus = get_lm_corpus(args.data, args.dataset)，可以通过这里设置各个数据集特殊的参数，比如词表，...

735 1 0