他不懂_b591 - 简书

发简信

1
关注
0
粉丝
0
文章
0

字数
0

收获喜欢

IP属地：北京

他不懂_b591

LLM知识蒸馏简述
时间：2024.7.12 知识蒸馏是LLM模型压缩的一种方式，其余还有pruning，quantization，低秩因式分解等方法。知识蒸馏具体还有几个分类，根据EA（em...

ako8
225 0 1
他不懂_b591

pipeline parallelism
GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism 看的是gpipe那...

ako8
66 0 1

他不懂_b591

block parallelism带边缘设备部署
Communication-Efficient Model Parallelism for Distributed In-Situ Transformer Inference...

ako8
54 0 1
他不懂_b591

异构张量并行
Accelerating Heterogeneous Tensor Parallelism via Flexible Workload Control 为了尽可能的让计算时...

ako8
33 0 1
他不懂_b591

ako8
写了 39147 字，被 3 人关注，获得了 4 个喜欢
他不懂_b591

暂无个人介绍