ako8 - 简书

ako8

IP属地：北京

通信计算重叠
看了几篇文章，简单总结一下。 DeepSpeed- Inference: Enabling Efficient Inference of Tra...

25 1 0
deepseek
关于deepseek的一些调研最近关于deepseek非常的火，最主要的关注点集中在1.发布的R1版本性能对标gpt o1，v3版本对标4o2...

35 0 0

边缘+流水线并行
A Model-Distributed Inference Approach for Large Language Models at the ...

14 0 0
2024-12-06
Cambricon-LLM: A Chiplet-Based Hybrid Architecture for On-Device Inferen...

15 0 0
2024-12-18
现在对于边缘设备上大模型的部署，我的想法是有两个方向，一个是把大的模型去拆开，一个是把小的模型集成。而且我认为应该是向多设备场景去考虑。现在已经...

34 0 0
边缘部署综述
On-Device Language Models: A Comprehensive Review 和MEI还有点不同，MEI是涉及网络通信的，...

38 0 0
模型集群
LLM-BL E N D E R: Ensembling Large Language Models with Pairwise Rankin...

32 0 0

miniGPT4
代码：https://minigpt-4.github.io/[https://minigpt-4.github.io/].和GPT4是没关系的...

76 0 0
异构张量并行
Accelerating Heterogeneous Tensor Parallelism via Flexible Workload Con...

33 0 1