IP属地:浙江
Github: GitHub - QwenLM/Qwen-VL: The official repo of Qwen-VL (通义千问-VL) ...
MLLM模型基本范式: 1.主要调研InternVL 2.0-40B InternVL2-40B: 总计 40.07B; Vit: 5.54B...
1. BPE分词 a). BytePairEncoding(BPE):字节对编码,核心思想是将最常出现的子词对合并,直到词汇表达到预定的大小时停...
简单计划: megatron deepspeed 代码阅读笔记(20230925更新中) - 知乎 (zhihu.com)[https://zh...
tensorboard安装pip install tensorboard然后安装tensorboradx~~ pip install tenso...
Visdom的安装很简单,直接使用命令pip install visdom安装即可。 在安装完成后,使用命令python -m visdom.s...
Paper Name: FLAT: Chinese NER Using Flat-Lattice Transformer论文链接https://...
文档智能理解:通用文档预训练模型与数据集[https://www.sohu.com/a/434296274_787107]附录 [1 ]Layo...