240 发简信
IP属地:浙江
  • Resize,w 360,h 240
    QwenVL

    Github: GitHub - QwenLM/Qwen-VL: The official repo of Qwen-VL (通义千问-VL) ...

  • Resize,w 360,h 240
    InternVL 系列调研

    MLLM模型基本范式: 1.主要调研InternVL 2.0-40B InternVL2-40B: 总计 40.07B; Vit: 5.54B...

  • Resize,w 360,h 240
    笔记

    1. BPE分词 a). BytePairEncoding(BPE):字节对编码,核心思想是将最常出现的子词对合并,直到词汇表达到预定的大小时停...

  • 大模型相关计划资料汇总

    简单计划: megatron deepspeed 代码阅读笔记(20230925更新中) - 知乎 (zhihu.com)[https://zh...

  • Resize,w 360,h 240
    Ch03-02. 使用Tensorboardx可视化

    tensorboard安装pip install tensorboard然后安装tensorboradx~~ pip install tenso...

  • Ch03-01.使用Visdom进行可视化(Pytorch入门)

    Visdom的安装很简单,直接使用命令pip install visdom安装即可。 在安装完成后,使用命令python -m visdom.s...

  • Resize,w 360,h 240
    FLAT: 屠榜NER

    Paper Name: FLAT: Chinese NER Using Flat-Lattice Transformer论文链接https://...

  • Resize,w 360,h 240
    文档智能理解相关

    文档智能理解:通用文档预训练模型与数据集[https://www.sohu.com/a/434296274_787107]附录 [1 ]Layo...