240 发简信
IP属地:上海
  • Resize,w 360,h 240
    Kaggle平台实用tips

    之前一直在Googel Colab平台上薅羊毛(使用免费GPU),但是很快就遇到了GPU使用达到上限的问题,如下图: 因此又来到Kaggle平台...

  • Resize,w 360,h 240
    Prompt-NLP新范式

    Prompt综述论文:Pre-train, Prompt, and Predict: A Systematic Survey of Prompt...

  • Resize,w 360,h 240
    Fine-tune mT5模型

    我们之前介绍过,Google的大规模预训练语言模型T5(Text-to-Text Transfer Transformer)是仅仅基于英文语料训...

  • Resize,w 360,h 240
    Google Colab平台使用

    Colab全称Colaboratory,是Google提供的一个Jupyter Notebook式的交互环境,在云端运行,提供免费的GPU资源,...

  • Resize,w 360,h 240
    Google T5 预训练模型

    近年来,在大规模预训练语言模型上,各大公司的军备竞赛卷得十分激烈!前面我们介绍过GPT系列的三兄弟GPT-1,GPT-2,GPT3,本文我们介绍...

  • Resize,w 360,h 240
    GPT-1,GPT-2,GPT-3三兄弟

    前段时间大火的工具Github Copilot想必大家都略有耳闻,我们只需要输入一些注释说明你需要的函数功能,AI就会自动帮你编写完整的函数代码...

  • Resize,w 360,h 240
    线性回归与逻辑回归的联系

    线性回归 (linear regression) 给定数据集,其中,。线性回归试图学得一个线性模型来尽可能好地拟合数据。 为了求解模型参数,我们...

  • FLAT代码解读(3)-输出

    论文 FLAT: Chinese NER Using Flat-Lattice Transformer[https://arxiv.org/pd...

  • FLAT代码解读(2)-模型

    论文 FLAT: Chinese NER Using Flat-Lattice Transformer[https://arxiv.org/pd...

个人介绍
诗酒趁年华,江海寄余生。