乘瓠散人 - 简书

乘瓠散人

IP属地：上海

Kaggle平台实用tips
之前一直在Googel Colab平台上薅羊毛(使用免费GPU)，但是很快就遇到了GPU使用达到上限的问题，如下图：因此又来到Kaggle平台...

0.3 2347 1 3
Prompt-NLP新范式
Prompt综述论文：Pre-train, Prompt, and Predict: A Systematic Survey of Prompt...

2785 0 1

Fine-tune mT5模型
我们之前介绍过，Google的大规模预训练语言模型T5(Text-to-Text Transfer Transformer)是仅仅基于英文语料训...

5433 0 0
Google Colab平台使用
Colab全称Colaboratory，是Google提供的一个Jupyter Notebook式的交互环境，在云端运行，提供免费的GPU资源，...

0.1 2987 0 1
Google T5 预训练模型
近年来，在大规模预训练语言模型上，各大公司的军备竞赛卷得十分激烈！前面我们介绍过GPT系列的三兄弟GPT-1,GPT-2,GPT3，本文我们介绍...

0.2 13823 0 3
GPT-1,GPT-2,GPT-3三兄弟
前段时间大火的工具Github Copilot想必大家都略有耳闻，我们只需要输入一些注释说明你需要的函数功能，AI就会自动帮你编写完整的函数代码...

2.3 7093 1 3
线性回归与逻辑回归的联系
线性回归 (linear regression) 给定数据集，其中，。线性回归试图学得一个线性模型来尽可能好地拟合数据。为了求解模型参数，我们...

1155 0 0

FLAT代码解读(3)-输出
论文 FLAT: Chinese NER Using Flat-Lattice Transformer[https://arxiv.org/pd...

0.1 1241 1 1
FLAT代码解读(2)-模型
论文 FLAT: Chinese NER Using Flat-Lattice Transformer[https://arxiv.org/pd...

0.1 1117 1 1