
1、In-Context Learning In-Context Learning(简称ICL),又称上下文学习或语境学习,是一种在特定上下文环...
1、Diffusion 扩散模型 Diffusion 扩散模型是在 2015 年时的 《Deep Unsupervised Learning u...
1、隐变量与隐空间 隐变量(Latent Variable)是指在数据中无法直接观察到的、隐藏的变量。它通常用来表示数据背后的潜在结构或特征。换...
1、引言 GAN (Generative Adversarial Network,生成对抗网络)是神经网络的一种,是由被誉为“生成对抗网络之父”...
1、OpenAI与GPT 2022年11月30日,一家名不见经传的公司——OpenAI悄悄上线了一个产品ChatGPT。彼时,谁也没有想到这款产...
1、自注意力机制 1.1 公式表达 自注意力机制的核心是通过计算不同词之间的相关性,赋予不同权重(注意力分数),最终将这些加权后的信息重新组合成...
1、引言 当下火爆异常的 GPT 全称是 Generative Pre-trained Transformer。其中“Generative”是"...
语言模型:从N-Gram到Transformer 语言模型(Language Model,简称 LM)是一个用于建模自然语言的概率模型。简单来说...
1、自然语言处理 自然语言处理(Natural Language Processing,简称NLP)是人工智能和语言学领域的一个分支,它关注的是...