bd7e4a65be2b - 简书

发简信

6
关注
1
粉丝
29
文章
29079

字数
0

收获喜欢
1

总资产

IP属地：安徽

bd7e4a65be2b

原理
[图片上传失败...(image-b4a8ef-1740983460219)] [图片上传失败...(image-d5bf1d-1740983460219)] [图片上传失败...

43 0 0
bd7e4a65be2b

LLama1, LLama2和LLama3的区别有哪些？
LLama1, LLama2和LLama3的区别有哪些？参数规模第一代和第二代的Llama模型都包含了四个不同参数规模的版本，其中最小的模型参数规模在70亿，往上分别有13...

158 0 0

bd7e4a65be2b

手写一下正弦编码和旋转位置编码的代码？
获取更多面试真题的集合，请移步至 https://pica.zhimg.com/80/v2-7fd6e77f69aa02c34ca8c334870b3bcd_720w.web...

64 0 0
bd7e4a65be2b

大模型面试题：目前大模型中的位置编码有哪些？
我整理了很多的算法题，详情见参考链接1 在大模型中，位置编码主要分为两大派：绝对位置编码和相对位置编码。主流的几种脍炙人口的位置编码如下所示：正弦编码正弦曲线（Sinuso...

109 0 0
bd7e4a65be2b

大模型面试题：常见的微调方法有哪些说下原理并对比
更多实时面试题总结请关注我的公众号"算法狗" 或移步至 https://pica.zhimg.com/80/v2-7fd6e77f69aa02c34ca8c334870b3...

97 0 0
bd7e4a65be2b

Encoder-only结构能适合于生成式任务吗
Encoder-only结构能适合于生成式任务吗？更多实时面试题总结请关注我的公众号"算法狗" 目前基于Enodee-only的结构主要用于编码信息，而不太适合于生成式的任...

48 0 0
bd7e4a65be2b

大模型面试题：目前大模型中的位置编码有哪些？
获取更多面试真题的集合，请移步至 https://pica.zhimg.com/80/v2-7fd6e77f69aa02c34ca8c334870b3bcd_720w.we...

113 0 0

bd7e4a65be2b

大模型面试题：LLAMA中的FFN层作用是什么？
获取更多面试真题的集合，请移看参考链接3 总结上网上看到的一些分析，毕竟当时Transformer提出来的时候，可能也没考虑到会被研究的这么细。模型结构本身[ Attent...

101 0 0
bd7e4a65be2b

大模型面试题：Prefix LM和Causal LM的区别是啥？
获取更多面试真题的集合，请移步至 https://i.afbcs.cn/naPbNY[https://i.afbcs.cn/naPbNY] 说白了：就是attention m...

260 0 0
bd7e4a65be2b

大模型面试题63题(1-11)
## 1. 什么是大型语言模型（LLMs）以及它们的工作原理是什么？**大型语言模型（LLMs）**是设计用来理解、处理和生成类似人类文本的高级人工智能系统。例子包括**GP...

229 0 0
bd7e4a65be2b

2024-04-03

48 0 0
bd7e4a65be2b

面试题：批量梯度下降和随机梯度下降法的缺点
https://www.jianshu.com/p/d7d06edb7061 背景批量梯度下降法（batch gradient decent）就是我们平时所说的梯度下降，也...

337 0 0

bd7e4a65be2b

面试题：过拟合原因
更多面试题关注"算法狗"有劳动下手指啦 ------------------------------------------------- （1）建模样本选取有误，样本标签错...

267 0 0
bd7e4a65be2b

面试题：如何解决欠拟合
更多面试题关注"算法狗"有劳动下手指啦 ------------------------------------------------- 问题背景在优化的世界里，总避免不...

313 0 0
bd7e4a65be2b

面试题：LDA和PCA区别
相同点（1）两者的作用是用来降维的（2）两者都假设符合高斯分布不同点（1）LDA是有监督的降维方法，PCA是无监督的。（2）LDA降维最多降到类别数K-1的维数，P...

707 0 0
bd7e4a65be2b

线性回归和逻辑回归的区别
更多面试题---------------------- 基础概念逻辑回归与朴素贝叶斯有什么区别机器学习学习方式主要有哪些？监督学习的步骤主要有哪些? 逻辑回归与朴素贝叶...

278 0 0

暂无个人介绍