DejavuMoments - 简书

DejavuMoments

IP属地：西藏

ChatGPT
Google 研究者发表了题为“大型语言模型的涌现能力”（Emergent Abilities of Large Language Models...

301 0 0
深度学习-知识蒸馏
出于计算资源的限制或效率的要求，深度学习模型在部署推断时往往需要进行压缩，模型蒸馏是其中一种常见方法。将原始数据集上训练的重量级（cumbers...

179 0 0

深度学习: BatchNorm 和 LayerNorm 的区别与联系
在深度学习中，Normalization 是十分常规的操作。在神经网络训练开始前，都要对输入数据进行归一化处理，那为什么需要归一化呢？归一化后有...

3082 0 0
神经网络与深度学习
1 前馈神经网络在神经网络中，输入层与输出层之间的层称为隐含层或隐层（hidden layer），隐层和输出层的神经元都是具有激活函数的功能神...

1043 0 0
文本表示: 从 One-Hot 到 Word2Vec
在自然语言处理（NLP）领域，如何对文本这种非结构化的数据进行表示是 NLP 的一个重要研究方向。 One-Hot One-Hot Encodi...

3676 0 0
决策树的剪枝与分类回归树
1.决策树的过拟合问题决策树生成算法递归地产生决策树，直到不能继续下去为止。通过这样的方式产生的决策树容易产生过拟合问题。过拟合的原因在于学习...

822 0 0
LeetCode 双指针类题解
881. Boats to Save People Note:1 <= people.length <= 500001 <= people[i]...

93 0 0

Decision Tree 决策树
阅读《李航统计学习方法》中p55-p58页总结决策树模型结构理解决策树递归思想阅读《李航统计学习》中p58-p63页学习信息增益学习信息增益率...

132 0 0
Machine Learning：信息论基础
信息论是应用数学的一个分支，主要研究的是对一个信号包含信息的多少进行量化。它最初被发明是用来研究在一个含有噪声的信道上用离散的字母表来发送消息，...

534 0 2