codeMover - 简书

发简信

codeMover

0
关注
17
粉丝
72
文章
55570

字数
64

收获喜欢
48

总资产

IP属地：上海

codeMover

14. 知识蒸馏
14.1 什么是知识蒸馏知识蒸馏：把大的教师模型的知识萃取出来，把他浓缩到一个小的学生模型，可以理解为一个大的教师神经网络把他的知识交给小的学生网络。 14.2 为什么进行...

40 0 0
codeMover

13. 在使用RAG时的优化策略
RAG各个环节均有极大的优化空间。 13.1 知识文档准备阶段 13.1.1 数据清洗高性能RAG系统依赖于准确且清洁的原始知识数据。一方面为了保证数据的准确性，另一方面需...

52 0 0

codeMover

12. 如何评价RAG项目效果的好坏
12.1 针对检索环节的评估 MRR 平均倒数排名：查询（或推荐请求）的排名倒数MRR是一种常用的评估信息检索系统表现的指标，尤其用于衡量搜索引擎、推荐系统等根据查询返回的多...

30 0 0
codeMover

11. 什么是RAG？
11.1 什么是RAG，它有什么特点 11.1.1初识RAG RAG（Retrieval Augmented Generation）：为生成式模型提供了与外部世界互动提供了一...

68 0 0
codeMover

10. 如何缓解大模型幻觉问题？
10.1 基于数据逇工作-构建高质量数据集为了减少大模型生成内容时的幻觉问题，首先需要关注数据的质量。数据质量直接影响模型的生效效果，因此在训练和评估数据上进行改进，能够有...

89 0 1
codeMover

9. 如何评估大模型幻觉问题？
关于大模型评估，可以分为基于参开的评估和无参考的评估。 9.1 Reference-based（基于参考的评估） Reference-based方法是指在评估生成内容的准确性...

47 0 0
codeMover

8. 什么是大模型幻觉问题
8.1 大模型幻觉问题定义当模型生成的文本不遵循原文(一致性，Faithfulness)或者不符合事实(事实性，Factualness)，我们就可以认为模型出现了幻觉问题。...

75 0 1

codeMover

7. 什么是Scaling law？
7.1 什么是Scaling law 7.1.1 Scaling low的目标在训练之前了解模型能力，以改善关于大模型的对齐，安全和部署的决定。虚线表示对较小模型(不包括...

57 0 1
codeMover

6. LLMs中，涌现能力是啥原因？
什么是涌现能力当一个复杂系统由很多个微小个体构成，这些微小个体凑到一起，相互作用，当数量足够多时，在宏观层面上展现出微观个体无法解释的特殊现象，就可以称之为涌现能力。例如雪花...

45 0 1
codeMover

5. LLMs中常用的预训练任务包含哪些？
在进行模型的大规模预训练时，往往需要设计合适的自监督预训练任务，使得模型能够从海量无标注数据中学习到广泛的语义知识和世界只是。目前，常用的预训练任务主要分为三类，包括语言建...

35 0 1
codeMover

4. 目前主流的LLMs开源模型体系有那些？
在预训练语言模型时代，自然语言处理领域广泛采用了预训练 + 微调的范式，并诞生了以BERT为代表的编码器(Encoder-only)架构、以GPT为代表的解码器(Decode...

62 0 1
codeMover

3. 常见的大模型(LLMs)分类
3.1 根据输入内容分类语言大模型（NLP）：指在自然语言处理(Natural Language Processing, NLP)领域中的一类大模型，通常用于处理文本数据和...

74 0 0

codeMover

2. 大语言模型(LLMs)具有什么优点？什么缺点
2.1 优点语言理解和生成能力强：大语言模型可以基于大量文本数据进行训练，从而对自然语言的理解和成成有出色的表现。跨领域知识广泛：大语言模型在医学、法律、工程等多个领域提...

67 0 1
codeMover

1. 大语言模型
大模型：一般指1亿以上参数的模型，大语言模型（Large Language Models，LLMs）是针对语言的大模型。大语言模型的关键特点包括：大规模参数：LLMs拥有大...

92 0 2
codeMover

3. 二叉树
1.二叉树节点结构用递归和非递归两种方式实现二叉树的先序、中序、后序遍历如果直观的打印一颗二叉树如何完成二叉树的宽度优先遍历（常见题目：求一颗二叉树的宽度）

54 0 1
codeMover

2. 链表
1. 哈希表简单介绍 1）哈希表在使用层面上可以理解为一种集合结构 2）如果只有key，没有伴随数据value，可以使用HashSet结构 3）如果既有key，又有伴随数据v...

50 0 1
codeMover

2022-09-19
3.1 从数据操作的类型划分：读锁、写锁对于数据库中并发事务的读-读情况并不会引起什么问题。对于写-写、读-写或者写-读这些情况可能会引起一些问题，需要使用...

137 0 1

codeMover

2022-09-17
2.3 读-写或写-读情况读-写或写-读，即一个事务进行读取操作，另一个进行改动操作。这种情况下可能发生脏读、不可重复读、幻读的问题。各个数据库厂商对...

84 0 2
codeMover

精讲MySQL 第十五章(一)：锁概览
事务的隔离性由锁（LOCK）来实现。 1. 概述锁是计算机协调多个进程或线程并发访问某一资源的机制。在程序开发中会存在多线程同步的问题，当多个线程并发访问某个数据的时候，尤...

129 0 2
codeMover

synchronize
## Java对象头(64位虚拟机) - 整个对象头一共有128位，Mark Word有64位，Klass Word有64位，但是Klass Word因为指针压缩的原因被压缩...

261 0 2

个人介绍

惟愿守得云开见云明