
RAG各个环节均有极大的优化空间。 13.1 知识文档准备阶段 13.1.1 数据清洗 高性能RAG系统依赖于准确且清洁的原始知识数据。一方面为...
12.1 针对检索环节的评估 MRR 平均倒数排名:查询(或推荐请求)的排名倒数MRR是一种常用的评估信息检索系统表现的指标,尤其用于衡量搜索引...
11.1 什么是RAG,它有什么特点 11.1.1初识RAG RAG(Retrieval Augmented Generation):为生成式模...
10.1 基于数据逇工作-构建高质量数据集 为了减少大模型生成内容时的幻觉问题,首先需要关注数据的质量。数据质量直接影响模型的生效效果,因此在训...
关于大模型评估,可以分为基于参开的评估和无参考的评估。 9.1 Reference-based(基于参考的评估) Reference-based...
8.1 大模型幻觉问题定义 当模型生成的文本不遵循原文(一致性,Faithfulness)或者不符合事实(事实性,Factualness),我们...
7.1 什么是Scaling law 7.1.1 Scaling low的目标 在训练之前了解模型能力,以改善关于大模型的对齐,安全和部署的决定...
什么是涌现能力当一个复杂系统由很多个微小个体构成,这些微小个体凑到一起,相互作用,当数量足够多时,在宏观层面上展现出微观个体无法解释的特殊现象,...
在进行模型的大规模预训练时,往往需要设计合适的自监督预训练任务,使得模型能够从海量无标注数据中学习到广泛的语义知识和世界只是。 目前,常用的预训...